warum eigentlich cloud?
TRANSCRIPT
Warum eigentlich Cloud?Kristian Köhntopp
Cloud Architect Alter Sack
26. November 2015
Devops und Cloud Computing
gehen Hand in Hand
2
Was ist uns in den letzten 15 Jahren eigentlich passiert?
– Rajat Bhargava, http://devops.com/features/devops_and-enterprises/
„DevOps and Enterprises:It's a culture thing.“
4
Einflüsse
Wirtschaftliche Einflüsse: Marktreife und Prozeßreife
5
Wirtschaftliche Einflüsse: Marktreife6
Pre-Dotcom: Kein Business-
Modell
Keine Best Practices
Qualitative Best Practices
Metriken, KVP
Public Domain via Public Domain via https://en.wikipedia.org/wiki/File:Characteristics_of_Capability_Maturity_Model.svg
Wirtschaftliche Einflüsse: Prozeßreife7
OutsourcingmöglichUnklar,
was gekauft/
verkauft worden ist
WiederholungVeränderung
Public Domain via https://en.wikipedia.org/wiki/File:Characteristics_of_Capability_Maturity_Model.svg
Technische Einflüsse: Scale-Up vs. Scale-Out
8
Erkenntnis um 2002:“Scale Up” funktioniert nicht.
©2002 Kristian Köhntopp
“Scale Out” tut super.Resultat: Moar Boxes!!1!eins!!elf!!!
http://www.google.com/about/datacenters/gallery/#/tech/12
Hilfe, mein Computer hat zu viel Bumms!http://hpserver.by/images/detailed/1/hp_dl380p_gen8_inside_in_t7e8-xt.jpg © 2014 HP Press Material
http://hpserver.by/images/detailed/1/hp_dl380p_gen8_inside_in_t7e8-xt.jpg © 2014 HP Press Material
CPU
used 8
unused 40
RAM
used 16
unused 240
CPU
used 4
unused 44
RAM
used 8
unused 248
Java Appserver
PHP Appserver
Wir virtualisieren!13
Hardware Node
vSwitchvRouter
VM VM VM VM VM
DevOps als Reaktion auf Einflüsse aus dem Umfeld
BOFH: “Bastard Operator From Hell”Cat-5-O-Nine-Tails und Kekse von Antje Bendrich, Dezember 2008
Pre-DevOps (First Edition: 2001)via http://geek-whisperers.com/wp-content/uploads/2014/11/thomas-limoncelli.jpg
DevOps: Patrick Debois (2008, Belgien)Währenddessen in Amsterdam…
Booking.com Office, 2008
ITIL vs. DevOps?
Noch so einScale-Up vs. Scale-Out Ding…
18
Kennzeichen einer modernen Entwicklungsumgebung19
• Automated Infrastructure
• Shared Version Control
• One Step Build and Deploy
• Feature Flags, Graceful Degradation
• Test and Measure all the things
• Instant Communication
nach John Allspaw (2009), http://www.slideshare.net/jallspaw/10-deploys-per-day-dev-and-ops-cooperation-at-flickr
SystemsCode
DeployActivation
Failure detectionFixing
Technische und kulturelle Konvergenz20
• "Script all the things", "Centralize all monitoring", etc. pp.
• "System administration built in at development stage."
• Entwickler und Admins verwenden dieselben Tools
• "Dann kann man die beiden auch zusammenlegen."
➡ DevOps
21 DevOps
https://twitter.com/jezhumble/status/259368948859023362
Grundidee: Die Mauer muß weg.Brandenburger Tor, 1989 - Foto: Thomas 'tlr' Roessler
Und Operations?
23
Infrastructure as Code: Scriptbare Technik durch Virtualisierung mit einer API
Hardware als Skript: Infrastructure as Code25
Automated Infrastructure
Was braucht eine Instanz zum Booten?
• Boot Image zur Ephemeral Disk aufblasen
• Volume attachen
• Netz attachen
• VM starten
• DHCP
• Config: Hostname, Startscript
26
8 Cores32 GB RAM50 GB Ephemeral Disk
2 TB Persistent Volume
Was ist, wenn ein Host umfällt?
• Wichtig sind die persistenten Daten (das Volume)
• Der Rest kann schneller neu generiert werden als er restauriert werden kann.
• Vorbedingung: Das Setup ist vollständig automatisch generiert.
27
8 Cores32 GB RAM50 GB Ephemeral Disk
2 TB Persistent Volume
Puppet, Ansible, Salt, Chef
Automatisierte Systemadministration28
Branch Release
Fix
Merge
„Reproduzierbar. Parallelisierbar. Orchestrierbar.“
29
https://uksysadmin.files.wordpress.com/2011/03/openstackwallpaper1.png
Was braucht eine Instanz zum Booten?
• Boot Image zur Ephemeral Disk aufblasen
• Volume attachen
• Netz attachen
• VM starten
• DHCP
• Config: Hostname, Startscript
31
8 Cores32 GB RAM50 GB Ephemeral Disk
2 TB Persistent Volume
Glance
Cinder
Neutron
Nova
Harte Drei Buchstaben: SDS, SDN, SLA
Hardware als Skript: Infrastructure as Code33
Wie erreichen wir das?
Mehr als ein Computer…34
CPU, RAM
StorageNetwork
OverlayUnderlay
Es ist also komplizierter…
• Underlay:
• Mehrere Hosts (wieviele?), shared Storage, ausreichend Netzwerk-Kapazität
• Overlay:
• frei definierbare Netze, frei definierbarer Storage, definierbare Guests, definierbare Firewall- und Loadbalancer-Regeln
35
36
„Wo der Feenstaub herkommt…“
37
Harte Drei Buchstaben: SDS, SDN, SLA
Problem 1: Storage
• Filer?
• Pro: erprobte Technologie, angemessene Bandbreiten, separates Storage-Netz.
• Contra: wie skaliert das in der Größe und finanziell? separates Storage-Netz.
• Alternativen?
39
Distributed Filesystems
• 2 HE Box: CPU, RAM, Netz und Disk
• Aufgabe:
• Mache die lokalen Platten redundant im Cluster verfügbar.
• “Jeder Disk Write ist 2-3 Netzwork Writes.”
• Folgeproblem:
• Netz
40
Harte Drei Buchstaben: SDS, SDN, SLA
Problem 2: Netzwerk-Kapazität
• Platten und CPU in Hosts für Storage mitnutzen.
• HDFS, Ceph, Quobyte, …
• 3 Kopien, mindestens eine Off-Rack
• Latenz? IOPS? Bandbreite?
• Wieviel Netz ist genug?
42
Mercury Redstone Connector MR-1 (1960) https://www.flickr.com/photos/jurvetson/5691350527 Steve Jurvetson (CC-BY)
2005: 50 DL360 = 50 Cores, 50 GBit/s Netz, ~ 2 Racks
2015: 2 HE, 48 Cores, 2x 10 GBit/s Netz = ~40% Netz
Ohai, can I haz 2x 25 Gbit/s, plz?
„Be careful what you wish for!“
46
16 DL380 mit 2x 25 GBit/s pro Rack, Ceph (Symbolbild)
Top of Rack Switch
Kapazitätsproblem? Welches Kapazitätsproblem?48
18U Rack (resize vertically) 18U Rack (resize vertically) 18U Rack (resize vertically)
2x 10GBit/s Netz (2400 MB/sec) oder2x 25 GBit/s Netz(6000 MB/sec)
16x 2x 10GBit/s(320 GBit/s)
oder
16x2x 25 GBit/s(800 GBit/s)
Storage Traffic (Ost-West Traffic)(320 GBit/s, 800 GBit/s)
zum Internet (Nord-Süd Traffic)
Virtuelle Maschine
Volume
Terasort to watch the world burn49
http://www.slideshare.net/pramodbiligiri/shuffle-phase-as-the-bottleneck-in-hadoop-terasort by http://www.slideshare.net/pramodbiligiri/presentations
Meanwhile, at the Chocolate Factory…50
Google “Jupiter” Superblock, “1 Petabit/sec of total bisection bandwidth”© 2015 Google Presserelease
Konstruktionsprinzip: Leaf and Spine51
http://bradhedlund.com/2012/01/25/construct-a-leaf-spine-design-with-40g-or-10g-an-observation-in-scaling-the-fabric/
Netz >> Storage
• Sinnvoller Storage braucht also sinnvolles Netz
• “Leaf and Spine” braucht eine zentrale Flow-Steuerung
• Verschiedene Hersteller haben das begriffen.
• Aber es gibt keine großen, funktionierenden Deployments.
52
Contrail53
Midonet54
Harte Drei Buchstaben: SDS, SDN, SLA
Welche Ressource ist am knappsten?56
Ressourcen
• 48 Cores: • 256 GB RAM, 2x 10 GBit/s
• 12x 3TB Disk (200 IOPS ea) oder 7x 2TB SSD (20k IOPS ea)
• pro Core (“Compute Unit”)
• 5 GB RAM, 400 MBit/s, 50 IOPS Disk, 1500 IOPS SSD
57
Flavors
• “Compute Unit”: “1/48stel Rechner”
• 5 GB RAM, 400 MBit/s, 50 IOPS Disk, 1500 IOPS SSD
• Flavor:
• x Compute Units
• Flavor i = 2* Flavor (i-1)
• Kein Verschnitt
58
Isolation
• CPU Cores
• RAM
• Disk I/O (IOPS, MB/s)
• Netz I/O (Bit/s)
59
VMHost
Quota mit Token Bucket
Arrival Rate
Volumen = Elastizität
Verbrauch
Ein Image, viele Instanzen61
H
HardwareNode
Ubuntu14.04 LTS
Appserver 1
Appserver 2
DatabaseMaster
copyon
write
download
Glance
Mehr SSD
für alle!
• Virtualisierung ist High Density Computing.
• Das ist nicht billiger, nur anders.
• Insbesondere muß man sein Netz neu bauen.
• Das Thema SDN ist noch weitgehend unbearbeitet und eine weitaus härtere Nuß als alle anderen Themen.
63
• “Infrastructure as Code” ist cool.
• “Automatisierte Provisionierung”.
• Netzinsuffizienz scheint durch, wird als fsync/Commit Insuffizienz sichtbar.
64
65
?