warum eigentlich cloud?

Warum eigentlich Cloud?Kristian Köhntopp

Cloud Architect Alter Sack

26. November 2015

Devops und Cloud Computing

gehen Hand in Hand

Was ist uns in den letzten 15 Jahren eigentlich passiert?

– Rajat Bhargava, http://devops.com/features/devops_and-enterprises/

„DevOps and Enterprises:It's a culture thing.“

4

Einflüsse

Wirtschaftliche Einflüsse: Marktreife und Prozeßreife

5

Wirtschaftliche Einflüsse: Marktreife6

Pre-Dotcom: Kein Business-

Modell

Keine Best Practices

Qualitative Best Practices

Metriken, KVP

Public Domain via Public Domain via https://en.wikipedia.org/wiki/File:Characteristics_of_Capability_Maturity_Model.svg

https://en.wikipedia.org/wiki/File:Characteristics_of_Capability_Maturity_Model.svg

Wirtschaftliche Einflüsse: Prozeßreife7

OutsourcingmöglichUnklar,

was gekauft/

verkauft worden ist

WiederholungVeränderung

Public Domain via https://en.wikipedia.org/wiki/File:Characteristics_of_Capability_Maturity_Model.svg

https://en.wikipedia.org/wiki/File:Characteristics_of_Capability_Maturity_Model.svg

Technische Einflüsse: Scale-Up vs. Scale-Out

8

Erkenntnis um 2002:“Scale Up” funktioniert nicht.

©2002 Kristian Köhntopp

“Scale Out” tut super.Resultat: Moar Boxes!!1!eins!!elf!!!

http://www.google.com/about/datacenters/gallery/#/tech/12

http://www.google.com/about/datacenters/gallery/#/tech/12

http://hpserver.by/images/detailed/1/hp_dl380p_gen8_inside_in_t7e8-xt.jpg © 2014 HP Press Material

CPU

used 8

unused 40

RAM

used 16

unused 240

CPU

used 4

unused 44

RAM

used 8

unused 248

Java Appserver

PHP Appserver

Wir virtualisieren!13

Hardware Node

vSwitchvRouter

VM VM VM VM VM

DevOps als Reaktion auf Einflüsse aus dem Umfeld

BOFH: “Bastard Operator From Hell”Cat-5-O-Nine-Tails und Kekse von Antje Bendrich, Dezember 2008

Pre-DevOps (First Edition: 2001)via http://geek-whisperers.com/wp-content/uploads/2014/11/thomas-limoncelli.jpg

http://geek-whisperers.com/wp-content/uploads/2014/11/thomas-limoncelli.jpg

DevOps: Patrick Debois (2008, Belgien)Währenddessen in Amsterdam…

Booking.com Office, 2008

ITIL vs. DevOps?

Noch so einScale-Up vs. Scale-Out Ding…

18

Kennzeichen einer modernen Entwicklungsumgebung19

• Automated Infrastructure

• Shared Version Control

• One Step Build and Deploy

• Feature Flags, Graceful Degradation

• Test and Measure all the things

• Instant Communication

nach John Allspaw (2009), http://www.slideshare.net/jallspaw/10-deploys-per-day-dev-and-ops-cooperation-at-flickr

SystemsCode

DeployActivation

Failure detectionFixing

Technische und kulturelle Konvergenz20

• "Script all the things", "Centralize all monitoring", etc. pp.

• "System administration built in at development stage."

• Entwickler und Admins verwenden dieselben Tools

• "Dann kann man die beiden auch zusammenlegen."

➡ DevOps

21 DevOps

https://twitter.com/jezhumble/status/259368948859023362

Grundidee: Die Mauer muß weg.Brandenburger Tor, 1989 - Foto: Thomas 'tlr' Roessler

Und Operations?

23

Infrastructure as Code: Scriptbare Technik durch Virtualisierung mit einer API

Hardware als Skript: Infrastructure as Code25

Automated Infrastructure

Was braucht eine Instanz zum Booten?

• Boot Image zur Ephemeral Disk aufblasen

• Volume attachen

• Netz attachen

• VM starten

• DHCP

• Config: Hostname, Startscript

26

8 Cores32 GB RAM50 GB Ephemeral Disk

2 TB Persistent Volume

Was ist, wenn ein Host umfällt?

• Wichtig sind die persistenten Daten (das Volume)

• Der Rest kann schneller neu generiert werden als er restauriert werden kann.

• Vorbedingung: Das Setup ist vollständig automatisch generiert.

27



Puppet, Ansible, Salt, Chef

Automatisierte Systemadministration28

Branch Release

Fix

Merge

„Reproduzierbar. Parallelisierbar. Orchestrierbar.“

29

https://uksysadmin.files.wordpress.com/2011/03/openstackwallpaper1.png

https://uksysadmin.files.wordpress.com/2011/03/openstackwallpaper1.png

Was braucht eine Instanz zum Booten?

• Boot Image zur Ephemeral Disk aufblasen

• Volume attachen

• Netz attachen

• VM starten

• DHCP

• Config: Hostname, Startscript

31



Glance

Cinder

Neutron

Nova

Harte Drei Buchstaben: SDS, SDN, SLA

Hardware als Skript: Infrastructure as Code33

Wie erreichen wir das?

Mehr als ein Computer…34

CPU, RAM

StorageNetwork

OverlayUnderlay

Es ist also komplizierter…

• Underlay:

• Mehrere Hosts (wieviele?), shared Storage, ausreichend Netzwerk-Kapazität

• Overlay:

• frei definierbare Netze, frei definierbarer Storage, definierbare Guests, definierbare Firewall- und Loadbalancer-Regeln

35

„Wo der Feenstaub herkommt…“

37

Problem 1: Storage

• Filer?

• Pro: erprobte Technologie, angemessene Bandbreiten, separates Storage-Netz.

• Contra: wie skaliert das in der Größe und finanziell? separates Storage-Netz.

• Alternativen?

39

Distributed Filesystems

• 2 HE Box: CPU, RAM, Netz und Disk

• Aufgabe:

• Mache die lokalen Platten redundant im Cluster verfügbar.

• “Jeder Disk Write ist 2-3 Netzwork Writes.”

• Folgeproblem:

• Netz

40

Problem 2: Netzwerk-Kapazität

• Platten und CPU in Hosts für Storage mitnutzen.

• HDFS, Ceph, Quobyte, …

• 3 Kopien, mindestens eine Off-Rack

• Latenz? IOPS? Bandbreite?

• Wieviel Netz ist genug?

42

Mercury Redstone Connector MR-1 (1960) https://www.flickr.com/photos/jurvetson/5691350527 Steve Jurvetson (CC-BY)

2005: 50 DL360 = 50 Cores, 50 GBit/s Netz, ~ 2 Racks

2015: 2 HE, 48 Cores, 2x 10 GBit/s Netz = ~40% Netz

Ohai, can I haz 2x 25 Gbit/s, plz?

„Be careful what you wish for!“

46

16 DL380 mit 2x 25 GBit/s pro Rack, Ceph (Symbolbild)

Top of Rack Switch

Kapazitätsproblem? Welches Kapazitätsproblem?48

18U Rack (resize vertically) 18U Rack (resize vertically) 18U Rack (resize vertically)

2x 10GBit/s Netz (2400 MB/sec) oder2x 25 GBit/s Netz(6000 MB/sec)

16x 2x 10GBit/s(320 GBit/s)

oder

16x2x 25 GBit/s(800 GBit/s)

Storage Traffic (Ost-West Traffic)(320 GBit/s, 800 GBit/s)

zum Internet (Nord-Süd Traffic)

Virtuelle Maschine

Volume

Terasort to watch the world burn49

http://www.slideshare.net/pramodbiligiri/shuffle-phase-as-the-bottleneck-in-hadoop-terasort by http://www.slideshare.net/pramodbiligiri/presentations

Meanwhile, at the Chocolate Factory…50

Google “Jupiter” Superblock, “1 Petabit/sec of total bisection bandwidth”© 2015 Google Presserelease

Konstruktionsprinzip: Leaf and Spine51

http://bradhedlund.com/2012/01/25/construct-a-leaf-spine-design-with-40g-or-10g-an-observation-in-scaling-the-fabric/

Netz >> Storage

• Sinnvoller Storage braucht also sinnvolles Netz

• “Leaf and Spine” braucht eine zentrale Flow-Steuerung

• Verschiedene Hersteller haben das begriffen.

• Aber es gibt keine großen, funktionierenden Deployments.

52

Contrail53

Midonet54

Welche Ressource ist am knappsten?56

Ressourcen

• 48 Cores: • 256 GB RAM, 2x 10 GBit/s

• 12x 3TB Disk (200 IOPS ea) oder 7x 2TB SSD (20k IOPS ea)

• pro Core (“Compute Unit”)

• 5 GB RAM, 400 MBit/s, 50 IOPS Disk, 1500 IOPS SSD

57

Flavors

• “Compute Unit”: “1/48stel Rechner”

• 5 GB RAM, 400 MBit/s, 50 IOPS Disk, 1500 IOPS SSD

• Flavor:

• x Compute Units

• Flavor i = 2* Flavor (i-1)

• Kein Verschnitt

58

Isolation

• CPU Cores

• RAM

• Disk I/O (IOPS, MB/s)

• Netz I/O (Bit/s)

59

VMHost

Quota mit Token Bucket

Arrival Rate

Volumen = Elastizität

Verbrauch

Ein Image, viele Instanzen61

H

HardwareNode

Ubuntu14.04 LTS

Appserver 1

Appserver 2

DatabaseMaster

copyon

write

download

Glance

Mehr SSD

für alle!

• Virtualisierung ist High Density Computing.

• Das ist nicht billiger, nur anders.

• Insbesondere muß man sein Netz neu bauen.

• Das Thema SDN ist noch weitgehend unbearbeitet und eine weitaus härtere Nuß als alle anderen Themen.

63

• “Infrastructure as Code” ist cool.

• “Automatisierte Provisionierung”.

• Netzinsuffizienz scheint durch, wird als fsync/Commit Insuffizienz sichtbar.

64