Agenda für heute, 24. Oktober 2008
•• Datenvisualisierung und EntscheidungsfindungDatenvisualisierung und Entscheidungsfindung• Diagramme erlauben VergleicheDiagramme erlauben Vergleiche• Pause • Grundlagen: Grafische Wahrnehmung• Grundlagen: Grafische Wahrnehmung• Geometrische Transformationen
S b li h D t ll• Symbolische Darstellungen
Visualisierungen unterstützen die erkundende Datenanalyse
Grafische Darstellungen sind oft eine Hilfe für das Verständnis voneine Hilfe für das Verständnis von Ursächlichkeiten (Kausalität)
Können sie analytische AufgabenKönnen sie analytische Aufgaben bei der Entscheidungsfindungunterstützen?
© Departement Informatik, ETH Zürich2/44
Fallstudie aus der Epidemiologie: Cholera
1854'Schlechte Luft' wird als Ursache der Cholera-Epidemie in London akzeptiert
1854
Wie konnte die Epidemie durch Stilllegen einer Trinkwasserpumpe beendet
1884werden, obwohl das Cholerabazillus erst 1884 durch Robert Koch entdeckt wurde?
© Departement Informatik, ETH Zürich3/44
Miasma als Ursache der Cholera
Die Theorie um 1850: Schlechte Luft, die aus faulender organischer Materie, dem miasmata entsteht, verursacht die Cholera.
Durch das Verbrennen von Kräuter-und Gewürzmischungen sollte die vergiftete Luft beseitigt werden. (Räucherpfanne aus dem 16. Jh.)
Selbst Briefe wurden durchstochen in dreiteilige Räucherkästen gelegt. g g(Desinfizierter Cholera-Brief von 1831)
© Departement Informatik, ETH Zürich4/44
Zwei Protagonisten
Pro Miasma
Contra Miasma
William Farr, Chief Statistician at the John Snow, Gründungsmitglied der ,Office of the Registrar-General,served on the Committee for Scientific Enquiry into the cholera epidemic of 1854
, g gLondon Epidemiological Society, Narkosearzt von Königin Victoria, befasste sich nach der 1848er Epidemie
it d L d W
© Departement Informatik, ETH Zürich5/44
1854 mit der Londoner Wasserversorgung
William Farrs Prognose-Funktion
F l bt d di St ti tikFarr glaubte, dass diese Statistik seine Miasma-Theorie untermauert
© Departement Informatik, ETH Zürich6/44
John Snows Hypothese
Cholera propagates itself by a 'morbid matter' which, passingfrom one patient in his evacuations, is accidentally swallowedp , yby other persons as a pollution of food or water; . . .
A drop of London water
© Departement Informatik, ETH Zürich7/44
A drop of London waterPunch 1850
Farrs Reaktion auf die Hypothese von Snow
". . . [it] has been suggested by Dr. Snow, that the real cause of whatever was peculiar in the case lay in the use of one particular well, . . .
After careful inquiry we see no reason to adopt this belief "After careful inquiry, we see no reason to adopt this belief."
". .. . . nor is there before us any sufficient evidence to show whether inhabitants of that district, drinking from that well, suffered in proportion more than other inhabitants of the district who drank from other sources "who drank from other sources."
© Departement Informatik, ETH Zürich8/44
Snows Strategie
• Ermittelt Bezirke mit• Ermittelt Bezirke, mit Trinkwasser von zwei verschiedenen LieferantenLieferanten
• Während der 1849er Epidemie liefern beide pverschmutztes Wasser (aus dem Flutbecken)
• 1854 liefert einer• 1854 liefert einer sauberes Wasser, der andere verschmutzes
• Erstellt Tabellen, die einen Zusammenhang zwischen den Cholera-Todesfällen und den Wasserquellen zeigen
© Departement Informatik, ETH Zürich
9/44
Snows 'Grand Experiment'
• Snow hatte eine Theorie aber auch statistischen Daten über 300'000 Personen um die wasserbezogene Ursache zu b ü dbegründen.
• Die Daten des Einwohneramtes, publiziert durch William pFarr, zeigten Snow die Mikrostruktur der Epidemie.
Snow musste nicht einen Kausalzusammenhang beweisen• Snow musste nicht einen Kausalzusammenhang beweisen, sondern Anhaltspunkte überzeugend darstellen.
Eine Darstellung der Daten musste gefunden werden, die• Todesfall Statistiken = Zeitliche Daten und• Zugang zu Wasser = Räumliche Datenwirkungsvoll vereinigt
© Departement Informatik, ETH Zürich10/44
wirkungsvoll vereinigt
Die "Geisterkarte" Quelle: Tufte
Ausschnitt aus demAusschnitt aus dem Londoner Stadtteil Soho
x öffentliche Wasserpumpe• Todesfall durch Cholera
© Departement Informatik, ETH Zürich11/44
Wo tauchte die Cholera nicht auf?
Anzahl Opfer
© Departement Informatik, ETH Zürich12/44
Die Cholera-Daten als Zeitreihe
© Departement Informatik, ETH Zürich13/44
Die Cholera-Zeitreihe ohne Intervalle
© Departement Informatik, ETH Zürich14/44
Später Ruhm
1866 acht Jahre nach John Snows Tod, anerkannte Farr, dass Wasserder wichtigste Übertragungsweg für Cholera ist und nicht Miasmata
John Snow wird heute allgemein als der 'Vater' der (modernen) Epidemiologie betrachtet
In einer Umfrage der britischen Zeitschrift Hospital Doctor, im März 2003, d J h S ' t t d t f ll ti ' ählt
Epidemiologie betrachtet
wurde John Snow zum 'greatest doctor of all time' gewählt
© Departement Informatik, ETH Zürich15/44
. . . und heute?
Di B d t t P i tDie Broadstreet-Pumpe ist verschwunden.An ihrer Stelle steht dasAn ihrer Stelle steht das John Snow Pub.
© Departement Informatik, ETH Zürich16/44Bilder: http://www.ph.ucla.edu/epi/snow/snowpub.html
• Datenvisualisierung und Entscheidungsfindung
•• Diagramme erlauben VergleicheDiagramme erlauben Vergleiche• Grundlagen: Grafische Wahrnehmung • Geometrische Transformationen• Symbolische Darstellungen
Fünf Grundtypen von Vergleichen
Grundtyp VergleichStruktur Anteile an einer GesamtheitRangfolge Reihung von EinzelobjektenZeitreihe Veränderung über ZeitHäufigkeitsverteilung Veränderung von HäufigkeitenZusammenhänge Beziehung zwischen Variablen
Zentrale Frage: Was wird verglichen und womit ?
© Departement Informatik, ETH Zürich17/44
Fünf Grundformen von Diagrammtypen
Kreis Balken Säulen Linien Punkte
Diagramme stellen nicht nur Daten dar, sie erlauben auch Vergleiche!g , g
Diagramme unterstützen eine Aussage!
Drei Schritte: Aussage Vergleich Diagrammform
© Departement Informatik, ETH Zürich18/44
Wie wählt man die geeignete Diagrammform?
Struktur Rangfolge Zeitreihe Häufigkeit Beziehung
Quelle:Kreis
Quelle:G. Zelazny,Wie aus Zahlen
BalkenWie aus Zahlen Bilder werden
Säule
Kurve
Punkt
© Departement Informatik, ETH Zürich19/44
Beispiel für Struktur
Florence NightingaleFlorence Nightingale,Pionierin der Krankenpflege und sanitärer Methoden in S itäl
© Departement Informatik, ETH Zürich19/44
Polar-Area Diagram1858 (Krim-Krieg)20/44
Spitälern
Beispiel für Rangfolge
V hi d Lä d d b ü li h d L b tVerschiedene Länder werden bezüglich der Lebenserwartung bei der Geburt miteinander verglichen
© Departement Informatik, ETH Zürich21/44
Lebenserwartung bei der Geburt (alphabetisch nach Land)
© Departement Informatik, ETH Zürich22/44Quelle: Wainer
Beispiel für Zeitreihe
1) V hi d J h d b ü li h d B d t b1) Verschiedene Jahre werden bezüglich der Budgetausgaben des Staates New York miteinander verglichen
2) Die Zunahme der Bildungsausgaben über mehrere Jahre ) g gwird mit der Entwicklung des Bildungsniveaus von Jugendlichen im gleichen Zeitraum verglichen
© Departement Informatik, ETH Zürich23/44
Zeitliche Entwicklung von Budgetausgaben Quelle: Tufte
Falsche GeometrieNew York Times,Feb. 1., 1976
Verheimlicht:Die Bevölkerung des Staates New York nahm um 1.7
Optische
Mio. zu!
Optische Verlängerung
der kleinen Budgetsg
© Departement Informatik, ETH Zürich
Optische Erhöhung der neuen Budgets:24/44
Die Realität im Staate New York
Inflationsbereinigte Zahlenunter Berücksichtigung des B ölk hBevölkerungszuwachses
© Departement Informatik, ETH Zürich25/44
Zeitliche Entwicklung von Bildungsvon Bildungs-ausgaben und BildungsniveauBildungsniveau
SAT = Scholastic Aptitude Test
© Departement Informatik, ETH Zürich26/44
Richtige Skalierung wählen!
© Departement Informatik, ETH Zürich27/44
Beispiel für Beziehung zwischen Variablen
Di A b it l t i d it d I fl ti t b ü li h ihDie Arbeitslosenrate wird mit der Inflationsrate bezüglich ihrer zeitlichen Entwicklung verglichen
© Departement Informatik, ETH Zürich28/44
Eine inverse Beziehung zwischen Variablen ...6
Quelle: Tufte
Phillips Curve aus Daten über Inflation und Arbeitslosigkeit
69 +
5und Arbeitslosigkeit in den USA 1961 bis 1969(Historische Studie von
+ 68
5
4(Historische Studie von A.W.H. Phillips, 1958)
nsra
te
67 +
4
3
Infla
tion
66 +3
2
Quelle: + 61+ 63
66 +64 +
62 +
2
1QThe Concise Encyclopedia of Economics
+ 611
0
© Departement Informatik, ETH ZürichArbeitslosenrate65 743
0
29/44
... die nur scheinbar existiert ...
Verglichen womit?1961 - 1969 oder1956 - 1976
onsr
ate
Infla
tio
© Departement Informatik, ETH ZürichArbeitslosenrate 30/44
... und die schwierig ist, irgendwo zu finden.
© Departement Informatik, ETH Zürich31/44
• Datenvisualisierung und Entscheidungsfindung• Diagramme erlauben Vergleiche
•• Grundlagen: Grafische Wahrnehmung Grundlagen: Grafische Wahrnehmung • Geometrische Transformationen• Symbolische Darstellungen
Grafische Wahrnehmung
Die visuelle Wahrnehmung des Menschen erfasst nicht alle grafischen Elemente mit der gleichen Präzision!
Untersuchungen haben folgende Rangfolge ergeben (präziseste zuerst):( )
1. Position entlang einer gemeinsamen Skala2 Position entlang identischen nicht ausgerichteten Skalen2. Position entlang identischen, nicht ausgerichteten Skalen3. Länge4 Winkel Neigung4. Winkel, Neigung5. Fläche6 V l6. Volumen7. Farbton, Farbsättigung, Dichte
© Departement Informatik, ETH Zürich32/44
Beispiel: Winkel- vs. Positionsbeurteilung Quelle: Cleveland
wenig präzis sehr präzis
© Departement Informatik, ETH Zürich33/44
Beispiel: Neigungs- vs. Positionsbeurteilung
wenig präzis sehr präzis
Quelle: Cleveland
wenig präzis sehr präzis
Mittlere jährliche CO2-Konzentrationen von Mauna Loa Hawaii
Veränderung der CO2-Konzentration pro Jahr
© Departement Informatik, ETH Zürich
von Mauna Loa, Hawaii Jahr
34/44
Grafische Täuschung bei Flächen Quelle: Wainer
William Playfair, 1785
© Departement Informatik, ETH Zürich35/44
Playfairs Daten anders dargestellt
Graph der Differenz zwischen Import und ExportGraph der Differenz zwischen Import und Export
© Departement Informatik, ETH Zürich36/44
• Datenvisualisierung und Entscheidungsfindung• Diagramme erlauben Vergleiche
G dl G fi h W h h• Grundlagen: Grafische Wahrnehmung
•• Geometrische TransformationenGeometrische Transformationen• Symbolische Darstellungen
Iris-Daten projiziert auf die Seiten eines Würfels
© Departement Informatik, ETH Zürich37/44
Perspektive entfernen
© Departement Informatik, ETH Zürich38/44
Scatterplot-Matrix: verallgemeinerte e a ge e e teProjektionsansicht
© Departement Informatik, ETH Zürich39/44
• Datenvisualisierung und Entscheidungsfindung• Diagramme erlauben Vergleiche
G dl G fi h W h h• Grundlagen: Grafische Wahrnehmung • Geometrische Transformationen
S b li h D t llS b li h D t ll•• Symbolische DarstellungenSymbolische Darstellungen
Datenpunkte können selber wieder Daten sein (1-d) Quelle: Tufte
© Departement Informatik, ETH Zürich
Wachstum nach einer Jahreszeit in Sand mit versch. Mengen Kalzium (in ppm)40/44
Angst2-d
Aus: E C ZeemanAus: E.C. Zeeman,Catastrophe TheoryScientific American,234 (April 1976)234 (April 1976)
Anmerkung:Anmerkung:Gilt nicht für Pitbulls
© Departement Informatik, ETH Zürich
WutQuelle: Tufte
41/44
Die Lösung der Aufgabe . . . Quelle: Wainer
Smokers
Quelle:Smoking and
Non-Smokers
Health. Report of the advisory committee to the surgeon general of the
Die unbequeme Ausgangslage
public health service.Washington DC, 19641964
© Departement Informatik, ETH Zürich42/44
. . . liegt im "Verglichen womit?"
Non SmokersDiagramm mit zwei Y-Achsen
Non-Smokers
Smokers
Die Lösung
© Departement Informatik, ETH Zürich43/44
Literatur (kleine Auswahl)
• [Bertin 82] Bertin J. Graphische Darstellungen und die graphische Weiterverarbeitung der Information. Walter de Gruyter & Co. Berlin 1982Berlin, 1982.
• [Cleveland 85] Cleveland W.S. The Elements of Graphing Data.Wadsworth, Belmont Cal., 1985.Wadsworth, Belmont Cal., 1985.
• [Ehrenberg 86] Ehrenberg A.S.C. Statistik oder der Umgang mit Daten.VCH Verlagsgesellschaft, Weinheim,1986.Daten.VCH Verlagsgesellschaft, Weinheim,1986.
• [Tufte 83] Tufte E.R. The Visual Display of Quantitative Information. Graphics Press, Cheshire Conn., 1983.p , ,
• [Tukey 77] Tukey J.W. Exploratory Data Analysis. Addison-Wesley, Reading, Mass. 1977.y, g,
• [Wainer 97] Wainer H. Visual Relations. Copernicus, Springer-Verlag, New York. 1997.
© Departement Informatik, ETH Zürich
g
44/44