vorlesung: biometrie für studierende der veterinärmedizin 17.11.2005 1 diskrete...
TRANSCRIPT
Vorlesung: Biometrie für Studierende der Veterinärmedizin
17.11.20051
Diskrete Wahrscheinlichkeitsmodelle
)exp(!
)(
kkXP
k
Wahrscheinlichkeitsfunktion
• Poisson-Verteilung: Zählen seltener Ereignisse
Beispiele: Zahl der Fischvergiftungen pro Zeiteinheit
Zahl der Spontantumoren pro Zeiteinheit
historisch: Zahl der Todesfälle durch Hufschlag pro Jahr und Regiment
Vorlesung: Biometrie für Studierende der Veterinärmedizin
17.11.20052
Beispiel für Possion-Verteilung
Wahrscheinlichkeitsfunktion
Vorlesung: Biometrie für Studierende der Veterinärmedizin
17.11.20053
Lebensdauerverteilungen
Beispiel: Lebensdauern
• Exponentialverteilung
Vorlesung: Biometrie für Studierende der Veterinärmedizin
17.11.20054
Zusammenfassung: Verteilungen
• Wahrscheinlichkeitsmodelle dienen dazu, bestimmte (unsichere) Phänomene zu charakterisieren.
• Das Wahrscheinlichkeitsmodell ist abhängig von der zu charakterisierenden Größe. In der Literatur gibt es eine Vielzahl solcher Verteilungen.
• Man unterscheidet diskrete und stetige Verteilungen (Wahrscheinlichkeitsmodelle).
• Wichtige Kennzahlen von Verteilungen sind Erwartungswert und Varianz.
• Verteilungen haben meist Parameter, die durch das Problem gegeben sind, oder aus Daten geschätzt werden.
Vorlesung: Biometrie für Studierende der Veterinärmedizin
17.11.20055
Statistische Erhebungen
• Befragungen z.B. Befragung der Landwirte über das Verhalten der Tiere im Stall
• Experimente z.B. Versuch, welches Arzneimittel am besten zur Heilung führt
• Beobachtungen Auftreten einer Krankheit Erhebungen zu Tieren in einer Tierklinik
Bei der Erhebung von Daten unterscheidet man:
Vorlesung: Biometrie für Studierende der Veterinärmedizin
17.11.20056
Unterscheidungseinheiten / statistische Einheit / Merkmalsträger
• Einzelne Tiere
• Einzelne Herden
• Einzelne Landwirte
• Haushalte
Individuen, die einer Erhebung zugrunde liegen
Beispiele:
Vorlesung: Biometrie für Studierende der Veterinärmedizin
17.11.20057
Merkmale (Variablen)
Eigenschaften Untersuchungseinheiten z.B.
• Krankheitsstatus
• Blutparameter
• Geschlecht
• Anzahl der Kühe (bei Untersuchungseinheit Landwirt)
Merkmalsausprägungen
mögliche Werte des Merkmals
• Messergebnisse / positive Zahlen
• krank / gesund
Vorlesung: Biometrie für Studierende der Veterinärmedizin
17.11.20058
Charakterisierung von Merkmalen
quantitative Merkmale unterscheiden sich durch ihre Größe
• Alter, Gewicht, Milchleistung, Temperatur, Anzahl Keime, Schadstoffgehalt, …
qualitative Merkmale unterscheiden sich durch ihre Art
• Geschlecht, Namen, Rassen, Haltungsform
Vorlesung: Biometrie für Studierende der Veterinärmedizin
17.11.20059
Merkmalswerte
Die gemessenen, erfragten oder beobachteten Ausprägungendes Untersuchungsmerkmals sind die Merkmalswerte. Siestellen die Daten der Erhebung dar.
• Wiederkauverhalten: z.B. in Stunden pro Tag
• Arzneimittel: Dosis 1, Dosis 2, Dosis 0 (Placebo)
• Befund: gesund, fraglich, erkrankt
• Keimzahlen: Anzahl in 1000
Vorlesung: Biometrie für Studierende der Veterinärmedizin
17.11.200510
Skalen
Metrische Skala: Die Werte unterliegen einer Rangfolge und die
Abstände zwischen den Werten der Skala lassen sich interpretieren.
• Gewicht, Keimzahlen, Schadstoffmessung
Ordinalskala: Die Werte unterliegen einer Rangfolge, aber die Ab-
stände zwischen den Werten der Skala lassen sich nicht interpretieren.
• Bewertung (Noten), Gesundheitszustand
Nominalskala: Die Werte unterliegen keiner Rangfolge und sind nicht
Vergleichbar
• Geschlecht, Rasse, Haltungsform
Vorlesung: Biometrie für Studierende der Veterinärmedizin
17.11.200511
Deskriptive Statistik
Ziel: Beschreibung von Daten mit möglichst geringem
Informationsverlust
• Eigenschaften und Strukturen sichtbar machen• Graphisch und durch Kennwerte• Eindimensional und mehrdimensional• Zunächst keine Schlüsse auf die Grundgesamtheit
Vorlesung: Biometrie für Studierende der Veterinärmedizin
17.11.200512
Rohdaten und Datenmatrix
Die Daten liegen in der Regel als Datenmatrix vor:
• Zeilen entsprechen Untersuchungseinheiten• Spalten entsprechen Merkmalen• Elemente der Matrix sind die Merkmalsausprägungen• Fragen mit Mehrfachnennungen als Einzelne binäre Merkmale definieren
Hinweise zur Eingabe unter:www.stat.uni-muenchen.de/stablab/Excel.html
Vorlesung: Biometrie für Studierende der Veterinärmedizin
17.11.200513
Beispiel: Daten zu Mastenten (Ausschnitt)
- Ändern -
Vorlesung: Biometrie für Studierende der Veterinärmedizin
17.11.200514
Eindimensionale Statistische Kennwerte
Lagemaßzahlen
• Wo liegt die Masse der Daten?• Wo liegt die Mehrzahl der Daten?• Wo liegt die Mitte der Daten?• Welche Mehrmalsausprägung ist typisch für die
Häufigkeitsverteilung?
Vorlesung: Biometrie für Studierende der Veterinärmedizin
17.11.200515
Statistische KennwerteStreumaßzahlen
• Über welchen Bereich erstrecken sich die Daten?
• Wie groß ist die Schwankung der Ausprägungen?
Vorlesung: Biometrie für Studierende der Veterinärmedizin
17.11.200516
Eindimensionale Häufigkeitsverteilung
Hämatokrit
3 2,5 3,8 3,8
7 5,8 8,8 12,5
3 2,5 3,8 16,3
9 7,5 11,3 27,5
16 13,3 20,0 47,5
18 15,0 22,5 70,0
12 10,0 15,0 85,0
5 4,2 6,3 91,3
6 5,0 7,5 98,8
1 ,8 1,3 100,0
80 66,7 100,0
40 33,3
120 100,0
35
36
37
38
39
40
41
42
43
44
Gesamt
Gültig
SystemFehlend
Gesamt
Häufigkeit ProzentGültige
ProzenteKumulierteProzente
Vorlesung: Biometrie für Studierende der Veterinärmedizin
17.11.200517
Der Modus
Eigenschaften:
• oft nicht eindeutig• nur bei gruppierten Daten oder bei Merkmalen mit wenigen
Ausprägungen sinnvoll• stabil bei allen eindeutigen Transformationen• geeignet für alle Skalenniveaus
Definition: Häufigster Wert
Vorlesung: Biometrie für Studierende der Veterinärmedizin
17.11.200518
Beispiel Modus
Modus = 4
Vorlesung: Biometrie für Studierende der Veterinärmedizin
17.11.200519
Der Median
50% der Daten sind kleiner oder gleich med
50% der Daten sind größer oder gleich med
Zahlganzen
kfallsxx
Zahlganzen
kfallsx
hk
k
2)(
2
12
1
)1()(
)(
)()1( nxx
med =
sind geordnete Werte
Definition: Wert für den gilt
Vorlesung: Biometrie für Studierende der Veterinärmedizin
17.11.200520
Eigenschaften des Median
• anschaulich• stabil gegenüber monotonen Transformationen• geeignet für ordinale Daten• stabil gegenüber Ausreißern
Vorlesung: Biometrie für Studierende der Veterinärmedizin
17.11.200521
Beispiel Median
Statistiken
Hämatokrit80
40
40,00
40
Gültig
Fehlend
N
Median
Modus
Hämatokrit
3 2,5 3,8 3,8
7 5,8 8,8 12,5
3 2,5 3,8 16,3
9 7,5 11,3 27,5
16 13,3 20,0 47,5
18 15,0 22,5 70,0
12 10,0 15,0 85,0
5 4,2 6,3 91,3
6 5,0 7,5 98,8
1 ,8 1,3 100,0
80 66,7 100,0
40 33,3
120 100,0
35
36
37
38
39
40
41
42
43
44
Gesamt
Gültig
SystemFehlend
Gesamt
Häufigkeit ProzentGültige
ProzenteKumulierteProzente
Vorlesung: Biometrie für Studierende der Veterinärmedizin
17.11.200522
Das Quantil (Perzentil)
Anteil p der Daten sind kleiner oder gleich xp
Anteil 1-p der Daten sind größer oder gleich xp
Zahlganzenpkfallsxx
nphlkleinsteZakundZahlganzekeinenpfallsx
hk
k
)(2
1 )1()(
)(
Definition: Wert für den gilt
Vorlesung: Biometrie für Studierende der Veterinärmedizin
17.11.200523
Fünf-Punkte Zusammenfassung
Minimum, 25%-Quantil, Median,75%-Quantil,Maximum
Statistiken
Hämatokrit80
40
40,00
36,00
38,00
40,00
41,00
42,00
44,00
Gültig
Fehlend
N
Median
10
25
50
75
90
99
Perzentile
Hämatokrit
3 2,5 3,8 3,8
7 5,8 8,8 12,5
3 2,5 3,8 16,3
9 7,5 11,3 27,5
16 13,3 20,0 47,5
18 15,0 22,5 70,0
12 10,0 15,0 85,0
5 4,2 6,3 91,3
6 5,0 7,5 98,8
1 ,8 1,3 100,0
80 66,7 100,0
40 33,3
120 100,0
35
36
37
38
39
40
41
42
43
44
Gesamt
Gültig
SystemFehlend
Gesamt
Häufigkeit ProzentGültige
ProzenteKumulierteProzente
Vorlesung: Biometrie für Studierende der Veterinärmedizin
17.11.200524
Der Mittelwert (arithmetisches Mittel)
n
inx
1
1
• bekanntestes Lagemaß
• instabil gegen extreme Werte • geeignet für Intervallskalierte Daten
ix
Vorlesung: Biometrie für Studierende der Veterinärmedizin
17.11.200525
Beispiel Mittelwert
Hämatokrit
3 2,5 3,8 3,8
7 5,8 8,8 12,5
3 2,5 3,8 16,3
9 7,5 11,3 27,5
16 13,3 20,0 47,5
18 15,0 22,5 70,0
12 10,0 15,0 85,0
5 4,2 6,3 91,3
6 5,0 7,5 98,8
1 ,8 1,3 100,0
80 66,7 100,0
40 33,3
120 100,0
35
36
37
38
39
40
41
42
43
44
Gesamt
Gültig
SystemFehlend
Gesamt
Häufigkeit ProzentGültige
ProzenteKumulierteProzente
Deskriptive Statistik
80 35 44 39,48 2,093
80
Hämatokrit
Gültige Werte(Listenweise)
N Minimum Maximum MittelwertStandardabweichung
Vorlesung: Biometrie für Studierende der Veterinärmedizin
17.11.200526
Die Spannweite (Range)
minmax xxq Definition:
• „Bereich in dem die Daten liegen“ • Wichtig für Datenkontrolle
Vorlesung: Biometrie für Studierende der Veterinärmedizin
17.11.200527
Der Quartilsabstand
25,075,0 xxq Definition:
• „Größe des Bereichs in dem die mittlere Hälfte der Daten liegt“• Geeignet für ordinal skalierte Daten• Zentraler 50%-Bereich
Vorlesung: Biometrie für Studierende der Veterinärmedizin
17.11.200528
Standardabweichung
Definition:
2
22 )(1
1
SS
xxn
S i
• „Mittlere Abweichung vom Mittelwert“• Manchmal auch 1/n statt 1/(n-1)• Intervallskala Voraussetzung