1 statisik lv nr.: 0028 ss 2005 1. juni 2005. 2 test für arithmetisches mittel zweistichprobentest...
Post on 05-Apr-2015
109 Views
Preview:
TRANSCRIPT
1
STATISIK
LV Nr.: 0028
SS 2005
1. Juni 2005
2
Test für arithmetisches Mittel
• Zweistichprobentest für die Differenz zweier arithmetischer Mittel– Unterscheiden sich die Mittelwerte zweier
Grundgesamtheiten?– Unterscheiden sich die Mittelwerte zweier
verbundener Stichproben?
3
Test für arithmetisches Mittel
• Differenz zweier arithmetischer Mittel die aus 2 Grundgesamtheiten stammen.
• Voraussetzung: – Stichproben unabhängig– Stichproben stammen aus einer N-vt.
Grundgesamtheiten bzw. Approximation durch N-Vt. ist zulässig
– Endlichkeitskorrektur ist vernachlässigbar
4
Test für arithmetisches Mittel
• Unterscheide, ob die Varianzen der beiden Grundgesamtheiten homogen sind oder nicht.
• Varianzen verschieden, σ1² σ2² :
• Teststatistik:
• Testverteilung: Z asymptotisch N(0,1)-vt.
2
22
1
21
21
n
S
n
S
)XX(Z
5
Test für arithmetisches Mittel
• Varianzhomogenität, σ1² = σ2² = σ²:
• Teststatistik:
wobei
• Testverteilung: T ~ tv mit v=n1+n2-2 Freiheitsgarden
21
21
21
nn
nnS
)XX(T
2nn
1)S(n1)S(nS
21
222
211
6
Test für arithmetisches Mittel
• Verbundene Stichproben (abhängige oder gepaarte Stpr.)– Tritt auf, wenn z.B. die Merkmalsausprägungen
der ersten Stpr. und die der zweiten jeweils an demselben Merkmalsträger erhoben werden. Bsp: vorher – nachher Untersuchungen.
• Test für die Differenz arithmetischer Mittel bei verbundenen Stichproben.
7
Test für arithmetisches Mittel
• Differenzen der Wertepaare: Di = X2i – X1i sind N-vt. mit E(Di) = µ2i - µ1i = δ und Var(Di) =σD²
• Teststatistik:
• Testverteilung: T~tv mit v=n-1
n
SδD
TD
n n2
i D ii 1 i 1
1 1D D und S (D D)
n n 1
8
Test für Varianz
• Einstichprobentest für die Varianz: – Hat die Varianz einen bestimmten Wert, bzw.
liegt er in einem bestimmten Bereich?– Entscheidung basiert auf dem Ergebnis einer
einzigen Stichprobe.
• Zweistichprobentest für die Varianz– Unterscheiden sich die Varianzen zweier
Gruppen?– Entscheidung basiert auf zwei Stichproben
9
Test für Varianz
Einstichprobentest für die Varianz:• Annahme: Grundgesamtheit normalverteilt• H0: σ² = σ0² gegen H1: σ² σ0²• Teststatistik:
• Testverteilung: χ²v mit v=n-1• Entscheidung:
– χ² > χ²co oder χ² < χ²c
u, lehnen H0 ab – p-Wert < α, lehne H0 ab
2
22
σ
1)s(nχ
10
Test für Varianz
Zweistichprobentest für den Quotienen zweier Varianzen:
• Annahme: Grundgesamtheit normalverteilt• H0: σ1² = σ2² gegen H1: σ1² σ2²• Teststatistik:
• Testverteilung: Fv1,v2 mit v1=n1-1 und v2=n2-1• Entscheidung:
– F > Fco oder F < Fc
u, lehnen H0 ab – p-Wert < α, lehne H0 ab
22
21
S
SF
11
Nichtparametrische Tests
• Nichtparametrische Tests (v.a. wenn Annahme der Normalverteilung nicht erfüllt ist).
• Rangtests für Lageparameter– Zeichentest– Wilcoxon Vorzeichenrangtest für das
Symmetriezentrum einer Verteilung
• Verteilungsfreie Lokationsvergleiche– Wilcoxon Rangsummentest oder
Mann-Whitney U Test
12
Rangtests für Lagemarameter
Zeichentest (Ordinalskala ausreichend)– Annahme: unabhängige Beobachtungen x1, ..., xn
stammen aus einer Grundgesamtheit mit stetiger Verteilungsfunktion F.
• Test für den Median ξ0,5 der Grundgesamtheit
• Einseitige Hypothesen:– H0: ξ0,5 ξ0 gegen H1: ξ0,5 > ξ0
– H0: ξ0,5 ξ0 gegen H1: ξ0,5 < ξ0
• Zweiseitige Hypothese: – H0: ξ0,5 = ξ0 gegen H1: ξ0,5 ξ0
13
Rangtests für Lagemarameter
• Vorgehensweise:
• Transformation der Beobachtungswerte: – xi‘ = xi - ξ0
• Bestimmung von yi
– yi = 1 falls xi‘ > 0, yi = 0 falls xi‘ < 0, Bindungen: yi = ½ falls xi‘ = 0
14
Rangtests für Lagemarameter
• Teststatistik:
Unter H0 ist T ~ B(n, ½) • Approximation durch N(0,1):
• Entscheidung: Vergleich von Z mit kritischen Werten der N(0,1) Verteilung
n
1iiyT
n2
12
ny
2
11
2
1n
2
1ny
Z
n
1ii
n
1ii
15
Rangtests für Lagemarameter
• Beispiel für Zeichentest (Hartung, S. 243):– Alter von Frauen bei der Geburt des ersten
Kindes. H0: ξ0,5 25 gegen H1: ξ0,5 > 25. Zufällige Auswahl von n = 36 Müttern.
i Alter xi xi‘ yi
1 30,6 5,6 1
2 17,8 -7,2 0
: : : :
35 20 -5 0
36 23,5 -1,5 0
16
Rangtests für Lagemarameter
• Beispiel
• Approximation durch N-Vt
• Entscheidung (bei α=0,05): Z < 1,645
Lehne H0: ξ0,5 25 nicht ab.
n
ii 1
1y 36
20 182Z 0,667
1 3362
17
Rangtests für Lagemarameter
• Wilcoxon Vorzeichenrangtest für das Symmetriezentrum einer Grundgesamtheit – Basiert auf Rangzahlen der Beobachtungen– Annahme: n unabhängige Beobachtungen
(x1, ..., xn) stammen aus einer Grundgesamtheit mit Verteilungsfunktion F
• Frage: Ist die Verteilung symmetrisch um einen Wert ξ0, d.h. gilt F(ξ0-y) = 1-F(ξ0+y)?
18
Rangtests für LagemarameterVerteilungsfunktion F(x)
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
-3 -2 -1 0 1 2 3
F(ξ0-y)
1-F(ξ0+y)
ξ0 ξ0+yξ0-y
19
Rangtests für Lagemarameter
• Wilcoxon Vorzeichenrangtest für das Symmetriezentrum ξ0 einer Grundgesamtheit
• Einseitige Hypothesen:– H0: F symmetrisch um ξ ξ0
– H0: F symmetrisch um ξ ξ0
• Zweiseitige Hypothese: – H0: F symmetrisch um ξ = ξ0
20
Rangtests für Lagemarameter
• Vorgehensweise:
• Transformation der Beobachtungswerte: – xi‘ = xi - ξ0
• Ohne Berücksichtigung der Vorzeichen der xi‘ Rangzahlen Ri zuweisen (1 für kleinsten Wert, ..., n für größten Wert).
• Den Rangzahlen werden die Vorzeichen der zugehörigen xi‘ Werte zugewiesen => Rangstatistik R̃i
21
Rangtests für Lagemarameter
• Teststatistik:
mit ci = 0 falls R̃i < 0 und ci = 1 falls R̃i > 0
• Entscheidung: Vergleich von T+ mit kritischen Werten wn,α des Vorzeichenrang-test von Wilcoxon (z.B. Hartung S. 245)
n
1iiiRcT~
22
Rangtests für Lagemarameter
• Approximation durch N(0,1) Verteilung:
• Teststatistik T* (keine Bindungen):
mit E T+ = n(n+1) / 4
und Var T+ = n(n+1)(2n+1) / 24(Beim Auftreten von Bindungen: T* laut Hartung, S. 246)
• Vergleich von T* mit kritischen Werten der N(0,1) Verteilung
+ +*
+
T -E TT =
Var T
23
Rangtests für Lagemarameter
• Beispiel Wilcoxon VorzeichenrangtestPsychologischer Test, Bewertung durch Punkte xi
H0: F symmetrisch um ξ = ξ0 = 61, α = 0,05
• Teststatistik:
ci = 0 falls R̃i < 0 und ci = 1 falls R̃i > 0
n
1iiiRcT~
24
Rangtests für Lagemarameter
• Beispiel:
• T+ = 1·10,5+0·(-3)+1·3+0·(-7)+1·7+1·9+0·(-3)+1·5+1·1 +1·10,5+1·7 = 53
i xi xi‘ = xi- ξ0 Ri R� i
1 72 11 10,5 10,5
2 55 -6 3 -3
3 67 6 3 3
4 53 -8 7 -7
5 69 8 7 7
6 71 10 9 9
7 55 -6 3 -3
8 68 7 5 5
9 65 4 1 1
10 72 11 10,5 10,5
11 69 8 7 7
25
Rangtests für Lagemarameter
• Beispiel:
• Kritische Werte aus Tabelle: wn;α/2 = w11;0,025 = 11 und wn;1-α/2 = w11;0,975 = 54
• Entscheidung:
w11;0,025 = 11 < T+ = 53 < 54 = w11;0,975
Daher: lehne H0 nicht ab, F ist symmetrisch um ξ0 = 61.
26
Vt.-freie Lokationsvergleiche
• Wilcoxon Rangsummentest oder Mann-Whitney U Test
• Annahme: zwei unabhängige Messreihen, zugrundeliegenden Verteilungsfunktionen sind stetig und vergleichbar (d.h. sie schneiden einander nicht).
• Frage: Besteht ein Unterschied in den Verteilungen? Sind z.B. die Werte der einen Messreihe „im Durchschnitt größer“ als die der anderen?
27
Vt.-freie LokationsvergleicheVerteilungsfunktionen
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
-5 -4 -3 -2 -1 0 1 2 3 4 5 6
28
Vt.-freie Lokationsvergleiche
• Einseitige Hypothesen:– H0: F1(x) F2(x) gegen H1: F1(x) F2(x) und
für mind. ein x gilt: F1(x) < F2(x)
– H0: F1(x) F2(x) gegen H1: F1(x) F2(x) und für mind. ein x gilt: F1(x) > F2(x)
• Zweiseitig Hypothese: – H0: F1(x) = F2(x) gegen H1: F1(x) F2(x)
29
Vt.-freie Lokationsvergleiche
• Vorgehensweise: • Gemeinsame Rangzahlen der beiden
Messreihen bilden: r1, ..., rn1, rn1+1, ..., rn1+n2
• Teststatistik:
• Kritische Werte des Wilcoxon-Rangsummen-Tests aus Tabelle (siehe z.B. Hartung 518)
1n
n1,n1 ii=1
W = r
30
Vt.-freie Lokationsvergleiche
• Entscheidung: – H0: F1(x) F2(x),
H0 verwerfen falls Wn1,n2 > Wn1;n2;1-α
– H0: F1(x) F2(x),
H0 verwerfen falls Wn1,n2 < Wn1;n2;α
• Zweiseitig Hypothese: – H0: F1(x) = F2(x)
H0 verwerfen falls Wn1,n2 < Wn1;n2;α/2 oder Wn1,n2 > Wn1;n2;1-α/2
31
Vt.-freie Lokationsvergleiche
• Beispiel: Behandlung von Pilzen mit Vitamin B1. Führt diese Behandlung zu (signifikant) höherem Gewicht?
Behand-lung Rangz.
Behand-lung Rangz. Kontrolle Rangz. Kontrolle Rangz.
27 19 26,5 18 18 7 17 6
34 22,5 22 14 14,5 5 18,5 8
20,5 12 24,5 17 13,5 3 9,5 1
29,5 21 34 22,5 12,5 2 14 4
20 10,5 35,5 24 23 15
28 20 19 9 24 16
20 10,5 21 13
32
Vt.-freie Lokationsvergleiche
• Beispiel: H0: FB(x) ≥ FK(x) bzw. XB ist stochastisch kleiner als XK, α = 0,05.
• Teststatistik: Summe der Ranzahlen der ersten Messreihe (Behandlungsgruppe): Wn1,n2 = 220.
• Kritischer Wert: wn1;n2;0,95 = 191• Entscheidung: 220 > 191 => H0 ablehnen.
D.h. die Behandlung führt zu einem signifikant höheren Gewicht.
33
Varianzanalyse
Varianzanalyse od. ANOVA
• Frage: Hat ein Faktor Einfluss auf ein Merkmal?
• Faktor: Nominal skalierte Größe, Faktorausprägungen = Ebenen oder Stufen
• Merkmal (durch Faktor beeinflusst): Metrische Größe
34
Varianzanalyse
Varianzanalyse
• Einfache Varianzanalyse: Ein Faktor
• Zweifache Varianzanalyse: Zwei Faktoren
• …
35
Varianzanalyse
• Test, für arithmetische Mittel von zwei oder mehr Grundgesamtheiten. – Test, ob die Differenz der arithmetischen Mittel
von zwei oder mehr als zwei Grundgesamtheiten signifikant von Null verschieden ist.
36
Varianzanalyse
• Modellannahmen der Varinazanalyse: – Unabhängigkeit der Stichproben (i=1,…,r)
– Normalverteilung der Merkmale mit µi und σi²
– Varianzhomogenität (Homoskedastizität), d.h. σi² = σ²
37
Varianzanalyse
• Nullhypothese: Alle Gruppen haben den gleichen Mittelwert µ
H0: µ1 = µ2 = … = µ
• Alternativhypothese: Nicht alle Gruppen haben den gleichen Mittelwert µ
H1: mindestens zwei µi sind ungleich
38
Varianzanalyse
• Frage: Beeinflusst der Faktor (nominal-skalierte Größe) das Merkmal (metrisch-skalierte Größe)?
• Unter H0: µi = µ für alle i (i = 1,…,r Faktorstufen).
• Abweichung, die dem Faktor zuzuschreiben sind: αi = µi - µ (i = 1,…,r) heißen wahre Effekte auf der i-ten Ebene.
39
Varianzanalyse
• Modell der einfachen Varianzanalyse:
• xij = µ + αi + eij – µ … Gesamtmittelwert
– αi … Effekt auf der i-ten Ebene
– eij … Versuchsfehler = die Abweichung eines zufällig aus der i-ten Ebene des Faktors herausgegriffenen Beobachtungswertes xik vom Mittelwert µi dieser Ebene.
eij = xij – µi = xij – (µ + αi)
40
Varianzanalyse
• Beispiel: Zugfestigkeit von r = 3 Drahtsorten überprüfen, je Sorte 6 Proben, unabhängig voneinander und N(µi,σ²)-vt. Frage: Bestehen signifikante Unterschiede in der Zugfestigkeit?
i Drahtsorte
j 1 2 3
1 9 7,3 18
2 15,4 15,6 9,6
3 8,2 14,2 11,5
4 3,9 13 19,4
5 7,3 6,8 17,1
6 10,8 9,7 14,4
41
Varianzanalyse
Vorgehensweise:
• Gesamtmittelwert aller Faktorstufen und Mittelwerte der Faktorstufen bestimmen
• Bestimmung der Abweichungen
• Zerlegung der Abweichungsquadratsumme
• Teststatistik und Testverteilung bestimmen
• Entscheidung, Interpretation
42
Varianzanalyse
• Gesamtmittelwert über alle Faktorstufen r
• Mittelwerte der r Faktorstufen
inr
iji=1 j=1
1x = x
N
in
i ijj=1i
1x = x
n
43
Varianzanalyse
• Beispiel: Drahtsorteni Drahtsorte
j 1 2 3 x..
1 9 7,3 18
2 15,4 15,6 9,6
3 8,2 14,2 11,5
4 3,9 13 19,4
5 7,3 6,8 17,1
6 10,8 9,7 14,4
xi. 9,1 11,1 15 11,7
44
Varianzanalyse
• Abweichungen: Quadratsumme der Abweichungen (Sum of Squares)– Abweichungen der Beobachtungen vom
Gesamtmittelwert.
– Summe der Quadratischen Abweichungen– Bezeichnungen: SST (Total), SSG (Gesamt)
inr2
iji=1 j=1
SST= (x -x )
45
Varianzanalyse
• Sum of Squares:– Abweichungen der Beobachtungen der
einzelnen Messreihen vom Mittelwert der jeweiligen Messreihe.
– Summe der Quadratischen Abweichungen des Restes, Maß für die nicht durch den Faktor beeinflusste Restvariabilität
– Bezeichnungen: SSW (Within), SSE (Error), SSR (Residual).
inr2
ij ii=1 j=1
SSW= (x -x )
46
Varianzanalyse
• Sum of Squares:– Abweichungen der Mittelwerte der einzelnen
Messreihen vom Gesamtmittelwert.
– Mit Stichprobengröße multiplizierte Summe der Quadratischen Abweichungen der Stichprobenmittelwerte vom Gesamtmittelwert, also der beobachteten Effekte des Faktors.
– Bezeichnungen: SSB (Between), SSE (Explained), SSM (Model), SST (Treatment),
r2
i ii=1
SSB= n (x -x )
47
Varianzanalyse
• Quadratsummenzerlegung:
• SST = SSB + SSW
• Interpretation: Gesamtvarianz (SST) setzt sich aus der Variation zwischen den Messreihen (SSB) und der Variation innerhalb der Messreihen (SSW) zusammen.
i in nr r r2 2 2
ij i i ij ii=1 j=1 i=1 i=1 j=1
(x -x ) n (x -x ) (x -x )
48
Varianzanalyse
• Idee für Test: – Vergleich der Variation zwischen den
Messreihen mit der Variation innerhalb der Messreihen
– Ist die Variation zwischen den Messreihen größer als jene innerhalb der Messreihen, schließe auf Unterschied zwischen den Messreihen (Faktoreffekt).
49
Varianzanalyse
• Teststatistik – Idee: – Aus den Beobachtungswerten werden zwei
voneinander unabhängige Schätzwerte für sW² und sB² für die Varianzen der Beobachtungswerte innerhalb und zwischen den Stichproben bestimmt.
– Liegen keine wahren Effekte vor (Gültigkeit von H0), sind sW² und sB² (bis auf zufällige Abweichungen) gleich.
– Bei Vorhandensein von wahren Effekten (H1) ist sB² systematisch größer als sW².
50
Varianzanalyse
• Erwartungstreuer Schätzer für die Varianz innerhalb der Messreihen (Restvarianz):
• Erwartungstreuer Schätzer für die Varianz zwischen den Messreihen (Faktoreffekt)
inr2 2W ij i
i=1 j=1
1s = (x -x )
N-r
r2 2B i i
i=1
1s = n (x -x )
r-1
51
Varianzanalyse
• Mittlere Quadratsummen (MSS = Mean Sum of Squares):
• Quadratsummen dividiert durch entsprechende Freiheitsgrade
• MSB und MSW sind erwartungstreue Schätzer der Varianz zwischen- und innerhalb der Messreihen.
52
Varianzanalyse
• Varianzanalysetafel (r Messreihen):
Streuungs-ursache
Freiheits-grade (DF)
Quadrat-summe (SS)
Mittlere Quadratsumme (MS)
Unterschied zw Messreihen
r-1 SSB (Between)
MSB = SSB / (r-1)
Zufälliger Fehler
N-r SSW
(Within)
MSW = SSW / (N-r)
Gesamt N-1 SST
(Total)
53
Varianzanalyse
Teststatistik:
• F = MSB / MSW
• F ~ F(r-1),(N-r)
• Entscheidung: Ist F ≤ Fc, lehne H0 nicht ab (Fc = kritischer Wert der F-Verteilung mit (r-1) und (N-r) Freiheitsgraden).
54
Varianzanalyse
• Beispiel: Drahtsorten• Quadratsummenzerlegung: SST = SSB + SSW
– 324,62 = 108,04 + 216,58
• Mittlere Quadratsummen: – MSB = 108,04 / (3-1) = 54,02– MSW = 216,58 / (18-3) = 14,44
• Teststatistik: – F = MSB / MSW = 3,74
• Kritischer Wert der F2;15 Vt. 3,68• Entscheidung: 3,74 > 3,68 => H0 ablehnen, d.h. es
besteht ein signifikanter Unterschied zw. den Sorten
55
Varianzanalyse
• Zweifache Varianzanalyse: – 2 Faktoren (A und B, wobei r Faktorstufen bei
A und p Faktorstufen bei B)– 1 metrische Variable
• Unterscheidung: – Modell ohne Wechselwirkungen zw. den
Faktoren– Modell mit Wechselwirkungen zw. den
Faktoren
56
Varianzanalyse
• Modell ohne Wechselwirkungen zw. den Faktoren
• xijk = µ + αi + βj + eijk (für i=1,…,r, j=1,…,p, k=1,…,n)– µ gemeinsamer Mittelwert– α, β Faktoreffekte
– eijk zufällige Fehler
57
Varianzanalyse
• Mittelwerte:
• Gesamt
• Faktor A
• Faktor B
pr n
ijki=1 j=1 k=1
1x = x
rpn p n
i ijkj=1 k=1
1x = x
pn r n
j ijki=1 k=1
1x = x
rn
58
Varianzanalyse
• Schätzer für Gesamtmittel und Effekte
• Gesamtmittel
• Effekt von Faktor A
• Effekt von Faktor B
m=x
i ia =x -m
j jb =x -m
59
Varianzanalyse
• Quadratsummen
•
•
•
• SSR = SST – SSE(A) – SSE(B)
pr n2
ijki=1 j=1 k=1
SST= (x -x )r
2i
i=1
SSE(A)=pn ap
2j
j=1
SSE(B)=rn b
60
Varianzanalyse
• Quadratsummenzerlegung– SST = SSE(A) + SSE(B) + SSR
• Mittlere Quadratsummen:– MSE(A) = SSE(A) / (r-1)– MSE(B) = SSE(B) / (p-1)– MSR = SSR / (rpn-r-p+1)
61
Varianzanalyse
• Prüfgrößen und kritische Werte:
• Faktor A: – F(A) = MSE(A) / MSR
– Fr-1,(nrp-r-p+1);1-α
• Faktor B: – F(B) = MSE(B) / MSR
– Fp-1,(nrp-r-p+1);1-α
62
Varianzanalyse
• Beispiel: 2 Faktoren (Erreger, Antibiotikum)Erreger i
(A) Antibiotikum j (B)
1 2 3 Mittelwerte Schätzer ai
k
1 1 38 40 38
2 35 41 39 38,5 0,667
2 1 42 39 33
2 45 33 34 37,7 -0,167
3 1 38 38 33
2 41 38 36 37,3 -0,500
Mittelwerte 39,8 38,2 35,5 37,8
Schätzer bj 2,000 0,333 -2,333
63
Varianzanalyse
• Modell mit Wechselwirkungen zw. den Faktoren
• xijk = µ + αi + βj + (αβ)ij + eijk (für i=1,…,r, j=1,…,p, k=1,…,n)– µ gemeinsamer Mittelwert– α, β Faktoreffekte– αβ Wechselwirkung
– eijk zufällige Fehler
64
Varianzanalyse
• Mittelwerte:
• Gesamt
• Faktor A
• Faktor B
• Wechselwirkung
pr n
ijki=1 j=1 k=1
1x = x
rpn p n
i ijkj=1 k=1
1x = x
pn r n
j ijki=1 k=1
1x = x
rn n
ij ijkk=1
1x = x
n
65
Varianzanalyse
• Gesamtmittel und Effekte
• Gesamtmittel
• Effekt von Faktor A
• Effekt von Faktor B
• Effekt der Wechselwirkung
m=x
i ia =x -m
j jb =x -m
ij ij i j(ab) =x -a -b -m
66
Varianzanalyse
• Quadratsummen
SSR = SST – SSE(A) – SSE(B) – SSE(AB)
pr n2
ijki=1 j=1 k=1
SST= (x -x )r
2i
i=1
SSE(A)=pn ap
2j
j=1
SSE(B)=rn bpr
2ij
i=1 j=1
SSE(AB)=n (ab)
67
Varianzanalyse
• Quadratsummenzerlegung– SST = SSE(A) + SSE(B) + SSE(AB) + SSR
• Mittlere Quadratsummen:– MSE(A) = SSE(A) / (r-1)– MSE(B) = SSE(B) / (p-1)– MSE(AB) = SSE(AB) / (p-1)(r-1)– MSR = SSR / (rpn-r-p+1)
68
Varianzanalyse
• Prüfgrößen und kritische Werte: • Faktor A:
– F(A) = MSE(A) / MSR
– Fr-1, pr(n-1); 1-α
• Faktor B: – F(B) = MSE(B) / MSR
– Fp-1, pr(n-1); 1-α
• Wechselwirkung: – F(AB) = MSE(AB) / MSR
– F(p-1)(r-1), pr(n-1); 1-α
69
Varianzanalyse
• Beispiel: 2 Faktoren + Wechselwirkung
Erreger i Antibiotikum j (Faktor B)
(Faktor A) 1 2 3 xi.. ai
k xi1k xi1. (ab)i1 xi2k xi2. (ab)i2 xi3k xi3. (ab)i3
1 1 38
36,5 -4,000
40
40,5 1,667
38
38,5 2,333
2 35 41 39 38,5 0,667
2 1 42
43,5 3,833
39
36 -2,000
33
33,5 -1,833
2 45 33 34 37,7 -0,167
3 1 38
39,5 0,167
38
38 0,333
33
34,5 -0,500
2 41 38 36 37,3 -0,500
x.j. 39,8 38,2 35,5 37,8
bj 2,000 0,333 -2,333
70
Varianzanalyse
• Beispiel: Varianzanalysetafel
• Faktor Erreger: kein Effekt
• Faktor Antibiotikum: Effekt
• Interaktion: Effekt (impliziert, dass auch Faktor Erreger eine Wirkung hat).
Streuungs-ursache
Freiheits-grade
Quadrat-summe
Mittlere Quadrats.
Test-statistik
Kritischer Wert
Erreger 2 4,33 2,16667 0,52 4,26
Antibiotikum 2 57,33 28,6667 6,88 4,26
Interaktion 4 93,33 23,3333 5,60 3,63
Fehler 9 37,50 4,16667
Total 17 192,5
71
VarianzanalyseErreger - Antibiotikum
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
0 1 2 3 4
Antibiotikum
Mit
telw
ert
e
Erreger 1
Erreger 2
Erreger 3
72
Nichtparametrische ANOVA
• Kruskal-Wallis Test• Unterscheiden sich die Mittelwerte von p
Messreihen (n1, …, np)? • Voraussetzungen:
– Stetige Verteilung der Messreihen – Mindestens Ordinalskala – Setzt weder Normalverteilung, noch
Varianzhomogenität voraus.
• Hypothese: – H0: Mittelwerte der p Messreihen sind gleich – H1: Mittelwerte unterscheiden sich
73
Nichtparametrische ANOVA
• Vorgehensweise:– N Messwerten X11, …, Xpnp werden Rangzahlen
rij zugewiesen.
– Summe der Ränge der einzelnen Messreihen berechnen:
– Bindungen (mehrere Messwerte sind gleich): Mittelwert der Ränge
in
i ijj=1
r = r
74
Nichtparametrische ANOVA
• Prüfgröße:
– g … Anzahl der verschiedenen Messwerte– t … wie oft tritt ein Messwert auf– Treten keine Bindungen auf, ist B = 1
p2i
i=1 i
1 12 1H= r -3(N+1)
B N(N+1) n
g
3l3
i=1
1B=1- (t -t)
N -N
75
Nichtparametrische ANOVA
• Entscheidung:– H0 ablehnen, wenn H > hp(n1,…,np);1-α
– h … kritische Werte (Tabelle, z.B. Hartung S. 615)
• Approximation durch χ²p-1,1-α Verteilung: – H0 ablehnen, wenn H > χ²p-1,1-α (Quantile der χ²
Verteilung)
top related