statistik ii f£¼r betriebswirte vorlesung 3 large sample test statistic = 1,33631...

Download Statistik II f£¼r Betriebswirte Vorlesung 3 Large sample test statistic = 1,33631 (continuity correction

Post on 18-Oct-2020

0 views

Category:

Documents

0 download

Embed Size (px)

TRANSCRIPT

  • Statistik II für Betriebswirte Vorlesung 3

    Dr. Andreas Wünsche

    TU Bergakademie Freiberg Institut für Stochastik

    28. Oktober 2019

    Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 1

  • 4.3.2 Tests für zwei verbundene Stichproben

    I Liegen zwei Stichproben vor, deren Werte einander paarweise zugeordnet sind, spricht man von verbundenen Stichproben.

    I Diese entstehen z.B. dann, wenn man jeweils zwei Merkmale an ein und demselben statistischen Objekt beobachtet.

    I Beispiele: I Messwerte für die Wirkungen jeweils zweier Medikamente für jeweils

    ein und denselben Patienten; I Wert der Bestellungen einer Kundengruppe vor (1. Stichprobe) und

    nach (2. Stichprobe) einer Werbeaktion.

    I Die mathematische Modellierung erfolgt über zwei endliche Folgen X1,X2, . . . ,Xn und Y1,Y2, . . . ,Yn von jeweils n Zufallsgrößen.

    I Dabei sind die Zufallsgrößen innerhalb einer Folge stochastisch unabhängig, aber für jedes i = 1, . . . , n können die Zufallsgrößen Xi und Yi abhängig sein.

    I Eine verbundene (mathematische) Stichprobe wird also durch unabhängige Zufallsvektoren (X1,Y1), . . . , (Xn,Yn) modelliert.

    Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 2

  • Erwartungswertvergleich verbundener normalverteilter Stichproben

    I Geg.: zwei abh. Merkmale X ∼ N(µX , σ2X ) , Y ∼ N(µY , σ2Y ) ; entsprechend verbundene Stichprobe vom Umfang n , d.h. (X1,Y1), . . . , (Xn,Yn) .

    I Grundlage: Ist der Zufallsvektor (X ,Y ) normalverteilt, dann ist die Differenz D = X − Y normalverteilt mit dem Erwartungswert

    µD = ED = EX − EY = µX − µY .

    I Ein Test zum Beispiel mit

    H0 : µX = µY , HA : µX 6= µY ,

    kann dann als Test

    H0 : µD = 0 , HA : µD 6= 0 ,

    für die normalverteilte Stichprobe D1, . . . ,Dn durchgeführt werden (Einstichproben-t-Test).

    Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 3

  • Vorzeichentest für verbundene Stichprobe

    I Voraussetzung: Verbundene Stichprobe (X1,Y1), . . . , (Xn,Yn) , so dass die Differenzzufallsgrößen Di = Xi − Yi eine stetige Verteilungsfunktion FD besitzen.

    I Man bildet Differenzen: Di = Xi − Yi , i = 1, . . . , n . I Hypothesen: H0 : D0.5 = 0 , HA : D0.5 6= 0 (zweiseitiger Test). I Man verwendet den Vorzeichentest von oben zur Stichprobe der

    Differenzen D1, . . . ,Dn mit Median gleich 0 .

    I Treten Stichprobenwerte auf, die mit dem Median übereinstimmen, können diese (z.B.) weggelassen werden. Dann bleibt der Test konservativ, d.h. die Irrtumswahrscheinlichkeit 1. Art wird nicht vergrößert.

    I Vorzeichentests können auch für nichtstetige Zufallsgrößen durchgeführt werden. Dann testet man z.B. die Hypothese H0 : P(D > 0) = P(D < 0) .

    Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 4

  • Beispiel 4.5: Returns von 2 Fonds

    I Returns in % von 2 Fonds (Fond A, Fond B) in 15 Monaten.

    I Daten: (Quelle: Aczel, Sounderpandian: Complete Business Statistics, 2006, S.645)

    A: 12 11 14 10 12 8 16 13 12 10 6 9 16 13 10

    B: 14 15 16 9 10 8 18 12 17 13 10 12 15 19 14

    Sign(A−B): − − − + + − + − − − − + − −

    I Aufgabe: Durchführung des Vorzeichentests zur Untersuchung, ob beide Fonds

    ” gleich“ sind.

    I Hypothesen: H0 : D0.5 = 0 , HA : D0.5 6= 0 mit D = A− B .

    I 4 Monate A > B ; 1 Monat A = B ; 10 Monate A < B .

    I Damit ist t = 4.

    Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 5

  • Beispiel 4.5: Returns von 2 Fonds

    I Kritischer Bereich für n′ = 14 = 15− 1 , α = 0.05 : K = {0, 1, 2} ∪ {12, 13, 14} .

    I t = 4 6∈ K =⇒ H0 wird angenommen =⇒ Zwischen den beiden Fonds gibt es keine signifikanten Unterschiede.

    I in Statgraphics :

    Hypothesis Tests for Fond A - Fond B

    sign test

    Null hypothesis: median = 0

    Alternative: not equal

    Number of values below hypothesized median: 10

    Number of values above hypothesized median: 4

    Large sample test statistic = 1,33631 (continuity correction applied)

    P-Value = 0,181449

    Do not reject the null hypothesis for alpha = 0,05.

    Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 6

  • Vorzeichen-Rangtest nach Wilcoxon

    I Mit dem Vorzeichen-Rangtest (Symmetrie-Test) nach Wilcoxon (oder Wilcoxon-Vorzeichen-Rangtest) kann man die Verteilung einer Zufallsgröße auf Symmetrie untersuchen.

    I Die Verteilung von X ist symmetrisch zum Punkt M, falls für beliebige x ∈ R gilt: P(X < M − x) = P(X > M + x) . In diesem Fall ist M auch der Median der Zufallsgröße.

    I Ist für zwei verbundene Stichproben die Differenzzufallsgröße symmetrisch zum Median verteilt, kann der Test für stetige Differenzzufallsgrößen wie der einfache Vorzeichentest für verbundene Stichproben durchgeführt werden, d.h. z.B. H0 : D0.5 = 0 , HA : D0.5 6= 0 .

    I Die Güte dieses Tests ist besser als die Güte eines entsprechenden einfachen Vorzeichentests, da hier die Größe der Differenzen mit berücksichtigt wird.

    Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 7

  • Wilcoxon-Vorzeichen-Rangtest: Rangzahlen

    I Vorgehen: Man ordnet die Beträge der Differenzen und vergibt Rangzahlen R+i . Dabei erhält der kleinste Wert die Rangzahl 1 und der größte Wert die Rangzahl n . Tritt ein Wert mehrfach auf, erhalten (z.B.) alle diese Werte den arithmetischen Mittelwert der zugehörigen Ordnungsnummern als Rangzahl.

    I Außerdem verwendet man die Indikatorgrößen

    Zi :=

    { 1 , falls Di > 0 , 0 , falls Di < 0 .

    Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 8

  • Beispiel 4.6: Bestellungen vor und nach einer Werbeaktion

    I Wert von Bestellungen vor und nach einer Werbeaktion:

    vor (Xi ) 171.2 332.9 230.6 200.7 238.7

    nach (Yi ) 238.7 260.1 203.1 133.2 171.2

    Differenz (Di = Xi − Yi ) -67.5 72.8 27.5 67.5 67.5 Beträge Differenz 67.5 72.8 27.5 67.5 67.5

    Ordnungsnummern 2-4 5 1 2-4 2-4

    Rangzahlen (R+i ) 3 5 1 3 3

    Indikatorgrößen Zi 0 1 1 1 1

    Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 9

  • Wilcoxon-Vorzeichen-Rangtest: Testgröße, krit. Bereich

    I Testgröße: T = W+n := n∑

    i=1

    R+i · Zi .

    I Es gilt n∑

    i=1

    R+i = n∑

    i=1

    i = n(n + 1)

    2 .

    I Kritischer Bereich: K = {t : t ≤ w+n;α/2} ∪ {t : t ≥ w + n,1−α/2} .

    I Die Quantile w+n;α/2 und w + n,1−α/2 kann man aus Tabellen ablesen

    (z.B. im Anhang der Formelsammlung).

    I Es gilt w+n,1−α/2 = n(n + 1)

    2 − w+n;α/2 .

    I Für große n (n ≥ 20) gilt: T = W+n −

    n(n+1) 4√

    n(n+1)(2n+1) 24

    ist näherungsweise standardnormalverteilt ⇒ Quantile der Standardnormalverteilung können genutzt werden.

    Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 10

  • Beispiel 4.6: Bestellungen vor und nach einer Werbeaktion

    I Wert von Bestellungen vor und nach einer Werbeaktion:

    vor (Xi ) 171.2 332.9 230.6 200.7 238.7

    nach (Yi ) 238.7 260.1 203.1 133.2 171.2

    Differenz (Di = Xi − Yi ) -67.5 72.8 27.5 67.5 67.5 Beträge Differenz 67.5 72.8 27.5 67.5 67.5

    Rangzahlen (R+i ) 3 5 1 3 3

    Indikatorgrößen Zi 0 1 1 1 1

    I H0 : D0.5 = 0 , HA : D0.5 6= 0 ; α = 0.1 .

    I Aus der Tabelle: w+5;0.95 = 5·6 2 − w

    + 5;0.05 = 15− 0 = 15

    ⇒ K = {0} ∪ {15} .

    I W+5 = 3 + 1 + 5 + 3 = 12 6∈ K ⇒ H0 wird nicht abgelehnt, die Unterschiede sind nicht signifikant.

    Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 11

  • 4.4 Verteilungstests

    I Eine weitere Klasse von Tests beschäftigt sich mit der Prüfung, ob die Werte der Stichprobe aus einer Grundgesamtheit mit einer speziellen hypothetischen Verteilungsfunktion stammen.

    I Ausführlicher wird hier der χ2−Anpassungstest behandelt.

    I Kurz vorgestellt werden auch der Kolmogorow-Smirnow-Test (auch Kolmogorow-Anpassungstest genannt) und der Shapiro-Wilk-Test.

    I Weitere Tests, die zum Teil für ganz bestimmte Typen von Verteilungsfunktionen entwickelt wurden, kann man in der Literatur finden.

    Dr. Andreas Wünsche Statistik II für Betriebswirte Vorlesung 3 Version: 15. Oktober 2019 12

  • Der χ2−Anpassungstest

    I Test, ob die vorliegende Stichprobe aus einer Grundgesamtheit mit einer hypothetischen Verteilungsfunktion F0 entstammt .

    I Prinzipielles Vorgehen: I Klasseneinteilung der Stichprobe; I Vergleich mit der hypothetischen Verteilung; I falls die Abweichungen zu groß sind, erfolgt eine Ablehnung der

    Nullhypothese.

    I Dieser Test ist ein asymptotischer Test, d.h. man rechnet mit der asymptotischen Verteilung (für n→∞) der Testgröße unter H0 .

    I Hypothesen:

    H0 : F (x) = F0(x) , x ∈ R , F0 ist eine Verteilungsfunktion,

    z.B. F0(x) = Φ