doktorandenseminar statistik vetdocsteil3 · multiple paarvergleiche (t-test, wilcoxon) oder...

PD Dr. Sven Reese, LMU München 1

Hypothesenbasierende Hypothesenbasierende

UntersuchungenUntersuchungen

Hypothesenbasierende Hypothesenbasierende

UntersuchungenUntersuchungen

• Unterschiedshypothesen

• Zusammenhangshypothesen

• Veränderungshypothesen

• Äquivalenzhypothesen


Definition: wissenschaftliche Definition: wissenschaftliche

HypotheseHypothese

Eine wissenschaftliche Hypothese Eine wissenschaftliche Hypothese behauptet eine mehr oder weniger prbehauptet eine mehr oder weniger prääzise zise

Beziehung zwischen zwei oder mehr Beziehung zwischen zwei oder mehr Variablen, die fVariablen, die füür eine bestimmte r eine bestimmte

Population vergleichbarer Objekte oder Population vergleichbarer Objekte oder ErgeignisseErgeignisse gelten soll.gelten soll.

wissenschaftlich interessante wissenschaftlich interessante

FragestellungenFragestellungen

⇒⇒

ÜÜberfberfüührung in wissenschaftliche hrung in wissenschaftliche

HypothesenHypothesen

(Hypothese = gr. Vermutung)(Hypothese = gr. Vermutung)


4 Kriterien einer 4 Kriterien einer

wissenschaftlichen Hypothesewissenschaftlichen Hypothese

1.1.reale Sachverhalte, die reale Sachverhalte, die

empirisch empirisch untersuchbaruntersuchbar sindsind

2.2. Allgemein gAllgemein güültige ltige üüber den ber den

Einzelfall hinausgehende Einzelfall hinausgehende

BehauptungBehauptung

4 Kriterien einer 4 Kriterien einer

wissenschaftlichen Hypothesewissenschaftlichen Hypothese

3.3.Konditionalsatz Konditionalsatz

((wennwenn--danndann oder oder jeje--destodesto))

4.4. Behauptung muss falsifizierbar Behauptung muss falsifizierbar

sein sein

(es m(es müüssen Ereignisse denkbar ssen Ereignisse denkbar

sein, die dem Konditionalsatz sein, die dem Konditionalsatz

widersprechen)widersprechen)


WennWenn--TeilTeil (Bedingung)(Bedingung)

undund

DannDann--TeilTeil

(Folge, Konsequenz)(Folge, Konsequenz)

einer Hypothese stelleneiner Hypothese stellen

AusprAuspräägungen von gungen von

VariablenVariablen dar. dar.

WennWenn--TeilTeil⇒⇒

unabhunabhäängige Variablengige Variable

DannDann--TeilTeil

⇒⇒

abhabhäängige Variablengige Variable. .


ungerichtete Hypothesenungerichtete Hypothesen

(zweiseitige Fragestellung)(zweiseitige Fragestellung)

--

gerichtete Hypothesengerichtete Hypothesen

(einseitige Fragestellung)(einseitige Fragestellung)

EffektgrEffektgrößößee

-- Enge des postulierten Enge des postulierten

ZusammenhangsZusammenhangs

-- GrGrößöße des postulierten e des postulierten

UnterschiedsUnterschieds


Gibt es eine Vermutung Gibt es eine Vermutung üüber die ber die

KausalbeziehungKausalbeziehung, der in der , der in der

Hypothese postulierten Hypothese postulierten

VariablenbeziehungVariablenbeziehung??????

wissenschaftliche Hypothesewissenschaftliche Hypothese

⇒⇒

ÜÜberfberfüührung in statistische hrung in statistische

HypothesenHypothesen


Statistische HypotheseStatistische Hypothese

Welche quantitativen MaWelche quantitativen Maßße e

kköönnen die nnen die VariablenbeziehungVariablenbeziehung

am besten beschreiben?am besten beschreiben?


Bezieht sich auf Bezieht sich auf

Gesamtpopulation, der Gesamtpopulation, der

Stichproben zugrunde liegtStichproben zugrunde liegt⇒⇒

Stichprobenkennwerte werden in griechischen Stichprobenkennwerte werden in griechischen

Buchstaben angegebenBuchstaben angegeben



Definiert als Annahme Definiert als Annahme üüber die ber die

Verteilung einer Zufallsvariablen Verteilung einer Zufallsvariablen

oder eines Parameters dieser oder eines Parameters dieser

VerteilungVerteilung⇒⇒

Bei statistischen Hypothesen handelt es sich um Bei statistischen Hypothesen handelt es sich um

WahrscheinlichkeitsaussagenWahrscheinlichkeitsaussagen

Statistische HypothesenStatistische Hypothesen

sind sind

WahrscheinlichkeitsaussagenWahrscheinlichkeitsaussagen⇒⇒

Hypothese kann Hypothese kann nichtnicht durch durch

Nachweis einzelner Gegenbeispiele Nachweis einzelner Gegenbeispiele

widerlegt (falsifiziert)widerlegt (falsifiziert) werden.werden.


Problem!Problem!

Statistische HypothesenStatistische Hypothesen

sind sind

WahrscheinlichkeitsaussagenWahrscheinlichkeitsaussagen⇒⇒

Hypothese kann auchHypothese kann auch nicht nicht durch durch Nachweis vieler Positivbeispiele Nachweis vieler Positivbeispiele

bestbestäätigttigt (verifiziert) (verifiziert) werden.werden.

LLöösung!sung!

(willk(willküürlich) festgelegte rlich) festgelegte

PrPrüüfkriterien erzeugen fkriterien erzeugen

FalsifizierbarkeitFalsifizierbarkeit⇒⇒

Wichtigstes PrWichtigstes Prüüfkriterium ist die fkriterium ist die statistische Signifikanzstatistische Signifikanz

(eingef(eingefüührt von Fischer 1925)hrt von Fischer 1925)


Beachte!Beachte!

Statistisch nicht falsifizierte Statistisch nicht falsifizierte

(=signifikante) Beziehung (=signifikante) Beziehung

zwischen Variablenzwischen Variablen

≠≠

bestbestäätigte Kausalbeziehungtigte Kausalbeziehung

monokausale Hypothesemonokausale Hypothese

UnabhUnabhäängige Variable erklngige Variable erkläärt rt

praktisch die gesamte Variabilitpraktisch die gesamte Variabilitäät t

der abhder abhäängigen Variablengigen Variable⇒⇒

extrem seltene Konstellationextrem seltene Konstellation

Normalerweise hat man multikausale Normalerweise hat man multikausale

KonstellationenKonstellationen


multikausale Verhmultikausale Verhäältnisseltnisse

⇒⇒

der Anspruch eines vollstder Anspruch eines vollstäändigen ndigen

ErklErkläärungsmodells ist von rungsmodells ist von

vornherein zum Scheitern vornherein zum Scheitern

verurteiltverurteilt

AussagekraftAussagekraft

interne Validitinterne Validitäätt

(Eindeutigkeit)(Eindeutigkeit)

vsvs

externe Validitexterne Validitäätt(Generalisierbarkeit)(Generalisierbarkeit)


Relativer ErklRelativer Erkläärungswert rungswert

mehrerer unabhmehrerer unabhäängiger ngiger

VariablenVariablen

⇒⇒

TherorieTherorie

((theoriatheoria gr. Erforschung der gr. Erforschung der

Wahrheit)Wahrheit)

TheorieTheorie

⇒⇒

soll Sachverhalte beschreiben, soll Sachverhalte beschreiben,

erklerkläären und vorhersagen ren und vorhersagen

kköönnennnen

Kein Anspruch auf absolute Kein Anspruch auf absolute

WahrheitWahrheit


TheorieTheorie

Kann durch Stichproben nicht Kann durch Stichproben nicht

sicher verifiziert werdensicher verifiziert werden

Kann durch Falsifikation Kann durch Falsifikation

eingeschreingeschräänkt oder gekippt nkt oder gekippt

werdenwerden

Interpretation statistischer Interpretation statistischer

HypothesenprHypothesenprüüfungenfungen

Daten geben nur die Grundlage zur Daten geben nur die Grundlage zur

Entscheidung fEntscheidung füür oder gegen eine r oder gegen eine

Hypothese Hypothese –– eine Fehlentscheidung eine Fehlentscheidung

kann nie ausgeschlossen werdenkann nie ausgeschlossen werden


Praktische DurchfPraktische Durchfüührung einer hrung einer

UntersuchungUntersuchung

Ausgangspunkt ist Ausgangspunkt ist idealerweiseidealerweise eine eine TheorieTheorie

⇒⇒

Ableitung einer inhaltlichen HypotheseAbleitung einer inhaltlichen Hypothese

⇒⇒

Formulierung einer statistischen Formulierung einer statistischen HypotheseHypothese

Statistische HypothesenprStatistische Hypothesenprüüfungfung

Bildung eines HypothesenpaaresBildung eines Hypothesenpaares

Alternativhypothese (HAlternativhypothese (H11))

vsvs

Nullhypothese (HNullhypothese (H00))


Statistische HypothesenprStatistische Hypothesenprüüfungfung

Alternativhypothese postuliert einen Alternativhypothese postuliert einen

bestimmten Effekt, den die bestimmten Effekt, den die

Nullhypothese negiertNullhypothese negiert

SignifikanzniveauSignifikanzniveau

Konvention 5% oder 1%Konvention 5% oder 1%

⇒⇒

Nur wenn die Nur wenn die

Irrtumswahrscheinlichkeit unter 5 % Irrtumswahrscheinlichkeit unter 5 %

(1%) liegt ist die Annahme der (1%) liegt ist die Annahme der

Alternativhypothese akzeptabelAlternativhypothese akzeptabel


SignifikanzniveauSignifikanzniveau

IrrtumswahrscheinlichkeitIrrtumswahrscheinlichkeit

==

αα--FehlerFehler--WahrscheinlichkeitWahrscheinlichkeit==

Wahrscheinlichkeit, dass die Wahrscheinlichkeit, dass die

Nullhypothese stimmtNullhypothese stimmt

Problem!Problem!

Mit steigendem Mit steigendem

Stichprobenumfang geht die Stichprobenumfang geht die

IrtumswahrscheinlichkeitIrtumswahrscheinlichkeit gegen gegen

NullNull⇒⇒

Nullhypothese hat keine Chance.Nullhypothese hat keine Chance.


LLöösung!sung!

Festlegung einesFestlegung eines biologisch biologisch

relevantenrelevanten (Mindest(Mindest--))

UnterschiedesUnterschiedes

==

EffektgrEffektgrößößee

ββ--FehlerFehler--WahrscheinlichkeitWahrscheinlichkeit

==

Wahrscheinlichkeit, dass die korrekte Wahrscheinlichkeit, dass die korrekte

Alternativhypothese irrtAlternativhypothese irrtüümlich mlich

ausgeschlossen wirdausgeschlossen wird


Problem!Problem!

Mit sinkendem Mit sinkendem

Stichprobenumfang geht die Stichprobenumfang geht die

ββ--FehlerFehler--WahrscheinlichkeitWahrscheinlichkeitgegen 100%gegen 100%

⇒⇒

Alternativhypothese hat keine Alternativhypothese hat keine

Chance.Chance.

LLöösung!sung!

Festlegung einer maximalen Festlegung einer maximalen

HHööhe des he des ββ--FehlersFehlers⇒⇒

KonventionKonvention

ββ--FehlersFehlers = 4 x = 4 x αα--FehlerFehler

⇒⇒ 20 %20 %


TeststTeststäärke oder Powerrke oder Power

Wahrscheinlichkeit, dass ein Wahrscheinlichkeit, dass ein

Signifikanztest zugunsten der Signifikanztest zugunsten der

Alternativhypothese entscheidetAlternativhypothese entscheidet

==

1 1 -- ββ--FehlerFehler

Optimaler StichprobenumfangOptimaler Stichprobenumfang

TeststTeststäärke bei 80 %rke bei 80 %

grgrößößeres n eres n ⇒⇒ irrelevante Unterschiede irrelevante Unterschiede werden erkanntwerden erkannt

kleineres n kleineres n ⇒⇒ Gefahr der fehlerhaften Gefahr der fehlerhaften Ablehnung der AlternativhypotheseAblehnung der Alternativhypothese


TeststTeststäärke oder Powerrke oder Power

Einflussfaktoren:Einflussfaktoren:

1.1.SignifikanzniveauSignifikanzniveau

2.2. EffektgrEffektgrößößee

3.3. StichprobenumfangStichprobenumfang

4.4. gerichtete gerichtete –– ungerichtete Fragestellungungerichtete Fragestellung

Berechnung des optimalen Stichprobenumfangs

• keine biologisch relevante Differenz (Effektgröße) definiert⇒ Berechnung nicht möglich

• Effektgröße und Varianz in den Stichproben bekannt⇒ Berechnung für normalverteilteStichproben sicher möglich


Software zur Berechnung der Software zur Berechnung der

PowerPower

1.1.G*PowerG*Power 3.01.0 (Freeware)3.01.0 (Freeware)

2.2. SPSS Sample PowerSPSS Sample Power

3.3. BIAS fBIAS füür Windowsr Windows


Hypothesenprüfende Untersuchungen

1.Unterschiedshypothesen

2.Zusammenhangshypothesen

3.Veränderungshypothesen

4.Nullhypothese soll bestätigt werden⇒ Äquivalenztests/Homogenitätstest


Unterschiedshypothesen

Vergleich der Lagemaße („Mittelwerte“) von mehreren Stichproben

A. Intervallskalierte, normalverteilte Variablen

einfache Varianzanalyse mit Meßwiederholung

abhängig>2

einfache Varianzanalyse= einfaktorielle ANOVA

unabhängig>2

t-Test für abhängige Stichproben

abhängig2

t-Test nach Studentunabhängig2

TestverfahrenAbhängigkeitAnzahl der miteinander zu vergleichenden

Stichproben

B. Ordinalskalierte oder nicht-normalverteilte Variablen

Friedman-Testabhängig>2

H-Test nach Kruskal und Wallis

unabhängig>2

Wilcoxon-Testabhängig2

U-Test nach Mann und Whitney

unabhängig2

Testverfahren(Auswahl)

AbhängigkeitAnzahl der miteinander zu vergleichenden

Stichproben

Unterschiedshypothesen


Wichtige Parameter:

• Skalenniveau der Daten?

• Normalverteilung?

• Varianzenhomogenität?

Parametrisches oder nichtparametisches Testverfahren?


1. ist die abhängige Variable kardinalskaliert

wenn nein

⇒

nichtparametrische Testverfahren


2. Prüfung der mathematisch-statistischen Voraussetzung

besteht Varianzenhomogenität?liegt eine Normalverteilung vor?



Visualisierung der Verteilung über Histogramm




Parametrische oder nichtparametisches Testverfahren?



Test auf Varianzenhomogenität:Levene-Test

Test auf Normalverteilung:Test nach Kolmogorov-Smirnov korrigiert nach

Lillefors


3. Interpretation der mathematisch-statistischen Voraussetzung

keine grobe Abweichung von Normalverteilung+

homogene Varianzen

⇒

parametrisches Testverfahren




Abweichung von Normalverteilung+

inhomogene Varianzen

⇒

nichtparametrisches Testverfahren



keine Abweichung von Normalverteilung+

inhomogene Varianzen

⇒

parametrisches Testverfahren mit Korrektur für inhomogene Varianzen




Stichprobenumfang < 30

+

deutliche Abweichung von Normalverteilung(evtl. Transformation möglich?)

⇒



4. sind Verzerrungen des parametrischen Test zu erwarten

Mehrgruppenvergleiche:

neg. Korrelation zwischen Stichprobengröße und Standardabweichung

⇒




5. Parametrischer Test verwirft H1

Statistische Voraussetzungen kritisch überprüfen

⇒

Voraussetzung hält Überprüfung nicht stand

⇒

nichtparametrisch testen


Zusammenhangshypothesen




zwei Variablen nehmen Einfluss auf eine abhängige Variable

⇒

Partiellen Korrelationskoeffizienten berechnen



Mehrere/zahlreiche Variablen nehmen Einfluss auf eine abhängige Variable

Welche Variablen sind überdurchschnittlich bedeutsam

⇒

Klassifikationsanalyse

Veränderungshypothesen



Multiple Paarvergleiche (t-Test, Wilcoxon) oder multiple Varianzanalyse sind möglich

aber

es wird immer nur ein Teil der Daten zur Berechnung verwendet

Folge

Geringe Teststärke

Konsequenz

Unnötig hoher Stichprobenumfang


Multiple Paarvergleiche (t-Test, Wilcoxon) oder multiple Varianzanalyse sind möglich

aber

es wird immer nur ein Teil der Daten zur Berechnung verwendet

Folge

geringe Teststärke

Konsequenz

Unnötig hoher Stichprobenumfang



Eine hohe Teststärke zur Detektion von

Veränderungen über die Zeitachse besitzt der

Friedman-Test


Vergleich von zwei Zeitreihen

(Kontrollgruppe/Versuchsgruppe

Ermittlung der Fläche unter der Verlaufskurve

(AUC – Area under Curve) für jedes Tier

⇒

AUC-Mittelwerte der beiden Gruppen

vergleichen (⇒Unterschiedshypothese)



Ermittlung der AUC mit Hilfe der Trapezregel


Box-Jenkins-Modelle (ARIMA-Modelle)

ARIMA = Auto-Regressive Integrated Moving Average

Insbesondere Anwendung für prognostische

Zwecke


Äquivalenzhypothesen

(Bestätigung von Nullhypothesen)

Wenn möglich vermeiden!!

Exceltool „Äquivalenztest für

Mittelwerte“ nach Schneider von

www.acomed-statistik.de

Äquivalenzhypothesen

(Bestätigung von Nullhypothesen)

„Missbrauch“ vo t-Test und Co

1.kleine Effektgröße

2.Power 95 % (ββββ = 5%)

3. α=0,1

doktorandenseminar statistik vetdocsteil3 · multiple paarvergleiche (t-test, wilcoxon) oder...

Documents