doktorandenseminar statistik vetdocsteil3 · multiple paarvergleiche (t-test, wilcoxon) oder...
TRANSCRIPT
PD Dr. Sven Reese, LMU München 1
Hypothesenbasierende Hypothesenbasierende
UntersuchungenUntersuchungen
Hypothesenbasierende Hypothesenbasierende
UntersuchungenUntersuchungen
• Unterschiedshypothesen
• Zusammenhangshypothesen
• Veränderungshypothesen
• Äquivalenzhypothesen
PD Dr. Sven Reese, LMU München 2
Definition: wissenschaftliche Definition: wissenschaftliche
HypotheseHypothese
Eine wissenschaftliche Hypothese Eine wissenschaftliche Hypothese behauptet eine mehr oder weniger prbehauptet eine mehr oder weniger prääzise zise
Beziehung zwischen zwei oder mehr Beziehung zwischen zwei oder mehr Variablen, die fVariablen, die füür eine bestimmte r eine bestimmte
Population vergleichbarer Objekte oder Population vergleichbarer Objekte oder ErgeignisseErgeignisse gelten soll.gelten soll.
wissenschaftlich interessante wissenschaftlich interessante
FragestellungenFragestellungen
⇒⇒
ÜÜberfberfüührung in wissenschaftliche hrung in wissenschaftliche
HypothesenHypothesen
(Hypothese = gr. Vermutung)(Hypothese = gr. Vermutung)
PD Dr. Sven Reese, LMU München 3
4 Kriterien einer 4 Kriterien einer
wissenschaftlichen Hypothesewissenschaftlichen Hypothese
1.1.reale Sachverhalte, die reale Sachverhalte, die
empirisch empirisch untersuchbaruntersuchbar sindsind
2.2. Allgemein gAllgemein güültige ltige üüber den ber den
Einzelfall hinausgehende Einzelfall hinausgehende
BehauptungBehauptung
4 Kriterien einer 4 Kriterien einer
wissenschaftlichen Hypothesewissenschaftlichen Hypothese
3.3.Konditionalsatz Konditionalsatz
((wennwenn--danndann oder oder jeje--destodesto))
4.4. Behauptung muss falsifizierbar Behauptung muss falsifizierbar
sein sein
(es m(es müüssen Ereignisse denkbar ssen Ereignisse denkbar
sein, die dem Konditionalsatz sein, die dem Konditionalsatz
widersprechen)widersprechen)
PD Dr. Sven Reese, LMU München 4
WennWenn--TeilTeil (Bedingung)(Bedingung)
undund
DannDann--TeilTeil
(Folge, Konsequenz)(Folge, Konsequenz)
einer Hypothese stelleneiner Hypothese stellen
AusprAuspräägungen von gungen von
VariablenVariablen dar. dar.
WennWenn--TeilTeil⇒⇒
unabhunabhäängige Variablengige Variable
DannDann--TeilTeil
⇒⇒
abhabhäängige Variablengige Variable. .
PD Dr. Sven Reese, LMU München 5
ungerichtete Hypothesenungerichtete Hypothesen
(zweiseitige Fragestellung)(zweiseitige Fragestellung)
--
gerichtete Hypothesengerichtete Hypothesen
(einseitige Fragestellung)(einseitige Fragestellung)
EffektgrEffektgrößößee
-- Enge des postulierten Enge des postulierten
ZusammenhangsZusammenhangs
-- GrGrößöße des postulierten e des postulierten
UnterschiedsUnterschieds
PD Dr. Sven Reese, LMU München 6
Gibt es eine Vermutung Gibt es eine Vermutung üüber die ber die
KausalbeziehungKausalbeziehung, der in der , der in der
Hypothese postulierten Hypothese postulierten
VariablenbeziehungVariablenbeziehung??????
wissenschaftliche Hypothesewissenschaftliche Hypothese
⇒⇒
ÜÜberfberfüührung in statistische hrung in statistische
HypothesenHypothesen
PD Dr. Sven Reese, LMU München 7
Statistische HypotheseStatistische Hypothese
Welche quantitativen MaWelche quantitativen Maßße e
kköönnen die nnen die VariablenbeziehungVariablenbeziehung
am besten beschreiben?am besten beschreiben?
Statistische HypotheseStatistische Hypothese
Bezieht sich auf Bezieht sich auf
Gesamtpopulation, der Gesamtpopulation, der
Stichproben zugrunde liegtStichproben zugrunde liegt⇒⇒
Stichprobenkennwerte werden in griechischen Stichprobenkennwerte werden in griechischen
Buchstaben angegebenBuchstaben angegeben
PD Dr. Sven Reese, LMU München 8
Statistische HypotheseStatistische Hypothese
Definiert als Annahme Definiert als Annahme üüber die ber die
Verteilung einer Zufallsvariablen Verteilung einer Zufallsvariablen
oder eines Parameters dieser oder eines Parameters dieser
VerteilungVerteilung⇒⇒
Bei statistischen Hypothesen handelt es sich um Bei statistischen Hypothesen handelt es sich um
WahrscheinlichkeitsaussagenWahrscheinlichkeitsaussagen
Statistische HypothesenStatistische Hypothesen
sind sind
WahrscheinlichkeitsaussagenWahrscheinlichkeitsaussagen⇒⇒
Hypothese kann Hypothese kann nichtnicht durch durch
Nachweis einzelner Gegenbeispiele Nachweis einzelner Gegenbeispiele
widerlegt (falsifiziert)widerlegt (falsifiziert) werden.werden.
PD Dr. Sven Reese, LMU München 9
Problem!Problem!
Statistische HypothesenStatistische Hypothesen
sind sind
WahrscheinlichkeitsaussagenWahrscheinlichkeitsaussagen⇒⇒
Hypothese kann auchHypothese kann auch nicht nicht durch durch Nachweis vieler Positivbeispiele Nachweis vieler Positivbeispiele
bestbestäätigttigt (verifiziert) (verifiziert) werden.werden.
LLöösung!sung!
(willk(willküürlich) festgelegte rlich) festgelegte
PrPrüüfkriterien erzeugen fkriterien erzeugen
FalsifizierbarkeitFalsifizierbarkeit⇒⇒
Wichtigstes PrWichtigstes Prüüfkriterium ist die fkriterium ist die statistische Signifikanzstatistische Signifikanz
(eingef(eingefüührt von Fischer 1925)hrt von Fischer 1925)
PD Dr. Sven Reese, LMU München 10
Beachte!Beachte!
Statistisch nicht falsifizierte Statistisch nicht falsifizierte
(=signifikante) Beziehung (=signifikante) Beziehung
zwischen Variablenzwischen Variablen
≠≠
bestbestäätigte Kausalbeziehungtigte Kausalbeziehung
monokausale Hypothesemonokausale Hypothese
UnabhUnabhäängige Variable erklngige Variable erkläärt rt
praktisch die gesamte Variabilitpraktisch die gesamte Variabilitäät t
der abhder abhäängigen Variablengigen Variable⇒⇒
extrem seltene Konstellationextrem seltene Konstellation
Normalerweise hat man multikausale Normalerweise hat man multikausale
KonstellationenKonstellationen
PD Dr. Sven Reese, LMU München 11
multikausale Verhmultikausale Verhäältnisseltnisse
⇒⇒
der Anspruch eines vollstder Anspruch eines vollstäändigen ndigen
ErklErkläärungsmodells ist von rungsmodells ist von
vornherein zum Scheitern vornherein zum Scheitern
verurteiltverurteilt
AussagekraftAussagekraft
interne Validitinterne Validitäätt
(Eindeutigkeit)(Eindeutigkeit)
vsvs
externe Validitexterne Validitäätt(Generalisierbarkeit)(Generalisierbarkeit)
PD Dr. Sven Reese, LMU München 12
Relativer ErklRelativer Erkläärungswert rungswert
mehrerer unabhmehrerer unabhäängiger ngiger
VariablenVariablen
⇒⇒
TherorieTherorie
((theoriatheoria gr. Erforschung der gr. Erforschung der
Wahrheit)Wahrheit)
TheorieTheorie
⇒⇒
soll Sachverhalte beschreiben, soll Sachverhalte beschreiben,
erklerkläären und vorhersagen ren und vorhersagen
kköönnennnen
Kein Anspruch auf absolute Kein Anspruch auf absolute
WahrheitWahrheit
PD Dr. Sven Reese, LMU München 13
TheorieTheorie
Kann durch Stichproben nicht Kann durch Stichproben nicht
sicher verifiziert werdensicher verifiziert werden
Kann durch Falsifikation Kann durch Falsifikation
eingeschreingeschräänkt oder gekippt nkt oder gekippt
werdenwerden
Interpretation statistischer Interpretation statistischer
HypothesenprHypothesenprüüfungenfungen
Daten geben nur die Grundlage zur Daten geben nur die Grundlage zur
Entscheidung fEntscheidung füür oder gegen eine r oder gegen eine
Hypothese Hypothese –– eine Fehlentscheidung eine Fehlentscheidung
kann nie ausgeschlossen werdenkann nie ausgeschlossen werden
PD Dr. Sven Reese, LMU München 14
Praktische DurchfPraktische Durchfüührung einer hrung einer
UntersuchungUntersuchung
Ausgangspunkt ist Ausgangspunkt ist idealerweiseidealerweise eine eine TheorieTheorie
⇒⇒
Ableitung einer inhaltlichen HypotheseAbleitung einer inhaltlichen Hypothese
⇒⇒
Formulierung einer statistischen Formulierung einer statistischen HypotheseHypothese
Statistische HypothesenprStatistische Hypothesenprüüfungfung
Bildung eines HypothesenpaaresBildung eines Hypothesenpaares
Alternativhypothese (HAlternativhypothese (H11))
vsvs
Nullhypothese (HNullhypothese (H00))
PD Dr. Sven Reese, LMU München 15
Statistische HypothesenprStatistische Hypothesenprüüfungfung
Alternativhypothese postuliert einen Alternativhypothese postuliert einen
bestimmten Effekt, den die bestimmten Effekt, den die
Nullhypothese negiertNullhypothese negiert
SignifikanzniveauSignifikanzniveau
Konvention 5% oder 1%Konvention 5% oder 1%
⇒⇒
Nur wenn die Nur wenn die
Irrtumswahrscheinlichkeit unter 5 % Irrtumswahrscheinlichkeit unter 5 %
(1%) liegt ist die Annahme der (1%) liegt ist die Annahme der
Alternativhypothese akzeptabelAlternativhypothese akzeptabel
PD Dr. Sven Reese, LMU München 16
SignifikanzniveauSignifikanzniveau
IrrtumswahrscheinlichkeitIrrtumswahrscheinlichkeit
==
αα--FehlerFehler--WahrscheinlichkeitWahrscheinlichkeit==
Wahrscheinlichkeit, dass die Wahrscheinlichkeit, dass die
Nullhypothese stimmtNullhypothese stimmt
Problem!Problem!
Mit steigendem Mit steigendem
Stichprobenumfang geht die Stichprobenumfang geht die
IrtumswahrscheinlichkeitIrtumswahrscheinlichkeit gegen gegen
NullNull⇒⇒
Nullhypothese hat keine Chance.Nullhypothese hat keine Chance.
PD Dr. Sven Reese, LMU München 17
LLöösung!sung!
Festlegung einesFestlegung eines biologisch biologisch
relevantenrelevanten (Mindest(Mindest--))
UnterschiedesUnterschiedes
==
EffektgrEffektgrößößee
ββ--FehlerFehler--WahrscheinlichkeitWahrscheinlichkeit
==
Wahrscheinlichkeit, dass die korrekte Wahrscheinlichkeit, dass die korrekte
Alternativhypothese irrtAlternativhypothese irrtüümlich mlich
ausgeschlossen wirdausgeschlossen wird
PD Dr. Sven Reese, LMU München 18
Problem!Problem!
Mit sinkendem Mit sinkendem
Stichprobenumfang geht die Stichprobenumfang geht die
ββ--FehlerFehler--WahrscheinlichkeitWahrscheinlichkeitgegen 100%gegen 100%
⇒⇒
Alternativhypothese hat keine Alternativhypothese hat keine
Chance.Chance.
LLöösung!sung!
Festlegung einer maximalen Festlegung einer maximalen
HHööhe des he des ββ--FehlersFehlers⇒⇒
KonventionKonvention
ββ--FehlersFehlers = 4 x = 4 x αα--FehlerFehler
⇒⇒ 20 %20 %
PD Dr. Sven Reese, LMU München 19
TeststTeststäärke oder Powerrke oder Power
Wahrscheinlichkeit, dass ein Wahrscheinlichkeit, dass ein
Signifikanztest zugunsten der Signifikanztest zugunsten der
Alternativhypothese entscheidetAlternativhypothese entscheidet
==
1 1 -- ββ--FehlerFehler
Optimaler StichprobenumfangOptimaler Stichprobenumfang
TeststTeststäärke bei 80 %rke bei 80 %
grgrößößeres n eres n ⇒⇒ irrelevante Unterschiede irrelevante Unterschiede werden erkanntwerden erkannt
kleineres n kleineres n ⇒⇒ Gefahr der fehlerhaften Gefahr der fehlerhaften Ablehnung der AlternativhypotheseAblehnung der Alternativhypothese
PD Dr. Sven Reese, LMU München 20
TeststTeststäärke oder Powerrke oder Power
Einflussfaktoren:Einflussfaktoren:
1.1.SignifikanzniveauSignifikanzniveau
2.2. EffektgrEffektgrößößee
3.3. StichprobenumfangStichprobenumfang
4.4. gerichtete gerichtete –– ungerichtete Fragestellungungerichtete Fragestellung
Berechnung des optimalen Stichprobenumfangs
• keine biologisch relevante Differenz (Effektgröße) definiert⇒ Berechnung nicht möglich
• Effektgröße und Varianz in den Stichproben bekannt⇒ Berechnung für normalverteilteStichproben sicher möglich
PD Dr. Sven Reese, LMU München 21
Software zur Berechnung der Software zur Berechnung der
PowerPower
1.1.G*PowerG*Power 3.01.0 (Freeware)3.01.0 (Freeware)
2.2. SPSS Sample PowerSPSS Sample Power
3.3. BIAS fBIAS füür Windowsr Windows
PD Dr. Sven Reese, LMU München 22
Hypothesenprüfende Untersuchungen
1.Unterschiedshypothesen
2.Zusammenhangshypothesen
3.Veränderungshypothesen
4.Nullhypothese soll bestätigt werden⇒ Äquivalenztests/Homogenitätstest
PD Dr. Sven Reese, LMU München 23
Unterschiedshypothesen
Vergleich der Lagemaße („Mittelwerte“) von mehreren Stichproben
A. Intervallskalierte, normalverteilte Variablen
einfache Varianzanalyse mit Meßwiederholung
abhängig>2
einfache Varianzanalyse= einfaktorielle ANOVA
unabhängig>2
t-Test für abhängige Stichproben
abhängig2
t-Test nach Studentunabhängig2
TestverfahrenAbhängigkeitAnzahl der miteinander zu vergleichenden
Stichproben
B. Ordinalskalierte oder nicht-normalverteilte Variablen
Friedman-Testabhängig>2
H-Test nach Kruskal und Wallis
unabhängig>2
Wilcoxon-Testabhängig2
U-Test nach Mann und Whitney
unabhängig2
Testverfahren(Auswahl)
AbhängigkeitAnzahl der miteinander zu vergleichenden
Stichproben
Unterschiedshypothesen
PD Dr. Sven Reese, LMU München 24
Wichtige Parameter:
• Skalenniveau der Daten?
• Normalverteilung?
• Varianzenhomogenität?
Parametrisches oder nichtparametisches Testverfahren?
Parametrisches oder nichtparametisches Testverfahren?
1. ist die abhängige Variable kardinalskaliert
wenn nein
⇒
nichtparametrische Testverfahren
PD Dr. Sven Reese, LMU München 25
2. Prüfung der mathematisch-statistischen Voraussetzung
besteht Varianzenhomogenität?liegt eine Normalverteilung vor?
Parametrisches oder nichtparametisches Testverfahren?
2. Prüfung der mathematisch-statistischen Voraussetzung
Visualisierung der Verteilung über Histogramm
Parametrisches oder nichtparametisches Testverfahren?
PD Dr. Sven Reese, LMU München 26
Parametrisches oder nichtparametisches Testverfahren?
Parametrische oder nichtparametisches Testverfahren?
PD Dr. Sven Reese, LMU München 27
2. Prüfung der mathematisch-statistischen Voraussetzung
Test auf Varianzenhomogenität:Levene-Test
Test auf Normalverteilung:Test nach Kolmogorov-Smirnov korrigiert nach
Lillefors
Parametrische oder nichtparametisches Testverfahren?
3. Interpretation der mathematisch-statistischen Voraussetzung
keine grobe Abweichung von Normalverteilung+
homogene Varianzen
⇒
parametrisches Testverfahren
Parametrische oder nichtparametisches Testverfahren?
PD Dr. Sven Reese, LMU München 28
3. Interpretation der mathematisch-statistischen Voraussetzung
Abweichung von Normalverteilung+
inhomogene Varianzen
⇒
nichtparametrisches Testverfahren
Parametrische oder nichtparametisches Testverfahren?
3. Interpretation der mathematisch-statistischen Voraussetzung
keine Abweichung von Normalverteilung+
inhomogene Varianzen
⇒
parametrisches Testverfahren mit Korrektur für inhomogene Varianzen
Parametrische oder nichtparametisches Testverfahren?
PD Dr. Sven Reese, LMU München 29
3. Interpretation der mathematisch-statistischen Voraussetzung
Stichprobenumfang < 30
+
deutliche Abweichung von Normalverteilung(evtl. Transformation möglich?)
⇒
nichtparametrisches Testverfahren
Parametrische oder nichtparametisches Testverfahren?
4. sind Verzerrungen des parametrischen Test zu erwarten
Mehrgruppenvergleiche:
neg. Korrelation zwischen Stichprobengröße und Standardabweichung
⇒
nichtparametrisches Testverfahren
Parametrische oder nichtparametisches Testverfahren?
PD Dr. Sven Reese, LMU München 30
5. Parametrischer Test verwirft H1
Statistische Voraussetzungen kritisch überprüfen
⇒
Voraussetzung hält Überprüfung nicht stand
⇒
nichtparametrisch testen
Parametrische oder nichtparametisches Testverfahren?
Zusammenhangshypothesen
PD Dr. Sven Reese, LMU München 31
Zusammenhangshypothesen
Zusammenhangshypothesen
zwei Variablen nehmen Einfluss auf eine abhängige Variable
⇒
Partiellen Korrelationskoeffizienten berechnen
PD Dr. Sven Reese, LMU München 32
Zusammenhangshypothesen
Mehrere/zahlreiche Variablen nehmen Einfluss auf eine abhängige Variable
Welche Variablen sind überdurchschnittlich bedeutsam
⇒
Klassifikationsanalyse
Veränderungshypothesen
PD Dr. Sven Reese, LMU München 33
Veränderungshypothesen
Multiple Paarvergleiche (t-Test, Wilcoxon) oder multiple Varianzanalyse sind möglich
aber
es wird immer nur ein Teil der Daten zur Berechnung verwendet
Folge
Geringe Teststärke
Konsequenz
Unnötig hoher Stichprobenumfang
Veränderungshypothesen
Multiple Paarvergleiche (t-Test, Wilcoxon) oder multiple Varianzanalyse sind möglich
aber
es wird immer nur ein Teil der Daten zur Berechnung verwendet
Folge
geringe Teststärke
Konsequenz
Unnötig hoher Stichprobenumfang
PD Dr. Sven Reese, LMU München 34
Veränderungshypothesen
Eine hohe Teststärke zur Detektion von
Veränderungen über die Zeitachse besitzt der
Friedman-Test
Veränderungshypothesen
Vergleich von zwei Zeitreihen
(Kontrollgruppe/Versuchsgruppe
Ermittlung der Fläche unter der Verlaufskurve
(AUC – Area under Curve) für jedes Tier
⇒
AUC-Mittelwerte der beiden Gruppen
vergleichen (⇒Unterschiedshypothese)
PD Dr. Sven Reese, LMU München 35
Veränderungshypothesen
Ermittlung der AUC mit Hilfe der Trapezregel
Veränderungshypothesen
Box-Jenkins-Modelle (ARIMA-Modelle)
ARIMA = Auto-Regressive Integrated Moving Average
Insbesondere Anwendung für prognostische
Zwecke
PD Dr. Sven Reese, LMU München 36
Äquivalenzhypothesen
(Bestätigung von Nullhypothesen)
Wenn möglich vermeiden!!
Exceltool „Äquivalenztest für
Mittelwerte“ nach Schneider von
www.acomed-statistik.de
Äquivalenzhypothesen
(Bestätigung von Nullhypothesen)
„Missbrauch“ vo t-Test und Co
1.kleine Effektgröße
2.Power 95 % (ββββ = 5%)
3. α=0,1