t utorat d eskriptive s tatistik und w ahrscheinlichkeitstheorie kai vogt [email protected] termin 2

37
TUTORAT DESKRIPTIVE STATISTIK UND WAHRSCHEINLICHKEITSTHEORIE Kai Vogt [email protected] Termin 2

Upload: katarina-zehler

Post on 05-Apr-2015

106 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

TUTORATDESKRIPTIVE STATISTIK UND WAHRSCHEINLICHKEITSTHEORIE

Kai Vogt

[email protected]

Termin 2

Page 2: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

WIEDERHOLUNG TERMIN 1

Multiple Korrelationen Ry.x1x2

Partialkorrelation rxy.z

Semipartialkorrelation rx(y.z)

• Inkrementelle Validität Suppressor-Effekt Multikollinearität

Multiple Regression Biased Estimate & Capitalization of Chance Kreuzvalidierung Signifikanzprüfung Strategien der Prädiktorauswahl

Page 3: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

STRATEGIEN DER PRÄDIKTORAUSWAHL BEI DER

MULTIPLEN REGRESSION

Page 4: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

STRATEGIEN DER PRÄDIKTORAUSWAHL (5)

Inhaltliche Auswahl

Alle möglichen Untermengen

Vorwärtsselektion

Rückwärtselemination

Schrittweise Regression

Page 5: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

Aufgabe: Eine multiple Regression liefert folgendes Ergebnis. Welche Form der Auswahl der Prädiktoren wurde hier gewählt? Begründet eure Antwort.

Page 6: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

Lösung: Es wurde die Rückwärtselemination verwendet!

R² wird kleiner, weil Prädiktoren die einen (nicht-signifikanten) Teil des Kriteriums vorhersagen, weggelassen werden. D.H. das nacheinander die Prädiktoren die keine inkrementelle Validität besitzen aussortiert werden.

Das korrigierte R² steigt, weil die Schrumpfungskorrektur wegen der geringeren Anzahl an Prädiktoren kleiner ausfällt! (Prädiktoren werden weniger im Laufe der Rückwärtseleminierung)

22 ²)1(2

²)1(2

31ˆ R

KNR

KN

NR

Page 7: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

GLIEDERUNG

I. MediatoranalyseII. ModeratoranalyseIII. ALM

Page 8: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

I. MEDIATORANALYSE

Page 9: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

MEDIATORANALYSE Wir erinnern uns: Zwei Variablen Korrelieren signifikant. Welche Kausalitäten sind

möglich?

Ein „echtes“ Beispiel nach Urban & Mayerl (2005):

Alter AusländerfeindlichkeitDirekter Effekt:

Totaler Effekt:

Indirekter Effekt: Alter Ausländerfeindlichkeit

Autoritarismus

Alter Ausländerfeindlichkeit

-

+

+ +

Page 10: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

Mediatoranalyse

• Die Mediatoranalyse prüft, ob ein Zusammenhang zwischen zwei Variablen vollständig oder teilweise durch eine dritte Variable vermittelt wird.

• Sie erlaubt demgemäß die Vielfalt der bei Korrelationen möglichen Kausalitäten einzuschränken („Pfadanalyse“).

• Alternative: Die Kausalitäten sind durch experimentelle Prüfung oder theoretische Ableitung bereits bekannt

• Grundsatz: Erst die Theorie, dann die Statistik – „Zahlen sprechen nicht“

Page 11: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

MEDIATORANALYSE

Alter Ausländerfeindlichkeit

Autoritarismus

Unabhängige Variable

AbhängigeVariable

Mediatorvariable

Page 12: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

MEDIATORANALYSE: SCHRITT 1

Alter (X) Ausländerfeindlichkeit (Y)

Autoritarismus (M)

• Regression von Y auf X. Regression der Ausländerfeindlichkeit auf das Alter.

Y = b * X + a

• Nur wenn sich eine signifikanter Zusammenhang zwischen der AV und der UV ergibt (b ≠ 0), kann eine Mediation vorliegen.

bY,X≠0

Page 13: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

MEDIATORANALYSE: SCHRITT 2

Ausländerfeindlichkeit (Y)

Autoritarismus (M)

• Regression von M auf X. Regression des Autoritarismus auf das Alter.

M = b * X + a

• Nur wenn b ≠ 0, kann eine Mediation vorliegen.

bM,X≠0

Alter (X)

Page 14: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

MEDIATORANALYSE: SCHRITT 3

Alter (X) Ausländerfeindlichkeit (Y)

Autoritarismus (M)

• Regression von Y auf M. Regression der Ausländerfeindlichkeit auf den Autoritarismus.

Y = b * M + a

• Nur wenn b ≠ 0, kann eine Mediation vorliegen.

bY,M≠0

Page 15: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

MEDIATORANALYSE: SCHRITT 4

Alter (X) Ausländerfeindlichkeit (Y)

Autoritarismus (M)

• (Multiple) Regression von Y auf X und M. Regression der Ausländerfeindlichkeit auf das Alter und den Autoritarismus.

bY,M≠0

bY,M= 0

Y = bYX * X + bYM * M + a

Page 16: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

VOLLSTÄNDIGE UND PARTIELLE MEDIATION

Y = bYX * X + bYM * M + a

• Wenn bYX=0 und bYM ≠0, spricht man von „vollständiger Mediation“, da der komplette Effekt des Alters auf die Ausländerfeindlichkeit über den Autoritarismus vermittelt ist.

• Wenn |bYX|>0 aber kleiner als in Schritt 1, spricht man von „partieller Mediation“.

Page 17: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

Verknüpfung: Multiple Korrelation

Einen Hinweis auf das Vorliegen einer (partiellen) Mediation kann uns auch der Vergleich von Partialkorrelation und bivariater Korrelation liefern.

ryx2.x1 = n.s.; ryx2 = signifikant → vollständige Mediation

ryx2.x1 < ryx2

→ partielle Mediation

Page 18: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

II. MODERATORANALYSE

Page 19: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

MODERATORANALYSE

Die Moderatoranalyse prüft, ob ein Zusammenhang zwischen zwei Variablen durch eine dritte Variable beeinflusst wird.

Hypothese: Die gleiche Trainingszeit wirkt sich bei Fußballspielern mit großem Talent stärker auf deren Marktwert aus, als bei Spielern mit wenig Talent.

Im Gegensatz zur Mediatorvariablen, wird nicht angenommen, dass die Moderatorvariable durch die UV beeinflusst wird – der Moderator korreliert nur mit dem Kriterium, nicht aber mit der UV.

Page 20: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

MODERATORANALYSE

Training Markwert

Talent

Unabhängige Variable

AbhängigeVariable

Moderatorvariable

Hinweis:Die Moderatorvariable wirkt nicht direkt auf den Marktwert, sondern auf den Zusammenhang, d.h. auf das b-Gewicht der Regression

Page 21: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

MODERATORANALYSE

Marktwert

Training

Talent -

Talent +

Hinweis:

- Es wird angenommen, dass die Moderatorvariable intervallskaliert ist.

- Es ist jedoch üblich, nur 2 Geraden zu zeigen, z.B. für Probanden die eine Standardabeichung über bzw. unter dem Mittelwert liegen.

- Die Moderatorvariable beeinflusst die Steigung (das b-Gewicht) der Reggressionsgeraden.

Talent +

Talent -

Page 22: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

MODERATORANALYSE: VORGEHEN

1. Schritt:

z-Transformation von Prädiktor (unabhängiger Variable) und potentiellem Moderator

Frage: Warum z-Transformation?

2. Schritt

Ermittlung eines dritten Prädiktors

zxm = zx * zm

3. Schritt

Multiple Regressionsanalyse von y auf zxm, zx und zm

ŷ = b1 * m * x + b2*x + b3*m + a Wie groß ist b1?

Page 23: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

MODERATORANALYSE

Interpretation der Ergebnisse: ŷ = b1 * m * x + b2*x + b3*m + a

b1 > 0 (p< .05): Je größer die Ausprägung in der Moderatorvariablen (=Talent), desto größer ist die Steigung der ursprünglichen Regressionsgeraden zur Vorhersage von y (Marktwert) durch x (Training)

b1 < 0 (p< .05): Je größer die Ausprägung in der Moderatorvariablen, desto geringer ist die Steigung der ursprünglichen Regressionsgeraden zur Vorhersage von y durch x

b1 = 0 (n.s.): Keine Moderation

Page 24: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

INHALTLICHE BEDEUTUNG

Eine Moderation bedeutet, dass eine Interaktion zwischen dem Prädiktor und Moderator in Bezug auf das Kriterium vorliegt.→ Verknüpfung: Varianzanalyse (dazu später )

Das Regressionsgewicht b1 (=bmx) beziffert die Stärke des Interaktionseffekts.

Page 25: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

MODERATORANALYSE

Hinweis:

Es ist möglich, dass die Moderatorvariable zusätzlich auch einen direkten Einfluss auf die aV (das Kriterium) hat.

Dann ist sie sowohl Prädiktor wie auch Moderator für den Zusammenhang zwischen Kriterium und dem anderen Prädiktor.

Training Markwert

Talent

Unabhängige Variable

AbhängigeVariable

Moderatorvariable

Page 26: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

Schlagwort: … vermittelt Die Mediatorvariable

korreliert selbst mit der unabhängigen Variable (Sie vermittelt zumindest einen Teil des Einflusses der uV auf die aV)

Schlagwort: … beeinflusst

Die Moderatorvariable korreliert nicht mit der unabhängigen Variable (Sie beeinflusst den Zusammenhang von uV und aV)

Mediatoranalyse ModeratoranalyseVS.

Page 27: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

AUFGABEN

a) Was wird mit einer Mediationshypothese überprüft?

b) Erläutern Sie die vier Schritte der Mediatoranalyse

Page 28: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

LÖSUNG

(a) Es wird die Hypothese geprüft, dass ein Zusammenhang zwischen X und Y durch eine Drittvariable, den Mediator M, kausal vermittelt wird.

(b)1. Es wird überprüft, ob überhaupt ein signifikanter Zusammenhang zwischen X und Y besteht.2. Es wird überprüft, ob ein signifikanter Zusammenhang zwischen X und M besteht.3. Es wird überprüft, ob ein signifikanter Zusammenhang zwischen M und Y besteht.4. In einer multiplen Regression wird überprüft, ob ein signifikanter Zusammenhang zwischen X und Y bestehen bleibt, wenn zusätzlich der Prädiktor M berücksichtigt wird.

Page 29: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

AUFGABEN

In eine Moderatoranalyse wird geprüft, ob der Zusammenhang von X und Y durch M moderiert wird. Belegen die untenstehenden Ergebnisse eine solche Moderation?

11.04.23Tutorat Statistik II29

Page 30: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

LÖSUNG

Die Ergebnisse belegen eine Moderation, da das Regressionsgewicht des Prädiktors P signifikant von Null verschieden ist.

Page 31: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

III. ALLGEMEINES LINEARES MODELL

Page 32: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

ALM

Übergeordnete Darstellungsform für verschiedene statistische Verfahren:

Varianzanalyse Regression

Der beobachtete individuelle Wert einer Versuchsperson i in der abhängigen Variablen yi ist zusammengesetzt aus einer gewichteten Summe anderer Variablen xj und einem individuellen Fehler ei

Relevant ist das Verständnis der mathematischen Darstellung

Page 33: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

ALM

/ Gewichte

Page 34: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

BEISPIEL

Page 35: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

ALM

Effekte sind die Basis der Varianzanalyse!

Definition: Abweichung eines Gruppenmittelwerts vom Gesamtmittelwert.

yi = a0 ‧ xi0 + a1 ‧ xi1 + a2 ‧ xi2 + … + ap + xip + ei

Im Beispiel von eben: a0 = 7,5 ; a1 = -2,5 ; a2 = 2,5

Für einzelne Personen gilt dann:

In Gruppe 1: xi0 = 1 ; xi1 = 1 ; xi2 = 0 ; ei individuell

In Gruppe 2: xi0 = 1 ; xi1 = 0 ; xi2 = 1 ; ei individuell

Page 36: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

WICHTIGES AUS TERMIN 2

Mediatoranalyse• Wann wird diese Analyse gerechnet?• Verständnis für das Grundprinzip der Mediatoranalyse• Vorgehen bei einer Mediatoranalyse• vollständige vs. partielle Mediation

Moderatoranalyse• Wann wird diese Analyse gerechnet?• Verständnis für das Grundprinzip der Moderatoranalyse• Vorgehen bei einer Moderatoranalyse

Allgemeines Lineares Modell (ALM)• Was ist das ALM?

Page 37: T UTORAT D ESKRIPTIVE S TATISTIK UND W AHRSCHEINLICHKEITSTHEORIE Kai Vogt vogtkai@gmx.net Termin 2

VIELEN DANK FÜR EURE AUFMERKSAMKEIT!

Bis zum nächsten Mal!!!!

Wenn ihr zwischendurch noch Fragen habt:

[email protected]