methoden der politikwissenschaft faktorenanalyse siegfried schumann

22
Methoden der Politikwissenschaft Faktorenanalyse Siegfried Schumann

Upload: hella-salzmann

Post on 06-Apr-2016

228 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Methoden der Politikwissenschaft Faktorenanalyse Siegfried Schumann

Methoden der Politikwissenschaft

Faktorenanalyse

Siegfried Schumann

Page 2: Methoden der Politikwissenschaft Faktorenanalyse Siegfried Schumann

2

Organisatorische Vorbemerkungen:

• Für Sozialwissenschaften meist irrelevant:– Vorgeschaltete Mittelwertbildung (Hausfrauen-Urteile)

• Nicht behandelt:– Eignung der Korrelationsmatrix– Graphische Interpretation der Faktoren

Page 3: Methoden der Politikwissenschaft Faktorenanalyse Siegfried Schumann

3

Übersicht zur Faktorenanalyse (FA)

1. Korrelationsmatrix:

2. Grundgleichung der FA: Ladung · Score

3. Durch Einsetzen:

Korrelationsmatrix der Faktoren „C“

Falls Faktoren unkorreliert: C = Einheitsmatrix: (Fundamentaltheorem d. FA)

4. Erweiterung: (spez. Varianz + Messfehler; wird festgelegt; Ladungen

werden so gewählt, dass 1. Faktor max. Varianz erklärt)

5. Berechnung der Faktorwerte: Gleichung nicht immer lösbar; Ergebnis: Faktorscores

ZZ1K

1R

PAZ

PAPA1K

1R

ACAAPP1K

1AR

AAR

UAAR

ZAP 1 PAZ

Beobachteter Wert ↔ Linearkombination mehrerer (errechneter) Faktoren

Page 4: Methoden der Politikwissenschaft Faktorenanalyse Siegfried Schumann

4

Vorarbeiten: Berechnung der Standardabweichung

Vitamingehalt Haltbarkeit Preis

(x-AM) (x-AM)2 (x-AM) (x-AM)2 (x-AM) (x-AM)2

-1,66667

2,77779 -2,500

006,25000 -

2,66667

7,11113

-0,66667

0,44445 -0,500

000,25000 -

0,66667

0,44445

0,33333

0,11111 0,50000 0,25000 0,33333 0,11111

2.33333

5,44443 -1,500

002,25000 -

1,66667

2,77779

-0,66667

0,44445 1,50000 2,25000 2,33333 5,44443

0,33333

0,11111 2,50000 6,25000 2,33333 5,44443

SAQ: 9,33334

SAQ: 17,50000

SAQ: 21,33334

SD: 1,36626

SD: 1,87083 SD: 2,06559

Anteil unges. Fettsäuren:

AM = 2,83333

(S. 193)

SD = 1,47196 (S. 199)

Kaloriengehalt: AM = 4,16667

(S. 193)

SD = 1,94079 (S. 199)

Vitamingehalt: AM = 3,66667

(S. 193)

SD = 1,36626 (Tabelle)

Haltbarkeit: AM = 3,50000

(S. 193)

SD = 1,87083 (Tabelle)

Preis: AM = 4,66667

(S. 193)

SD = 2,06559 (Tabelle)

Page 5: Methoden der Politikwissenschaft Faktorenanalyse Siegfried Schumann

5

z-standardisierte Ausgangswerte transponierte MatrixRama Sanell

aBecel Du

darfstHoll.

ButterWeihn

. Butter

AF Ka Vi Ha Pr

AF -1,2455

0

-0,5661

4

0,79260

1,47196

-0,5661

4

0,11323

-1,2455

0

-1,6316

4

-1,2198

8

-1,3363

1

-1,2910

0Ka -

1,63164

0,94463

0,42938

0,94463

-0,6011

3

-0,0858

8

-0,5661

4

0,94463

-0,4879

5

-0,2672

6

-0,3227

5Vi -

1,21988

-0,4879

5

0,24397

1,70782

-0,4879

5

0,24397

0,79260

0,42938

0,24397

0,26726

0,16137

Ha -1,3363

1

-0,2672

6

0,26726

-0,8017

8

0,80178

1,33631

1,47196

0,94463

1,70782

-0,8017

8

-0,8068

7Pr -

1,29100

-0,3227

5

0,16137

-0,8068

7

1,12962

1,12962

-0,5661

4

-0,6011

3

-0,4879

5

0,80178

1,12962

0,11323

-0,0858

8

0,24397

1,33631

1,12962

KorrelationsmatrixAF Ka Vi Ha Pr

AF (Anteil unges. Fetts.)

1,00000

0,71176

0,96134 0,10894

0,04385

Ka (Kaloriengehalt) 0,71176

1,00000

0,70397 0,13771

0,06652

Vi (Vitamingehalt) 0,96134

0,70397

1,00000

0,07825

0,02362

Ha (Haltbarkeit) 0,10894

0,13771

0,07825 1,00000

0,98334

Pr (Preis) 0,04385

0,06652

0,02362 0,98334

1,00000

Errechnung der Korrelationsmatrix aus z-Werten

ZZ1K

1R

yx

xyxy ss

sr

1nSAPsxy

Zur Erinnerung:

Page 6: Methoden der Politikwissenschaft Faktorenanalyse Siegfried Schumann

6

Konstellation (Demonstrationsbeispiel nach Bortz):

• Untersucht werden 6 „Objekte“ (Personen):– Karin, Heinz, Sonja, Kurt, Eva, Karl

• Die „Objekte“ haben Ausprägungen bei den „Merkmalen“ (Testergebnisse):– Bi: Bilderrätsel– Ma: Mathematikaufgabe– Pu: Puzzle– Re: Reproduktions (Gedächtnis-) Aufgabe– Kr: Kreuzworträtsel

• Es ergeben sich folgende korrelative Zusammenhänge (schematisch): F1: praktische Intelligenz F2: theoret. Intelligenz + F3 + F4 + F5

Bi Pu Re Ma Kr

• Vermutung:– Scheinkorrelation! Nur wenn diese Vermutung zutrifft, ist eine FA

sinnvoll!

Page 7: Methoden der Politikwissenschaft Faktorenanalyse Siegfried Schumann

7

Zur Grundgleichung der FA (Bortz-Beispiel)

• Bildung von 5 neuen orthogonalen Variablen (bei n = 5 „Merkmalen“)– F1 + F2 + F3 + F4 + F5– Schritt für Schritt nacheinander – rein rechnerisch!– Restriktion: jeweils maximale (Rest-)Varianzerklärung– bei n = 5 Faktoren: gesamte Ausgangsvarianz erklärt!

• Korrelation der neuen Variablen (Faktoren) mit den ursprünglichen Variablen– F1 F2 F3 F4 F5 ∙ Bi Ma Pu Re Kr – Ladungen: a

• Für die neuen Variablen (Faktoren) gilt: – Für jedes „Objekt“ wird eine Ausprägung auf jedem Faktor errechnet.– Faktorscore: p

• Beispiele zum Fundamentaltheorem der Faktorenanalyse (S. 207 / 208)– X(Bilderrätsel, Eva) = a(Bilderrätsel, F1) ∙ p(F1, Eva) + a(Bilderrätsel, F2) ∙ p(F2, Eva) + …

+ a(Bilderrätsel, F5) ∙ p(F5, Eva)

– X(Puzzle, Heinz) = a(Puzzle, F1) ∙ p(F1, Heinz) + a(Puzzle, F2) ∙ p(F2, Heinz) + … + a(Puzzle, F5) ∙ p(F5, Heinz)

Nutzen der „Umrechnung“?Abbruchmöglich

keit!

Beobachteter Wert ↔ Linearkombination mehrerer (errechneter) Faktoren

Page 8: Methoden der Politikwissenschaft Faktorenanalyse Siegfried Schumann

8

• Untersucht werden 6 „Objekte“:– Rama, Sanella, Becel, Du darfst, Holländische Butter, Weihnachtsbutter

• Die „Objekte“ haben Ausprägungen bei den „Merkmalen“ (Variablen):– AF: Anteil ungesättigter Fettsäuren– Ka: Kaloriengehalt– Vi: Vitamingehalt– Ha: Haltbarkeit– Pr: Preis

• Es ergeben sich folgende korrelative Zusammenhänge (schematisch):

F1: Gesundheit F2: Wirtschaftlichkeit + F3 + F4 + F5

AF Ka Vi Ha Pr

• Vermutung:– Scheinkorrelation! Nur wenn diese Vermutung zutrifft, ist eine FA

sinnvoll!

Konstellation (Backhaus u.a.):

Page 9: Methoden der Politikwissenschaft Faktorenanalyse Siegfried Schumann

9

Zur Grundgleichung der FA (Backhaus u.a.)

• Bildung von 5 neuen orthogonalen Variablen (bei n = 5 „Merkmalen“)– F1 + F2 + F3 + F4 + F5– Schritt für Schritt nacheinander – rein rechnerisch!– Restriktion: jeweils maximale (Rest-)Varianzerklärung– bei n = 5 Faktoren: gesamte Ausgangsvarianz erklärt!

• Korrelation der neuen Variablen (Faktoren) mit den ursprünglichen Variablen– F1 F2 F3 F4 F5 ∙ AF Ka Vi Ha Pr – Ladungen: a

• Für die neuen Variablen (Faktoren) gilt: – Für jedes „Objekt“ wird eine Ausprägung auf jedem Faktor errechnet.– Faktorscore: p

• Beispiele zum Fundamentaltheorem der Faktorenanalyse (S. 207 / 208)– X(Kalorien, Becel) = a(Kalorien, F1) ∙ p(F1, Becel) + a(Kalorien, F2) ∙ p(F2, Becel) + …

+ a(Kalorien, F5) ∙ p(F5, Becel)

– X(Preis, Du darfst) = a(Preis, F1) ∙ p(F1, Du darfst) + a(Preis, F2) ∙ p(F2, Du darfst) + … + a(Preis, F5) ∙ p(F5, Du darfst)

Nutzen der „Umrechnung“?Abbruchmöglich

keit!

Page 10: Methoden der Politikwissenschaft Faktorenanalyse Siegfried Schumann

10

Weitere Schritte der Faktorenanalyse I

• Kommunalitätenproblem– R = A ∙ A´ + U– Explizite Unterscheidung in gemeinsame Faktoren: A – spezifische

Faktoren: U– U beschreibt spezifische Varianz einer Variablen + Meßfehler– Der Teil der Gesamtvarianz einer Variablen, der durch die Faktoren erklärt

werden soll, muss festgelegt werden (Kommunalität)

• Schätzung der Kommunalitäten– Gesamte Varianz soll erklärt werden → Hauptkomponentenanalyse (PC)– Schätzung nach inhaltlichen Vorgaben → Hauptachsenanalyse (PAF)

Kriterium oft: r2max mit anderer Variablen; multiples Bestimmtheitsmaß

– Bestimmung durch Iterationsprozeß → Hauptachsenanalyse (PAF) keine Eingriffsmöglichkeit; Kriterium: Konvergenz der Iterationen; Startwert oft: Multiples Bestimmtheitsmaß

Items: keine Einzelrestvarianz!(spez. Varianz + Fehlervarianz)

SPSS

Page 11: Methoden der Politikwissenschaft Faktorenanalyse Siegfried Schumann

11

Weitere Schritte der Faktorenanalyse II

• Festlegung der Zahl der zu extrahierenden Faktoren– Kaiser-Kriterium– Scree-Test

• Meist (oblique/rechtwinklige) Rotation der Faktoren (Varimax)– „gleichwertige Lösungen“– Ziel meist: möglichst gute Annäherung an Einfachstruktur– Gelegentlich: schiefwinklige Rotation

eigentlich wäre jetzt neue FA nötig!

• Interpretation der Faktoren!– erster Schritt: Ladungen!

1 2 3 4 5 6 7 8 9 10 11 12 13

Faktornummer

0

1

2

3

4

5

6

Eige

nwer

t

Screeplot

Page 12: Methoden der Politikwissenschaft Faktorenanalyse Siegfried Schumann

12

Weitere Schritte der Faktorenanalyse III

• Bestimmung der Faktorwerte (Scores)– Z = A ∙ P (Grundgleichung der FA; Z ist bekannt; A wurde

bestimmt)

– Auflösung nach P: Z = A ∙ P │mult. von links mit inverser MatrixA-1 ∙ Z = A-1 ∙ A ∙ P │ A-1 ∙ A = E (Einheitsmatrix)A-1 ∙ Z = E ∙ P │ E ∙ P = P A-1 ∙ Z = P

– Problem:i.d.R. nicht quadratische Faktorenmuster A (Ziel: weniger Faktoren als Variablen!)→ Matrix-Inversion nicht möglich!

– Lösung:Schätzverfahren (s. S. 232)

Page 13: Methoden der Politikwissenschaft Faktorenanalyse Siegfried Schumann

13

Beispiel: SPSS-Kommando

FACTOR/VARIABLES fr10_1 fr10_2 fr10_3 fr10_4 fr10_5 fr10_6 fr10_7 fr10_8

fr10_9 fr10_10 fr10_11 z11.1 z11.3 /MISSING LISTWISE /ANALYSIS fr10_1 fr10_2 fr10_3 fr10_4 fr10_5 fr10_6 fr10_7 fr10_8

fr10_9 fr10_10 fr10_11 z11.1 z11.3

/PRINT UNIVARIATE CORRELATION EXTRACTION ROTATION /FORMAT SORT /PLOT EIGEN /CRITERIA MINEIGEN(1) ITERATE(25) /EXTRACTION PAF /CRITERIA ITERATE(25) /ROTATION VARIMAX /METHOD=CORRELATION .

Page 14: Methoden der Politikwissenschaft Faktorenanalyse Siegfried Schumann

14

Mittelwe

rt

Standardabweich

ungAnalyse

Nfr10_1 Institutionenvertrauen: Bundestag 4,85 2,397 1239fr10_2 Institutionenvertrauen:

Bundesverfassungsgericht 6,35 2,475 1239

fr10_3 Institutionenvertrauen: Verwaltung 4,80 2,286 1239fr10_4 Institutionenvertrauen:

Bundesregierung 4,31 2,529 1239

fr10_5 Institutionenvertrauen: Gerichte 5,92 2,371 1239fr10_6 Institutionenvertrauen: Parteien 3,77 2,202 1239fr10_7 Institutionenvertrauen: Polizei 6,40 2,240 1239fr10_8 Institutionenvertrauen: Bundeswehr 6,04 2,264 1239fr10_9 Institutionenvertrauen: katholische

Kirche 4,37 2,741 1239

fr10_10 Institutionenvertrauen: evangelische Kirche 4,82 2,483 1239

fr10_11 Institutionenvertrauen Gewerkschaften 4,26 2,327 1239

z11.1 Vertrauen - Kirchen 4,61 2,875 1239z11.3 Vertrauen -

Wirtschafts-/Arbeitgeberverbände 3,94 2,370 1239

Deskriptive Statistiken

Page 15: Methoden der Politikwissenschaft Faktorenanalyse Siegfried Schumann

15

1 2 3 4 5 6 7 8 9 10 11 12 13

Faktornummer

0

1

2

3

4

5

6

Eig

enw

ert

Screeplot

Screeplot

Page 16: Methoden der Politikwissenschaft Faktorenanalyse Siegfried Schumann

16

Faktor1 2 3

fr10_1 Institutionenvertrauen: Bundestag ,769 -,303 ,186fr10_3 Institutionenvertrauen: Verwaltung ,752 -,125 ,015fr10_5 Institutionenvertrauen: Gerichte ,738 -,162 -,221fr10_2 Institutionenvertrauen:

Bundesverfassungsgericht ,709 -,214 -,178fr10_6 Institutionenvertrauen: Parteien ,705 -,204 ,277fr10_7 Institutionenvertrauen: Polizei ,703 ,007 -,536fr10_4 Institutionenvertrauen:

Bundesregierung ,688 -,342 ,360fr10_10 Institutionenvertrauen: evangelische

Kirche ,647 ,501 ,113fr10_9 Institutionenvertrauen: katholische

Kirche ,624 ,593 ,142fr10_8 Institutionenvertrauen: Bundeswehr ,584 ,044 -,401z11.1 Vertrauen - Kirchen ,498 ,496 ,115fr10_11 Institutionenvertrauen:

Gewerkschaften ,469 -,083 ,171z11.3 Vertrauen -

Wirtschafts-/Arbeitgeberverbände ,372 ,119 ,010

Faktormatrix (unrotiert!)

Extraktionsmethode: Hauptachsen-Faktorenanalyse.3 Faktoren extrahiert. Es werden 12 Iterationen benötigt.

Page 17: Methoden der Politikwissenschaft Faktorenanalyse Siegfried Schumann

17

Extraktionfr10_1 Institutionenvertrauen: Bundestag ,717fr10_2 Institutionenvertrauen: Bundesverfassungsgericht ,581fr10_3 Institutionenvertrauen: Verwaltung ,581fr10_4 Institutionenvertrauen: Bundesregierung ,719fr10_5 Institutionenvertrauen: Gerichte ,619fr10_6 Institutionenvertrauen: Parteien ,616fr10_7 Institutionenvertrauen: Polizei ,781fr10_8 Institutionenvertrauen: Bundeswehr ,504fr10_9 Institutionenvertrauen: katholische Kirche ,761fr10_10 Institutionenvertrauen: evangelische Kirche ,683fr10_11 Institutionenvertrauen: Gewerkschaften ,256z11.1 Vertrauen - Kirchen ,508z11.3 Vertrauen - Wirtschafts-/Arbeitgeberverbände ,153

Kommunalitäten

Extraktionsmethode: Hauptachsen-Faktorenanalyse.

Page 18: Methoden der Politikwissenschaft Faktorenanalyse Siegfried Schumann

18

Faktor

Summen von quadrierten Faktorladungen für Extraktion

Rotierte Summe der quadrierten Ladungen

Gesamt% der Varianz

Kumulierte % Gesamt

% der Varianz

Kumulierte %

1 5,424 41,726 41,726 2,973 22,871 22,871

2 1,210 9,305 51,031 2,311 17,777 40,648

3 ,845 6,501 57,532 2,195 16,884 57,532

Erklärte Gesamtvarianz – unrotiert / rotiert

Extraktionsmethode: Hauptachsen-Faktorenanalyse.

Eigenwerte

Page 19: Methoden der Politikwissenschaft Faktorenanalyse Siegfried Schumann

19

Faktor1 2 3

fr10_4 Institutionenvertrauen: Bundesregierung ,828 ,132 ,127

fr10_1 Institutionenvertrauen: Bundestag ,769 ,315 ,161fr10_6 Institutionenvertrauen: Parteien ,723 ,194 ,234fr10_3 Institutionenvertrauen: Verwaltung ,574 ,426 ,265fr10_11 Institutionenvertrauen:

Gewerkschaften ,447 ,134 ,197fr10_7 Institutionenvertrauen: Polizei ,180 ,835 ,228fr10_8 Institutionenvertrauen: Bundeswehr ,153 ,653 ,232fr10_5 Institutionenvertrauen: Gerichte ,459 ,615 ,173fr10_2 Institutionenvertrauen:

Bundesverfassungsgericht ,490 ,570 ,126fr10_9 Institutionenvertrauen: katholische

Kirche ,179 ,172 ,837fr10_10 Institutionenvertrauen: evangelische

Kirche ,228 ,218 ,764z11.1 Vertrauen - Kirchen ,131 ,133 ,688z11.3 Vertrauen -

Wirtschafts-/Arbeitgeberverbände ,190 ,189 ,284Extraktionsmethode: Hauptachsen-Faktorenanalyse. Rotationsmethode: Varimax mit Kaiser-Normalisierung.a Die Rotation ist in 5 Iterationen konvergiert.

Rotierte Faktorenmatrix

Page 20: Methoden der Politikwissenschaft Faktorenanalyse Siegfried Schumann

20

Zusammenfassung der Ergebnisse

Ladung (unrotierte Lösung)

Kommu-

Ladung (rotierte Lösung)

Kommu-

1 2 3 nalität 1 2 3 nalitätfr10_4 ,688 -,342 ,360 ,719 ,828 ,132 ,127 ,719fr10_1 ,769 -,303 ,186 ,717 ,769 ,315 ,161 ,717fr10_6 ,705 -,204 ,277 ,616 ,723 ,194 ,234 ,616fr10_3 ,752 -,125 ,015 ,581 ,574 ,426 ,265 ,581

fr10_11 ,469 -,083 ,171 ,256 ,447 ,134 ,197 ,256fr10_7 ,703 ,007 -,536 ,781 ,180 ,835 ,228 ,781fr10_8 ,584 ,044 -,401 ,504 ,153 ,653 ,232 ,504fr10_5 ,738 -,162 -,221 ,619 ,459 ,615 ,173 ,619fr10_2 ,709 -,214 -,178 ,581 ,490 ,570 ,126 ,581fr10_9 ,624 ,593 ,142 ,761 ,179 ,172 ,837 ,761

fr10_10 ,647 ,501 ,113 ,683 ,228 ,218 ,764 ,683z11.1 ,498 ,496 ,115 ,508 ,131 ,133 ,688 ,508z11.3 ,372 ,119 ,010 ,153 ,190 ,189 ,284 ,153

Σ Ladung2 5.424

1.210 0.845 Σ 7.479

2.973 2.311 2.195

Σ 7.479

%erkl. Var.

41.726

9.305 6.501 Σ 57.532

22.871

17.777

16.884

Σ 57.532

erklärte Varianz insgesamt: 57.532%

erkl. Varianz = Eigenwerte : 13

Eigenwerte

Page 21: Methoden der Politikwissenschaft Faktorenanalyse Siegfried Schumann

21

SPSS-Ergebnis für: PC, NFACTORS = 13

Kommunalitäten

1,0001,0001,0001,0001,0001,0001,0001,0001,0001,0001,0001,0001,000

fr10_1 Inst.vertrauen: Bundestagfr10_2 Inst.vertrauen: Bundesverfassungsgerichtfr10_3 Inst.vertrauen: Verwaltungfr10_4 Inst.vertrauen: Bundesregierungfr10_5 Inst.vertrauen: Gerichtefr10_6 Inst.vertrauen: Parteienfr10_7 Inst.vertrauen: Polizeifr10_8 Inst.vertrauen: Bundeswehrfr10_9 Inst.vertrauen: katholische Kirchefr10_10 Inst.vertrauen: evangelische Kirchefr10_11 Inst.vertrauen: Gewerkschaftenz11.1 Vertrauen - Kirchenz11.3 Vertrauen - Wirtschafts-/Arbeitgeberverb.

Extraktion

Extraktionsmethode: Hauptkomponentenanalyse.

Erklärte Gesamtvarianz

5,806 44,664 44,6641,567 12,052 56,7171,210 9,307 66,024,915 7,041 73,065,724 5,566 78,631,609 4,683 83,314,431 3,318 86,632,377 2,897 89,530,360 2,773 92,302,302 2,323 94,625,257 1,976 96,601,241 1,850 98,451,201 1,549 100,000

Kompo-nente12345678910111213

Gesamt % der Varianz Kumulierte %

Summen von quadrierten Faktorladungenfür Extraktion

Extraktionsmethode: Hauptkomponentenanalyse.

!

Page 22: Methoden der Politikwissenschaft Faktorenanalyse Siegfried Schumann

22

Vielen Dank für IhreAufmerksamkeit!