methoden der politikwissenschaft faktorenanalyse siegfried schumann

Post on 06-Apr-2016

228 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Methoden der Politikwissenschaft

Faktorenanalyse

Siegfried Schumann

2

Organisatorische Vorbemerkungen:

• Für Sozialwissenschaften meist irrelevant:– Vorgeschaltete Mittelwertbildung (Hausfrauen-Urteile)

• Nicht behandelt:– Eignung der Korrelationsmatrix– Graphische Interpretation der Faktoren

3

Übersicht zur Faktorenanalyse (FA)

1. Korrelationsmatrix:

2. Grundgleichung der FA: Ladung · Score

3. Durch Einsetzen:

Korrelationsmatrix der Faktoren „C“

Falls Faktoren unkorreliert: C = Einheitsmatrix: (Fundamentaltheorem d. FA)

4. Erweiterung: (spez. Varianz + Messfehler; wird festgelegt; Ladungen

werden so gewählt, dass 1. Faktor max. Varianz erklärt)

5. Berechnung der Faktorwerte: Gleichung nicht immer lösbar; Ergebnis: Faktorscores

ZZ1K

1R

PAZ

PAPA1K

1R

ACAAPP1K

1AR

AAR

UAAR

ZAP 1 PAZ

Beobachteter Wert ↔ Linearkombination mehrerer (errechneter) Faktoren

4

Vorarbeiten: Berechnung der Standardabweichung

Vitamingehalt Haltbarkeit Preis

(x-AM) (x-AM)2 (x-AM) (x-AM)2 (x-AM) (x-AM)2

-1,66667

2,77779 -2,500

006,25000 -

2,66667

7,11113

-0,66667

0,44445 -0,500

000,25000 -

0,66667

0,44445

0,33333

0,11111 0,50000 0,25000 0,33333 0,11111

2.33333

5,44443 -1,500

002,25000 -

1,66667

2,77779

-0,66667

0,44445 1,50000 2,25000 2,33333 5,44443

0,33333

0,11111 2,50000 6,25000 2,33333 5,44443

SAQ: 9,33334

SAQ: 17,50000

SAQ: 21,33334

SD: 1,36626

SD: 1,87083 SD: 2,06559

Anteil unges. Fettsäuren:

AM = 2,83333

(S. 193)

SD = 1,47196 (S. 199)

Kaloriengehalt: AM = 4,16667

(S. 193)

SD = 1,94079 (S. 199)

Vitamingehalt: AM = 3,66667

(S. 193)

SD = 1,36626 (Tabelle)

Haltbarkeit: AM = 3,50000

(S. 193)

SD = 1,87083 (Tabelle)

Preis: AM = 4,66667

(S. 193)

SD = 2,06559 (Tabelle)

5

z-standardisierte Ausgangswerte transponierte MatrixRama Sanell

aBecel Du

darfstHoll.

ButterWeihn

. Butter

AF Ka Vi Ha Pr

AF -1,2455

0

-0,5661

4

0,79260

1,47196

-0,5661

4

0,11323

-1,2455

0

-1,6316

4

-1,2198

8

-1,3363

1

-1,2910

0Ka -

1,63164

0,94463

0,42938

0,94463

-0,6011

3

-0,0858

8

-0,5661

4

0,94463

-0,4879

5

-0,2672

6

-0,3227

5Vi -

1,21988

-0,4879

5

0,24397

1,70782

-0,4879

5

0,24397

0,79260

0,42938

0,24397

0,26726

0,16137

Ha -1,3363

1

-0,2672

6

0,26726

-0,8017

8

0,80178

1,33631

1,47196

0,94463

1,70782

-0,8017

8

-0,8068

7Pr -

1,29100

-0,3227

5

0,16137

-0,8068

7

1,12962

1,12962

-0,5661

4

-0,6011

3

-0,4879

5

0,80178

1,12962

0,11323

-0,0858

8

0,24397

1,33631

1,12962

KorrelationsmatrixAF Ka Vi Ha Pr

AF (Anteil unges. Fetts.)

1,00000

0,71176

0,96134 0,10894

0,04385

Ka (Kaloriengehalt) 0,71176

1,00000

0,70397 0,13771

0,06652

Vi (Vitamingehalt) 0,96134

0,70397

1,00000

0,07825

0,02362

Ha (Haltbarkeit) 0,10894

0,13771

0,07825 1,00000

0,98334

Pr (Preis) 0,04385

0,06652

0,02362 0,98334

1,00000

Errechnung der Korrelationsmatrix aus z-Werten

ZZ1K

1R

yx

xyxy ss

sr

1nSAPsxy

Zur Erinnerung:

6

Konstellation (Demonstrationsbeispiel nach Bortz):

• Untersucht werden 6 „Objekte“ (Personen):– Karin, Heinz, Sonja, Kurt, Eva, Karl

• Die „Objekte“ haben Ausprägungen bei den „Merkmalen“ (Testergebnisse):– Bi: Bilderrätsel– Ma: Mathematikaufgabe– Pu: Puzzle– Re: Reproduktions (Gedächtnis-) Aufgabe– Kr: Kreuzworträtsel

• Es ergeben sich folgende korrelative Zusammenhänge (schematisch): F1: praktische Intelligenz F2: theoret. Intelligenz + F3 + F4 + F5

Bi Pu Re Ma Kr

• Vermutung:– Scheinkorrelation! Nur wenn diese Vermutung zutrifft, ist eine FA

sinnvoll!

7

Zur Grundgleichung der FA (Bortz-Beispiel)

• Bildung von 5 neuen orthogonalen Variablen (bei n = 5 „Merkmalen“)– F1 + F2 + F3 + F4 + F5– Schritt für Schritt nacheinander – rein rechnerisch!– Restriktion: jeweils maximale (Rest-)Varianzerklärung– bei n = 5 Faktoren: gesamte Ausgangsvarianz erklärt!

• Korrelation der neuen Variablen (Faktoren) mit den ursprünglichen Variablen– F1 F2 F3 F4 F5 ∙ Bi Ma Pu Re Kr – Ladungen: a

• Für die neuen Variablen (Faktoren) gilt: – Für jedes „Objekt“ wird eine Ausprägung auf jedem Faktor errechnet.– Faktorscore: p

• Beispiele zum Fundamentaltheorem der Faktorenanalyse (S. 207 / 208)– X(Bilderrätsel, Eva) = a(Bilderrätsel, F1) ∙ p(F1, Eva) + a(Bilderrätsel, F2) ∙ p(F2, Eva) + …

+ a(Bilderrätsel, F5) ∙ p(F5, Eva)

– X(Puzzle, Heinz) = a(Puzzle, F1) ∙ p(F1, Heinz) + a(Puzzle, F2) ∙ p(F2, Heinz) + … + a(Puzzle, F5) ∙ p(F5, Heinz)

Nutzen der „Umrechnung“?Abbruchmöglich

keit!

Beobachteter Wert ↔ Linearkombination mehrerer (errechneter) Faktoren

8

• Untersucht werden 6 „Objekte“:– Rama, Sanella, Becel, Du darfst, Holländische Butter, Weihnachtsbutter

• Die „Objekte“ haben Ausprägungen bei den „Merkmalen“ (Variablen):– AF: Anteil ungesättigter Fettsäuren– Ka: Kaloriengehalt– Vi: Vitamingehalt– Ha: Haltbarkeit– Pr: Preis

• Es ergeben sich folgende korrelative Zusammenhänge (schematisch):

F1: Gesundheit F2: Wirtschaftlichkeit + F3 + F4 + F5

AF Ka Vi Ha Pr

• Vermutung:– Scheinkorrelation! Nur wenn diese Vermutung zutrifft, ist eine FA

sinnvoll!

Konstellation (Backhaus u.a.):

9

Zur Grundgleichung der FA (Backhaus u.a.)

• Bildung von 5 neuen orthogonalen Variablen (bei n = 5 „Merkmalen“)– F1 + F2 + F3 + F4 + F5– Schritt für Schritt nacheinander – rein rechnerisch!– Restriktion: jeweils maximale (Rest-)Varianzerklärung– bei n = 5 Faktoren: gesamte Ausgangsvarianz erklärt!

• Korrelation der neuen Variablen (Faktoren) mit den ursprünglichen Variablen– F1 F2 F3 F4 F5 ∙ AF Ka Vi Ha Pr – Ladungen: a

• Für die neuen Variablen (Faktoren) gilt: – Für jedes „Objekt“ wird eine Ausprägung auf jedem Faktor errechnet.– Faktorscore: p

• Beispiele zum Fundamentaltheorem der Faktorenanalyse (S. 207 / 208)– X(Kalorien, Becel) = a(Kalorien, F1) ∙ p(F1, Becel) + a(Kalorien, F2) ∙ p(F2, Becel) + …

+ a(Kalorien, F5) ∙ p(F5, Becel)

– X(Preis, Du darfst) = a(Preis, F1) ∙ p(F1, Du darfst) + a(Preis, F2) ∙ p(F2, Du darfst) + … + a(Preis, F5) ∙ p(F5, Du darfst)

Nutzen der „Umrechnung“?Abbruchmöglich

keit!

10

Weitere Schritte der Faktorenanalyse I

• Kommunalitätenproblem– R = A ∙ A´ + U– Explizite Unterscheidung in gemeinsame Faktoren: A – spezifische

Faktoren: U– U beschreibt spezifische Varianz einer Variablen + Meßfehler– Der Teil der Gesamtvarianz einer Variablen, der durch die Faktoren erklärt

werden soll, muss festgelegt werden (Kommunalität)

• Schätzung der Kommunalitäten– Gesamte Varianz soll erklärt werden → Hauptkomponentenanalyse (PC)– Schätzung nach inhaltlichen Vorgaben → Hauptachsenanalyse (PAF)

Kriterium oft: r2max mit anderer Variablen; multiples Bestimmtheitsmaß

– Bestimmung durch Iterationsprozeß → Hauptachsenanalyse (PAF) keine Eingriffsmöglichkeit; Kriterium: Konvergenz der Iterationen; Startwert oft: Multiples Bestimmtheitsmaß

Items: keine Einzelrestvarianz!(spez. Varianz + Fehlervarianz)

SPSS

11

Weitere Schritte der Faktorenanalyse II

• Festlegung der Zahl der zu extrahierenden Faktoren– Kaiser-Kriterium– Scree-Test

• Meist (oblique/rechtwinklige) Rotation der Faktoren (Varimax)– „gleichwertige Lösungen“– Ziel meist: möglichst gute Annäherung an Einfachstruktur– Gelegentlich: schiefwinklige Rotation

eigentlich wäre jetzt neue FA nötig!

• Interpretation der Faktoren!– erster Schritt: Ladungen!

1 2 3 4 5 6 7 8 9 10 11 12 13

Faktornummer

0

1

2

3

4

5

6

Eige

nwer

t

Screeplot

12

Weitere Schritte der Faktorenanalyse III

• Bestimmung der Faktorwerte (Scores)– Z = A ∙ P (Grundgleichung der FA; Z ist bekannt; A wurde

bestimmt)

– Auflösung nach P: Z = A ∙ P │mult. von links mit inverser MatrixA-1 ∙ Z = A-1 ∙ A ∙ P │ A-1 ∙ A = E (Einheitsmatrix)A-1 ∙ Z = E ∙ P │ E ∙ P = P A-1 ∙ Z = P

– Problem:i.d.R. nicht quadratische Faktorenmuster A (Ziel: weniger Faktoren als Variablen!)→ Matrix-Inversion nicht möglich!

– Lösung:Schätzverfahren (s. S. 232)

13

Beispiel: SPSS-Kommando

FACTOR/VARIABLES fr10_1 fr10_2 fr10_3 fr10_4 fr10_5 fr10_6 fr10_7 fr10_8

fr10_9 fr10_10 fr10_11 z11.1 z11.3 /MISSING LISTWISE /ANALYSIS fr10_1 fr10_2 fr10_3 fr10_4 fr10_5 fr10_6 fr10_7 fr10_8

fr10_9 fr10_10 fr10_11 z11.1 z11.3

/PRINT UNIVARIATE CORRELATION EXTRACTION ROTATION /FORMAT SORT /PLOT EIGEN /CRITERIA MINEIGEN(1) ITERATE(25) /EXTRACTION PAF /CRITERIA ITERATE(25) /ROTATION VARIMAX /METHOD=CORRELATION .

14

Mittelwe

rt

Standardabweich

ungAnalyse

Nfr10_1 Institutionenvertrauen: Bundestag 4,85 2,397 1239fr10_2 Institutionenvertrauen:

Bundesverfassungsgericht 6,35 2,475 1239

fr10_3 Institutionenvertrauen: Verwaltung 4,80 2,286 1239fr10_4 Institutionenvertrauen:

Bundesregierung 4,31 2,529 1239

fr10_5 Institutionenvertrauen: Gerichte 5,92 2,371 1239fr10_6 Institutionenvertrauen: Parteien 3,77 2,202 1239fr10_7 Institutionenvertrauen: Polizei 6,40 2,240 1239fr10_8 Institutionenvertrauen: Bundeswehr 6,04 2,264 1239fr10_9 Institutionenvertrauen: katholische

Kirche 4,37 2,741 1239

fr10_10 Institutionenvertrauen: evangelische Kirche 4,82 2,483 1239

fr10_11 Institutionenvertrauen Gewerkschaften 4,26 2,327 1239

z11.1 Vertrauen - Kirchen 4,61 2,875 1239z11.3 Vertrauen -

Wirtschafts-/Arbeitgeberverbände 3,94 2,370 1239

Deskriptive Statistiken

15

1 2 3 4 5 6 7 8 9 10 11 12 13

Faktornummer

0

1

2

3

4

5

6

Eig

enw

ert

Screeplot

Screeplot

16

Faktor1 2 3

fr10_1 Institutionenvertrauen: Bundestag ,769 -,303 ,186fr10_3 Institutionenvertrauen: Verwaltung ,752 -,125 ,015fr10_5 Institutionenvertrauen: Gerichte ,738 -,162 -,221fr10_2 Institutionenvertrauen:

Bundesverfassungsgericht ,709 -,214 -,178fr10_6 Institutionenvertrauen: Parteien ,705 -,204 ,277fr10_7 Institutionenvertrauen: Polizei ,703 ,007 -,536fr10_4 Institutionenvertrauen:

Bundesregierung ,688 -,342 ,360fr10_10 Institutionenvertrauen: evangelische

Kirche ,647 ,501 ,113fr10_9 Institutionenvertrauen: katholische

Kirche ,624 ,593 ,142fr10_8 Institutionenvertrauen: Bundeswehr ,584 ,044 -,401z11.1 Vertrauen - Kirchen ,498 ,496 ,115fr10_11 Institutionenvertrauen:

Gewerkschaften ,469 -,083 ,171z11.3 Vertrauen -

Wirtschafts-/Arbeitgeberverbände ,372 ,119 ,010

Faktormatrix (unrotiert!)

Extraktionsmethode: Hauptachsen-Faktorenanalyse.3 Faktoren extrahiert. Es werden 12 Iterationen benötigt.

17

Extraktionfr10_1 Institutionenvertrauen: Bundestag ,717fr10_2 Institutionenvertrauen: Bundesverfassungsgericht ,581fr10_3 Institutionenvertrauen: Verwaltung ,581fr10_4 Institutionenvertrauen: Bundesregierung ,719fr10_5 Institutionenvertrauen: Gerichte ,619fr10_6 Institutionenvertrauen: Parteien ,616fr10_7 Institutionenvertrauen: Polizei ,781fr10_8 Institutionenvertrauen: Bundeswehr ,504fr10_9 Institutionenvertrauen: katholische Kirche ,761fr10_10 Institutionenvertrauen: evangelische Kirche ,683fr10_11 Institutionenvertrauen: Gewerkschaften ,256z11.1 Vertrauen - Kirchen ,508z11.3 Vertrauen - Wirtschafts-/Arbeitgeberverbände ,153

Kommunalitäten

Extraktionsmethode: Hauptachsen-Faktorenanalyse.

18

Faktor

Summen von quadrierten Faktorladungen für Extraktion

Rotierte Summe der quadrierten Ladungen

Gesamt% der Varianz

Kumulierte % Gesamt

% der Varianz

Kumulierte %

1 5,424 41,726 41,726 2,973 22,871 22,871

2 1,210 9,305 51,031 2,311 17,777 40,648

3 ,845 6,501 57,532 2,195 16,884 57,532

Erklärte Gesamtvarianz – unrotiert / rotiert

Extraktionsmethode: Hauptachsen-Faktorenanalyse.

Eigenwerte

19

Faktor1 2 3

fr10_4 Institutionenvertrauen: Bundesregierung ,828 ,132 ,127

fr10_1 Institutionenvertrauen: Bundestag ,769 ,315 ,161fr10_6 Institutionenvertrauen: Parteien ,723 ,194 ,234fr10_3 Institutionenvertrauen: Verwaltung ,574 ,426 ,265fr10_11 Institutionenvertrauen:

Gewerkschaften ,447 ,134 ,197fr10_7 Institutionenvertrauen: Polizei ,180 ,835 ,228fr10_8 Institutionenvertrauen: Bundeswehr ,153 ,653 ,232fr10_5 Institutionenvertrauen: Gerichte ,459 ,615 ,173fr10_2 Institutionenvertrauen:

Bundesverfassungsgericht ,490 ,570 ,126fr10_9 Institutionenvertrauen: katholische

Kirche ,179 ,172 ,837fr10_10 Institutionenvertrauen: evangelische

Kirche ,228 ,218 ,764z11.1 Vertrauen - Kirchen ,131 ,133 ,688z11.3 Vertrauen -

Wirtschafts-/Arbeitgeberverbände ,190 ,189 ,284Extraktionsmethode: Hauptachsen-Faktorenanalyse. Rotationsmethode: Varimax mit Kaiser-Normalisierung.a Die Rotation ist in 5 Iterationen konvergiert.

Rotierte Faktorenmatrix

20

Zusammenfassung der Ergebnisse

Ladung (unrotierte Lösung)

Kommu-

Ladung (rotierte Lösung)

Kommu-

1 2 3 nalität 1 2 3 nalitätfr10_4 ,688 -,342 ,360 ,719 ,828 ,132 ,127 ,719fr10_1 ,769 -,303 ,186 ,717 ,769 ,315 ,161 ,717fr10_6 ,705 -,204 ,277 ,616 ,723 ,194 ,234 ,616fr10_3 ,752 -,125 ,015 ,581 ,574 ,426 ,265 ,581

fr10_11 ,469 -,083 ,171 ,256 ,447 ,134 ,197 ,256fr10_7 ,703 ,007 -,536 ,781 ,180 ,835 ,228 ,781fr10_8 ,584 ,044 -,401 ,504 ,153 ,653 ,232 ,504fr10_5 ,738 -,162 -,221 ,619 ,459 ,615 ,173 ,619fr10_2 ,709 -,214 -,178 ,581 ,490 ,570 ,126 ,581fr10_9 ,624 ,593 ,142 ,761 ,179 ,172 ,837 ,761

fr10_10 ,647 ,501 ,113 ,683 ,228 ,218 ,764 ,683z11.1 ,498 ,496 ,115 ,508 ,131 ,133 ,688 ,508z11.3 ,372 ,119 ,010 ,153 ,190 ,189 ,284 ,153

Σ Ladung2 5.424

1.210 0.845 Σ 7.479

2.973 2.311 2.195

Σ 7.479

%erkl. Var.

41.726

9.305 6.501 Σ 57.532

22.871

17.777

16.884

Σ 57.532

erklärte Varianz insgesamt: 57.532%

erkl. Varianz = Eigenwerte : 13

Eigenwerte

21

SPSS-Ergebnis für: PC, NFACTORS = 13

Kommunalitäten

1,0001,0001,0001,0001,0001,0001,0001,0001,0001,0001,0001,0001,000

fr10_1 Inst.vertrauen: Bundestagfr10_2 Inst.vertrauen: Bundesverfassungsgerichtfr10_3 Inst.vertrauen: Verwaltungfr10_4 Inst.vertrauen: Bundesregierungfr10_5 Inst.vertrauen: Gerichtefr10_6 Inst.vertrauen: Parteienfr10_7 Inst.vertrauen: Polizeifr10_8 Inst.vertrauen: Bundeswehrfr10_9 Inst.vertrauen: katholische Kirchefr10_10 Inst.vertrauen: evangelische Kirchefr10_11 Inst.vertrauen: Gewerkschaftenz11.1 Vertrauen - Kirchenz11.3 Vertrauen - Wirtschafts-/Arbeitgeberverb.

Extraktion

Extraktionsmethode: Hauptkomponentenanalyse.

Erklärte Gesamtvarianz

5,806 44,664 44,6641,567 12,052 56,7171,210 9,307 66,024,915 7,041 73,065,724 5,566 78,631,609 4,683 83,314,431 3,318 86,632,377 2,897 89,530,360 2,773 92,302,302 2,323 94,625,257 1,976 96,601,241 1,850 98,451,201 1,549 100,000

Kompo-nente12345678910111213

Gesamt % der Varianz Kumulierte %

Summen von quadrierten Faktorladungenfür Extraktion

Extraktionsmethode: Hauptkomponentenanalyse.

!

22

Vielen Dank für IhreAufmerksamkeit!

top related