faktorenanalyse. explorative vs. konfirmatorische faktorenanalyse explorative fa dienen dem...

Post on 05-Apr-2015

120 Views

Category:

Documents

1 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Faktorenanalyse

explorative vs. konfirmatorische Faktorenanalyse

• Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen (Schleifen) wird nach der besten Lösung gesucht.

• Konfirmatorische FA überprüfen, ob empirisch erhobene Daten ein bestehendes theoretisches Modell bestätigen oder verwerfen. Alternativ kann eine explorative FA an einer anderen Stichprobe „kreuzvalidiert“ werden.

Faktorenanalyse: Was und wozu?

• Der Begriff Faktorenanalyse umfasst eine Gruppe multivariater Analyseverfahren, mit denen zugrundeliegende gemeinsame Dimensionen von Variablenmengen (z.B. Fragebogenitems) untersucht werden.

• Die Faktorenanalyse führt zu einer Datenreduktion: Die Variation in einer Vielzahl von Variablen wird auf eine geringere Zahl von gemeinsamen Faktoren zurückgeführt.

Exploratorische Faktorenanalyse

• Bei einer exploratorischen Faktorenanalyse existieren im „Idealfall“ keine Annahmen darüber, wie viele Faktoren den Variablen zugrunde liegen und welche Struktur die Zusammenhänge zwischen den Variablen haben.

• In der Praxis ist das natürlich fast nie der Fall; z.B. vermuten wir vorab, dass unseren Fragebögen nur eine einzige latente Dimension zugrunde liegt.

Exploratorische Faktorenanalyse

• Im Rahmen der exploratorischen Faktorenanalyse gehen wir, der Natur der Methode entsprechend, trotzdem „naiv“ vor. Die Fragen, welche am Ende der Analyse beantwortet sein sollen, sind:

• Wie viele Faktoren sind angemessen, um die Zusammenhänge zwischen den untersuchten Variablen zu erklären?

• Welche der Faktoren beeinflussen welche meiner Variablen?

Faktorenanalyse im Bild

Faktoren: latent (rund)

Items: manifest (eckig)

Voraussetzungen der Faktorenanalyse

• intervallskalierte Variablen

• normalverteilte Variablen

• n pro Variable mindestens 3

• substanzielle Korrelationen im Datensatz

• dichotome Variablen (0/1) mit Einschränkungen verwendbar

• viele Variablen werden durch wenige Faktoren ersetzt

• ein Faktor enthält die Information mehrerer Variablen

• Faktor: theoretische Variable oder Konstrukt, das allen wechselseitig hoch korrelierenden Variablen zu Grundeliegt

• Ergebnis der Faktorenanalyse: wechselseitig voneinander unabhängige Faktoren, die die Zusammenhänge zwischen den Variablen beschreiben oder erklären

Wesentliche Konzepte der Faktorenanalyse: Faktor

Wesentliche Konzepte der Faktorenanalyse: Faktorladung

• Korrelation einer Variablen mit einem Faktor

• Wertebereich: -1 bis +1

• „Variable lädt hoch oder niedrig auf diesem Faktor“

• über die Faktorladungen wird definiert, welche Variable zu welchem Faktor „gehört“ und damit auch, was jeder Faktor bedeutet

Wesentliche Konzepte der Faktorenanalyse: Kommunalität

• Die Kommunalität einer Variablen gibt an, in welchem Ausmaß die Varianz dieser Variablen durch die Faktoren erfasst / erklärt / aufgeklärt wird.

• Summe der quadrierten Ladungen einer Variablen über alle Faktoren

• Maximum: 1 (da die Gesamtvarianz jeder Variablen auf 1normiert ist)

wesentliche Konzepte der Faktorenanalyse: Faktorwert

• kennzeichnet die Position einer Person auf einem Faktor

• Wertebereich: standardisierte Werte mitM = 0, s = 1 (pro Faktor).

• Wie sehr weist eine Person die Eigenschaften des Faktors auf?

Wesentliche Konzepte der Faktorenanalyse: Eigenwert Faktor• gibt an, wie viel von der Gesamtvarianz

aller Variablen durch diesen Faktor erklärt wird

• Summe der quadrierten Ladungen aller Variablen auf diesem Faktor

• 0 - Max: (entspricht der Anzahl an Variablen)

SchematischeVeranschaulichungder Beziehungenvon Faktorladungen,Kommunalitäten undEigenwerten anhanddes Ladungsmustersvon vierVariablen auf zweiFaktoren.

Ladungsmatrix A

Fundamentaltheorem der Faktorenanalyse

• Ein beobachteter (standardisierter) Wert zij einer Person i in Variable j kann in eine Linearkombination aus den mit den Faktorladungen akj gewichteten Faktorwerten fik und einer Fehlerkomponente eij zerlegt werden.

• Gleichung für Person i:

zij=aj fi +aj fi2+ajk fik+...+ajq fiq+eij

• zij = der Wert der Person i in der beobachteten Variablen j;• ajk = Ladung der Variablen j auf Faktor k;• fik= Faktorwert der Person i in Faktor k;• eij = durch die Faktoren nicht erklärte Fehlerkomponente;• q = Anzahl der Faktoren (k = 1, …, q)

Faktorenextraktion

• Die Faktorenextraktion erfolgt nach dem Kriterium, dass jeder Faktor sukzessiv so viel Varianz in den untersuchten Variablen erklärt wie möglich.

• Jeder neue Faktor erklärt dabei nur Varianz, die von den zuvor extrahierten Faktoren nicht erklärt wurde.

• Zur Faktorenextraktion stehen verschiedene Verfahren zur Verfügung. Die beiden bedeutendsten sind die Hauptkomponentenanalyse (principal components analysis, PCA) und die Hauptachsenanalyse (principal axes factor analysis, PFA).

• Beide Verfahren unterscheiden sich vor allem hinsichtlich der Annahmen bezüglich der durch die Faktoren in den Variablen erklärbaren Varianz.

Bestimmung der Faktorzahl I

• Kaiser-Guttman-Regel (Eigenwertkriterium)–Alle Faktoren mit einem Eigenwert größer 1 werden aufgenommen.

–Somit erklärt ein Faktor immer mehr Varianz als eine ursprüngliche Variable.

• Kriterium der extrahierten Varianz–Durch Vorüberlegungen kann festgelegt werden, wie groß der Anteil der extrahierten Varianz durch die aufgenommenen Faktoren sein soll.

Bestimmung der Faktorzahl II

Erklärte Gesamtvarianz

5.262 35.083 35.083

1.636 10.908 45.991

1.477 9.849 55.840

1.219 8.126 63.966

1.112 7.412 71.378

.841 5.605 76.983

.650 4.335 81.318

.585 3.902 85.220

.534 3.560 88.780

.485 3.231 92.011

.357 2.381 94.392

.259 1.728 96.120

.243 1.619 97.739

.182 1.211 98.950

.157 1.050 100.000

Komponente1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

Gesamt % der Varianz Kumulierte %

Anfängliche Eigenwerte

Extraktionsmethode: Hauptkomponentenanalyse.

Eigenwerte

3 Faktoren klären über 50% der Merkmals-varianz auf.

10 Faktoren klären über 90% der Merkmalsvarianz auf.

Kaiser-Guttman Kriterium

• Screeplot–Über den „Knick“ im

Verlauf der Eigenwerte wird entschieden, wie viele Faktoren extrahiert werden.

–Im Beispiel würde man sich für 2 Faktoren entscheiden.

Screeplot

Faktor

1110987654321

Eig

enw

ert

4

3

2

1

0

Bestimmung der Faktorzahl III

Das Rotationsproblem

• Die Position der Faktoren ist zunächst nach Maximierung der Varianzaufklärung gewählt.

• Nach Bestimmung von Zahl (und Lage) der Faktoren ist eine Rotation um den Ursprung ohne Informationsverlust möglich.

• Ziel: Einfachstruktur, d.h. hohe Ladung der Faktoren auf einigen Variablen, niedrige auf den anderen.

Vor der Rotation

Variablen sind nur schwer zuzuordnen

Komponentenmatrixa

,799

,663

,786

,772

,371 -,562

,354

,376 ,619

,650 -,401

-,496 ,590

,358 ,756

,500 ,618

Psi

Astrologie

Hexen

Spiritismus

traditionell religioes

alternativ religioes

Offenheit

Neurotizismus

Lebenszufriedenheit

Leistungsbereitschaft

Sensation seeking

1 2 3

Komponente

Extraktionsmethode: Hauptkomponentenanalyse.

3 Komponenten extrahierta.

Nach der Rotation

Problem der Zuordnung nur noch bei der Variablen Leistungsbereitschaft

Rotierte Komponentenmatrixa

,841

,634

,779

,801

,610

,308

,653 ,313

,338 ,671

-,771

,635 -,544

,787

Psi

Astrologie

Hexen

Spiritismus

traditionell religioes

alternativ religioes

Offenheit

Neurotizismus

Lebenszufriedenheit

Leistungsbereitschaft

Sensation seeking

1 2 3

Komponente

Extraktionsmethode: Hauptkomponentenanalyse. Rotationsmethode: Varimax mit Kaiser-Normalisierung.

Die Rotation ist in 6 Iterationen konvergiert.a.

Rotationsvarianten

Orthogonale Rotation:Die Faktoren werden rechtwinklig rotiert.Vorteil: Faktoren sind voneinander unabhängig.

Oblique Rotation:Die Faktoren werden schiefwinklig rotiert.Vorteil: Über die Faktoren kann eine Faktorenanalyse zweiter Ordnung berechnet werden.

Faktorenrotation

Gebräuchliche orthogonale Rotationstechniken• Varimax: Maximiert die Varianz der quadrierten

Faktorladungen innerhalb der Faktoren. Varimax ist der am häufigsten verwendete orthogonale Rotationsalgorithmus.

• Quartimax: Maximiert die Summe der vierten Potenz aller Faktorladungen. Es wird angestrebt, einen Faktor mit vielen hohen und mittleren Ladungen sowie verbleibende Faktoren mit wenigen hohen und sonst niedrigen Ladungen zu erhalten. Dieses Verfahren kann angezeigt sein, wenn ein gemeinsamer Generalfaktor erwartet wird.

Faktorenrotation

Gebräuchliche oblique Rotationstechniken• Promax: Dieser Algorithmus startet mit einer

orthogonalen Rotation und transformiert die Faktoren anschließend in eine oblique Lösung mit dem Ziel, die absoluten Werte der Primärladungen zu maximieren und die Sekundärladungen gegen Null gehen zu lassen

• Direct Oblimin: Ein Rotationsalgorithmus, der die simultane Optimierung eines orthogonalen und eines obliquen Rotationskriteriums anstrebt.

• Bei beiden obliquen Rotationsverfahren kann die Höhe der Faktorinterkorrelationen vom Benutzer beeinflusst werden.

Interpretation der Faktoren

• Die berechneten Faktoren müssen inhaltlich interpretiert werden.

• Die Faktorenanalyse bietet die Faktorladungen der Variablen an, kann Faktoren aber nicht benennen oder interpretieren.

Formen der FA

• „Kommunalitätsproblem“: Wie viel Varianz von jeder Variablen wird zu Beginn der FA aufgeklärt, also bevor die endgültige Lage der Faktoren bekannt ist?Wenn die Variable selbst als Faktor berücksichtigt wird: 100%

h² = 1Wenn nur die anderen Variablen berücksichtigt werden: weniger

h² < 1

• Bei der Hauptkomponentenanalyse (PCA = Principal Component Analysis) wird zu Beginn des Optimierungsprozesses eine Kommunalität von 1 angenommen.

• Bei der Hauptachsenanalyse wird zu Beginn des Optimierungsprozesses die Kommunalität für jede Variable geschätzt

Zusammenfassung

• Kommunalitäten: Summe der quadrierten Korrelationen einer Variable mit allen Faktoren; Prozentsatz der durch alle Faktoren beschriebenen Varianz einer Variablen

• Faktorladungen: Korrelation einer Variablen mit einem Faktor

• Faktorwerte: Kennzeichnet die Ausprägung eines Faktors für eine Person

• Eigenwert: Gesamtvarianz aller Variablen, die durch den Faktor aufgeklärt wird

top related