backhaus kapitel faktorenanalyse
Post on 20-Jun-2015
1.804 Views
Preview:
TRANSCRIPT
5 Faktorenanalyse
51 Problemstellung 260
52 Vorgehensweise 269 521 Variablenauswahl und Errechnung der Korrelationsmatrix 269 5211 Korrelationsanalyse zur Aufdeckung der Variablenshy
zusammenhaumlnge 269 5212 Eignung der Korrelationsmatrix 272 522 Extraktion der Faktoren 277 5221 Das Fundamentaltheorem 278 5222 Graphische Interpretation von Faktoren 279 5223 Das Problem der Faktorextraktion 284 523 Bestimmung der Kommunalitaumlten 289 524 Zahl der zu extrahierenden Faktoren 295 525 F aktorinterpretation 298 526 Bestimmung der Faktorwerte 302 527 Zusammenfassende Darstellung der Faktorenanalyse 305
53 Fallbeispiel 308 531 Problemstellung 308 532 Ergebnisse 3 10 533 SPSS-Kommandos 324
54 Anwendungsempfehlungen 325 541 Probleme bei der Anwendung der Faktorenanalyse 325 5411 Unvollstaumlndig beantwortete Frageboumlgen
Das Missing Value-Problem 325 5412 Starke Streuung der Antworten Das Problem der
Durchschnittsbildung 326 5413 Entdeckungs- oder BegtUumlndungszusammenhang Exploratorische
versus konfirmatorische Faktorenanalyse 330 542 Empfehlungen zur Durchfilhrung einer Faktorenanalyse 330
55 Literaturhinweise 332
ov nlIUOrtII11IlllIYSt Problemstellung 261
51 Problemstellung Abbildung 51 Anwendungsbeispiele der Faktorenanalyse
Fuumlr viele wissenschaftliche und praktische Fragestellungen geht es darum den Wirkungszusammenhang zwischen zwei oder mehreren Variablen zu untersuchen Methodisches Hilfsmittel dafilr sind in der Regel die Regressions- und Korrelatishyonsanalyse Reicht eine relativ geringe Zahl von unabhaumlngigen Variablen zur Ershyklaumlrung einer abhaumlngigen Variablen aus und lassen sich die unabhaumlngigen Variabshylen relativ leicht ermitteln so wirft diese Vorgehensweise kaum schwerwiegende Probleme auf
In manchen - insbesondere naturwissenschaftlichen - Bereichen kommt man in der Tat haumlufig mit einer relativ kleinen Zahl von Variablen aus um zB bestimmte physikalische Effekte erklaumlren bzw prognostizieren zu koumlnnen
In den Sozialwissenschaften ist die Situation jedoch anders 1 d R ist zur Erklaumlshyrung menschlicher Verhaltensweisen oder allgemeiner sozialer Phaumlnomene eine Vielzahl von Einfluszligfaktoren (Variablen) zu beruumlcksichtigen Je groumlszliger jedoch die Zahl der notwendigen Erklaumlrungsvariablen wird um so weniger ist gesichert daszlig diese auch tatsaumlchlich alle unabhaumlngig voneinander zur Erklaumlrung des Sachshyverhaltes notwendig sind Bedingen sich die Erklaumlrungsvariablen gegenseitig dann fuumlhrt die Einbeziehung aller Variablen zu unbefriedigenden Erklaumlrungswerten
Eines der Hauptprobleme sozialwissenschaftlicher Erklaumlrungsansaumltze liegt daher darin aus der Vielzahl moumlglicher Variablen die voneinander unabhaumlngigen Einfluszligfaktoren herauszukristallisieren die dann weiteren Analysen zugrunde geshylegt werden koumlnnen Genau das macht sich die Faktorenanalyse zur Aufgabe Im Gegensatz beispielsweise zur Regressionsanalyse versucht die Faktorenanalyse also einen Beitrag zur Entdeckung von untereinander unabhaumlngigen Beshyschreibungs- und Erklaumlrungsvariablen zu finden
Gelingt es tatsaumlchlich die Vielzahl moumlglicher Variablen auf wenige wichtige Einfluszligfaktoren zuruumlckzufuumlhren (zu reduzieren) lassen sich fuumlr empirische Unshytersuchungen erhebliche Vorteile realisieren So kann zB eine Vielzahl moumlglicher Einfluszligfaktoren getestet werden und es muszlig erst im nachhinein entschieden wershyden welche Variablen oder Variablenbuumlndel tatsaumlchlich erklaumlrungsrelevant sind Daruumlber hinaus ermoumlglicht dieses Verfahren durch die Datenreduktion eine Ershyleichterung empirischer Forschungsarbeit
In Abbildung 51 sind einige Anwendungsbeispiele der Faktorenanalyse zusamshymengestellt Sie vermitteln einen Einblick in die Problemstellung die Zahl und Art der Merkmale die aus den Merkmalen extrahierten Faktoren sowie die jeweiligen Untersuchungseinheiten
Problemstellung Merkmale Faktoren
StadtanalyseI
Bevoumllkerungszahl Bevoumllkerungs- und Beschaumlftigtenzahl Beschaumlftigtenfaktor Dienstleistungsangebot Ausbildungs- und Schulbildung Wirtschaftsfaktor Haumluserwert
Untersuchungen der Streckenplanung Bildliche kognitiven Gruppierung von Faumlhigkeit Faumlhigkeiten
2 Symbolen Erkennung von Aumlhnlichkeitenetc Wortschatz Verbale
~ Schluszligfolgerungs- Faumlhigkeit shy eigenschaften
Satzbau etc Kostenanalyse
3 18 Kostenarten Beeinfluszligbarkei t differenziert nach Deckungsdringlichshyjeweils 5 Kosten- keit eigenschaften
Blutdruckmessung4 1 SB DM Systolischer 2 bis 12 SBDM Blutdruck I OBDM Diastolischer 2 bis 12 DBDM Blutdruck
(SBDM = Systolische Blutdruckmessung DBOM =Diastolische Blutdruckmessung)
Veranschaulichen wir uns die Problemstellung noch einmal anhand eines konkreshyten Beispiels In einer Befragung seien Hausfrauen nach ihrer Einschaumltzung von Emulsionsfetten (Butter Margarine) befragt worden Dabei seien die Marken Rashyma Sanella Becel Du darfst Hollaumlndische Markenbutter und Weihnachtsbutter anband der Variablen Anteil ungesaumlttigter Fettsaumluren Kaloriengehalt Vitamingeshyhalt Haltbarkeit und Preis auf einer siebenstufigen Skala von hoch bis niedrig beshyurteilt worden
I VgL Harman H H 1976 S 13 ff
2 VgL Carroll J 8 1993
3 Vgl Plinke W 1985 S 118 ff 4
Vgl Uberla K 1977 S 264 ff
262 Faktorenanalyse
Die nachfolgende Abbildung 52 zeigt einen Ausschnitt aus dem entsprechenden Fragebogen
Abbildung 52 Fragebogenausschnitt
Beurteilen Sie bitte die Margarinemarke Rama an hand folgender Eigenschaften
niedrig hoch
Anteil ung Fettsaumluren
Kaloriengehalt
Vitamingehalt
Haltbarkeit
Preis 1 2
I 3
I 4
I 5
I 6
I 7
Die Beantwortung des obigen Fragebogenausschnitts durch die 30 befragten Proshybanden liefert subjektive Eigenschaftsurteile der fuumlnf Variablenftlr die Margashyrinemarke Rama so da~ eine (30 x 5)-Matrix entsteht Diese Matrix kann der weishyteren Analyse zugrunde gelegt werden Wir haben dann 5 Eigenschaften und 30 Faumllle wobei wir ft1r unsere Analyse unterstellen daszlig die Befragtenurteile unshyabhaumlngig voneinander sind
Will man jedoch die sechs Marken gleichzeitig analysieren so werden haumlufig ftlr jede Eigenschaft pro Marke Durchschnittswerte uumlber alle 30 Befragten gebildet Wir erhalten dann eine (6 x 5)-Matrix wobei die Marken als Faumllle interpretiert werden Bei einer ~olchen Durchschnittsbildung muszlig man sich allerdings bewuszligt sein daszlig man bestimmte Informationen (naumlmlich die uumlber die Streuung der Ausshypraumlgung zwischen den Personen) verliert
Je groumlszliger die Streuung der Stichprobenwerte ist um so problematischer ist der Aussagewert bei einer solchen Vorgehensweise Da in praktischen Faumlllen haumlufig dennoch so vorgegangen wird beziehen sich auch die nachfolgenden Ausfuumlhshyrungen auf die der (6 x 5)-Matrix zugrundeliegenden Durchschnittswerte uumlber alle Personen Im abschlieszligenden Kapitel wird ein Loumlsungsvorschlag rur eine Alshyternative zur Durchschnittsbildung vorgestellt
Problemstellung 263
Wir jassen zusammen Unsere Befragung liefert uns folgende Daten
Abbildung 53 Ausgangsdaten im Beispiel
VARIABLEN (Anteil unges Fettsaumluren V bull bull V
0 bull VPerson 1
OBJEKT Pelllon 2 (8_1
bull bull bull Vusw) f------ -c-
Person 3 O
L V bull v I 0
LJ~ -~
Es sei unterstellt daszlig die ausgewaumlhlten Eigenschaften fiir die Beurteilung von Emulsionsfetten auch als relevant angesehen werden koumlnnen Fuumlr die folgenden Betrachtungen verdichten wir nun die Werte aus Abbildung 53 durch Bildung der arithmetischen Mittel rur jede ObjektlVariablen-Kombination uumlber alle 30 Befragshyten Als Durchschnittswert der 30 befragten Probanden moumlgen sich bei dieser Beshyfragung uumlber alle Hausfrauen folgende Werte ergeben haben (Abbildung 54)
Miszligt man den Informationsgehalt einer Datenstruktur an der in ihr enthaltenen Streuung (Varianz) der Befragungswerte so verliert man durch die Durchshyschnittsbildung einen Teil der urspruumlnglichen Informationen (Streuungen) und der Informationsgehalt der Mittelwertmatrix in Abbildung 54 enthaumllt jetzt nur noch die Streuung der durchschnittlichen Beurteilungen uumlber die verschiedenen EmushyISionsjette
Ein erster Blick auf die Ausgangsdatenmatrix macht bereits deutlich daszlig die Eishygenschaften (Variablen) XI bis x3 bei den Margarinemarken (Sanella Becel und Du darfst Ausnahme Rama) tendenziell houmlher bewertet wurden als bei den Buttershysorten (Hollaumlndische Butter und Weihnachtsbutter) waumlhrend die Eigenschaften x4 und Xs primaumlr bei den Buttersorten houmlher ausgepraumlgt sind Die Ausgangsdaten geshyben damit in diesem Beispiel bereits einen Hinweis darauf daszlig zwei Gruppen (xl x2 x3 und x4 xS) aumlhnlich beurteilter Variablen existieren die sich in der Beurteishylung untereinander aber unterscheiden Damit laumlszligt sich in diesem Beispiel bereits aus der Datenstruktur ein Beziehungszusammenhang vermuten Will man diese Vermutung genauer uumlberpruumlfen so ist es erforderlich auf ein statistisches Kriterishy
264 Faktorenanalyse
um zuruumlckzugreifen das die Quantifizierung von Beziehungen zwischen Variablen erlaubt Ein solches statistisches Kriterium stellt der Korrelationskoeffizient dar Durch die Berechnung von Korrelationen zwischen allen Variablen laumlszligt sich die Staumlrke der Beziehungszusammenhaumlnge zwischen allen Variablen berechnen
Abbildung 54 Mittelwertmatrix fuumlr das 6-Produkte-Beispiel
Eigenschaften
Marken Xl X2 x3 x4 Xs Rama I I 2 I 2 Sanella 2 6 334 Becel 4 5 445 Du darfst 5 6 623 Hollaumlndische Butter 2 3 3 5 7 Weihnachtsbutter 3 4 4 6 7
wobei x I = Anteil ungesaumlttigter Fettsaumluren x2 = Kaloriengehalt x3 = Vitamingehalt x4 = Haltbarkeit Xs = Preis
Dabei ist jedoch zu beachtlaquon daszlig Korrelationen grundsaumltzlich auf drei verschieshydene Arten kausal interpretiert werden koumlnnen Wir wollen dies an dem Beispiel der Variablen Fettsaumluren und Vitamingehalt verdeutlichen
1 Die Korrelation zwischen Fettsaumluren und Vitamingehalt resultiert daraus daszlig sich durch die Erhoumlhung des Anteils ungesaumlttigter Fettsaumluren auch der Vitamingehalt erhoumlht
2 Die Korrelation zwischen Fettsaumluren und Vitamingehalt resultiert daraus daszlig durch eine Erhoumlhung des Vitamingehalts auch der Anteil ungesaumlttigter Fettsaumluren gesteigert wird
3 Fuumlr die Korrelation zwischen Fettsaumluren und Vitamingehalt ist eine hinshyter diesen beiden Variablen stehende Groumlszlige kausal verantwortlich d h diese hypothetische Groumlszlige stellt die Ursache fuumlr das Zustandekommen der Korrelashytion dar
An dieser Stelle wird bereits deutlich daszlig aus inhaltlichen Uumlberlegungen heraus entschieden werden muszlig welche der obigen drei Interpretationsmoumlglichkeiten in einer bestimmten Anwendungssituation Guumlltigkeit besitzt Die Faktorenanalyse unterstellt daszlig immer die dritte Interpretationsvariante zutrifft Nur wenn dem aufshygrund sachlogischer Uumlberlegungen zugestimmt werden kann darf eine Faktoshyrenanalyse angewendet werden
Problemstellung 26S
Verzichtet man zunaumlchst auf die Berechnung von Korrelationen und unterstellt die Guumlltigkeit der o g dritten Interpretationsart so koumlnnen wir in obigem Beispiel von der plausiblen Vermutung ausgehen daszlig Xl bis x3 sowie x4 und x5 lediglich Beshyschreibungen von zwei eigentlich hinter diesen Variablen stehenden Groumlszligen (Faktoren) darstellen
Diese Vermutung laumlszligt sich graphisch wie in Abbildung 55 dargestellt vershydeutlichen
Abbildung 55 Grundgedanke der Faktorenanalyse im Beispiel
VARIABLEN FAKTOREN
x Anteil ungesaumltshy tigter Fettsaumluren I~---___-
x Kaloriengehalt rmiddot------=~31 F 1 GESUNDHEIT
~
x Vitamingehalt
I Hba ~___= F WIRTSCHAFTshy
LICHKEITI x bull Preis ~ _ _shy
Ausgehend von den flinf Eigenschaften die in der Befragung verwendet wurden wird aufgrund der sich in den Daten manifestierenden Beziehungen zwischen xl bis x3 bzw x4 und Xs vermutet daszlig eigentlich nur zwei unabhaumlngige Beschreishybungsdimensionen fuumlr die Aufstrichfette existieren (die die Variationen in den Vashyriablen bedingen) Xl bis x3 koumlnnten ZB Ausdruck eines Faktors sein den man etwa mit Gesundheit bezeichnen koumlnnte denn sowohl der Anteil ungesaumlttigter Fettsaumluren als auch Kaloriengehalt und Vitamingehalt haben etwas mit der Geshysundheit zu tun Ebenso koumlnnen die Variablen x4 und Xs (Haltbarkeit und Preis) Ausdruck fuumlr Wirtschaftlichkeitsuumlberlegungen sein Man koumlnnte also vermuten daszlig sich die Variablen Xl bis Xs in diesem konkreten Fall auf zwei komplexere Vashyriablenbuumlndel verdichten lassen Diese Variablenbuumlndel bezeichnen wir im folshygenden als Faktoren
266 Faktorenanalyse
Werden die im Ausgang betrachteten Eigenschaften zu Faktoren zusammengefaszligt so ist unmittelbar einsichtig daszlig gegenuumlber der Mittelwertmatrix in Abbildung 54 ein weiterer Informationsverlust entsteht da idR weniger Faktoren alsursprilngshyliehe Eigenschaften betrachtet werden Dieser Informationsverlust ist darin zu seshyhen daszlig zum einen die Faktoren in der Summe nur weniger Varianz erklaumlren koumlnshynen als die fuumlnf Ausgangsvariablen und zum anderen die Varianz einer jeden Ausshygangs groumlszlige in der Erhebungsgesamtheit ebenfalls durch die Faktoren idR nicht vollstaumlndig erklaumlrt werden kann Der Verlust an erklaumlrter Varianz wird im Rahmen der Faktorenanalyse zugunsten der Variablenverdichtung bewuszligt in Kauf genomshymen Allerdings muszlig sich der Anwender vorab uumlberlegen in welchem Ausmaszlig dieser Erklaumlrungsverlust (im Sinne eines Varianzverlustes) bei den einzelnen Ausshygangsvariablen toleriert bzw wieviel Varianz durch die Faktoren bei einer beshystimmten Variablen erklaumlrt werden soll Den Umfang an Varianzerklaumlrung den die Faktoren gemeinsam fllr eine Ausgangsvariable liefern wird als Komm~nalitaumlt beshyzeichnet Die Art und Weise mit der die Kommunalitaumlten bestimmt werden ist unmittelbar an die Methode der Faktorenermittlung (Faktorextraktionsmethode) gekoppelt Je nachdem welche Uumlberlegungen der Kommunalitaumltenbestimmung zugrunde liegen werden unterschiedliche Faktorenanalyseverfahren relevant
Ist eine Entscheidung uumlber die HOumlhe der Kommunalitaumlten der einzelnen Ausshygangsvariablen getroffen so muszlig weiterhin uumlber die Anzahl der zu extrahierenden Faktoren entschieden werden da das Ziel der Faktorenanalyse gerade darin zu seshyhen ist weniger Faktoren als urspruumlngliche Variable zu erhalten Hier steht der Anwender vor dem Zielkonflikt daszlig mit einer geringen Faktorenzahl tendenziell ein groszliger Informationsverlust (im Sfnne von nicht erklaumlrter Varianz) verbunden ist und umgekehrt In unserem Beispiel hatten wir uns aufgrund einer Plaushysibilitaumltsbetrachtung fllr zwei Faktoren entschieden
Ist schlieszliglich die Anzahl der Faktoren bestimmt so ist es von besonderem Inshyteresse die Beziehungen zwischen den Ausgangsvariablen und den Faktoren zu kennen Zu diesem Zweck werden Korrelationen berechnet die ein Maszlig tuumlr die Staumlrke und die Richtung der Zusammenhaumlnge zwischen Faktoren und urshyspruumlnglichen Variablen angeben Diese Korrelationen werden als Faktorladungen bezeichnet und in der sog Faktorladungsmatrix zusarnmengefaBt Abschlieszligend ist es dann von Interesse wie die befragten Personen die Marken Rama SaneUa Becel Du darfst Hollaumlndische Markenbutter und Weihnachtsbutter im Hinblick auf die beiden kuumlnstlichen Faktoren Gesundheit und Wirtschaftlichkeit beshyurteilen wuumlrden Gesucht ist also die entsprechende Matrix zu Abbildung 54 die die Einschaumltzung der Marken bezuumlglich der beiden Faktoren Gesundheit und Wirtschaftlichkeit enthaumllt Diese Einschaumltzungen werden als Faktorwerte beshyzeichnet Abbildung 56 zeigt die entsprechende Faktorwerte-Matrix fuumlr unser kleines Ausgangsbeispiel Die Darstellung enthaumllt standardisierte Werte wobei die Auspraumlgungen als Abweichungen vom Mittelwert dargestellt sind
Problemstellung 267
Abbildung 56 Faktorwerte-Matrix r-shy
Faktor 1 Faktor 2
Rama -121136 -125027 Sanella -048288 -026891 Becel 057050 019027 Du darfst 156374 -088742 Hall Butter -063529 094719 Weihnachtsbutter 019530 126914
Die Faktorwerte liefern nicht nur einen Anhaltspunkt fuumlr die Einschaumltzung der Margarinesorten bezuumlglich der gefundenen Faktoren sondern erlauben daruumlber hinaus (im Fall einer 2- oder 3-Faktorloumlsung) eine graphische Darstellung der Faktorenergebnisse Durch solche Mappings lassen sich besonders gut die Poshysitionen von Objekten (hier Margarinemarken) im Hinblick auf die gefundenen Faktoren visualisieren (vgl Abbildung 57)
Abbildung 57 Mapping der Faktorwerte
F 20 a k 15 t 0 r 10
05
00
-05
-10
-15
Du darfstbull f-
Becelbull Weihnachtsbutter
bull Sanellabull Holl Butterbull
Rama
bull I
-15 -10 -05 00 05 10 15
Faktor 2
268 Faktorenanalyse
Dabei wird deutlich daszlig es sich bei diesem mapping um eine relative Darstelshylung handelt Die Faktorwerte werden als Abweichung vom auf Null nonnierten Mittelwert dargestellt so daszlig hohe positive Faktorwerte stark uumlberdurchschnittlishyche hohe negative Faktorwerte stark unterdurchschnittliche Auspraumlgungen kennshy
zeichnen Der in Abbildung 58 dargestellte knappe Aufriszlig der Faktorenanalyse enthaumllt die
wesentlichen Teilschritte bei der Durchfiihrung einer Faktorenanalyse und ist unshyten als Ablaufdiagramm dargestellt Entsprechend diesem Ablaufdiagramm sind die nachfolgenden Betrachtungen aufgebaut Allerdings ist zu beachten daszlig sich bei konkreten Anwendungen der Faktorenanalyse insbesondere die Schritte (2) und (3) gegenseitig bedingen und nur schwer voneinander trennen lassen Aus dishydaktischen Gruumlnden wurde hier aber eine Trennung vorgenommen
bull Abbildung 58 Ablauf einer Faktorenanalyse
(1) Variablenauswahl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitaumlten
(4) Zahl der Faktoren
(5) Faktorinterpretation
(6) Bestimmung der Faktorwerte
Vorgehensweise 269
52 Vorgehensweise
5 Variablenauswahl und Errechnung der Korrelationsmatrix
Die Guumlte der Ergebnisse einer Faktorenanalyse ist von der Zuverlaumlssigkeit der Ausgangsdaten abhaumlngig Es muszlig deshalb besondere Sorgfalt auf die Wahl der Unshytersuchungsmerkmale verwendet werden Insbesondere
~ (2) Extraktion der Faktoren I
(3) Bestimmung der Kommunalitaumlten
u
(6) Bestimmung der Faktorwerte
ist darauf zu achten daszlig die erhobenen Merkmale auch fuumlr den Untersuchungsgegenstand relevant sind Irreleshyvante Merkmale sind vorab auszusortieren sowie als aumlhnlich erachtete Kriterien muumlssen zusammengefaszligt werden Insbesondere bei der Formulierung von Befragungsitems ist darauf zu achten daszlig bereits die Wortwahl der Fragestellungen das Antwortverhalten der Befragten und damit die Streuung der Daten beeinfluszligt Weiterhin sollten die Befragten einer rnoumlgshylichst homogenen Stichprobe entstammen da die Houmlhej bull
der KorrelatIOnen ZWischen den Untersuchungsmerk- malen (Variablen) durch den Homogenitaumltsgrad der Befragungsstichprobe beeinshyfluszligt wird
Die oben aufgezeigten Sachverhalte schlagen sich insgesamt in den Korrelashytionen nieder die als Maszlig fuumlr den Zusammenhang zwischen Variablen errechnet werden Es wurden deshalb Pruumlfkriterien entwickelt die es erlauben Variablenshyzusammenhaumlnge auf ihre Eignung fuumlr eine Faktorenanalyse zu uumlberpruumlfen Wir werden deshalb im folgenden zunaumlchst auf die Ermittlung von Korrelationen naumlher eingehen und sodann ausgewaumlhlte (statistische) Pruumlfkriterien erlaumlutern
5211 Korrelationsanalyse zur Aufdeckung der Variablenzusammenhaumlnge
Faktoren die als hinter den Variablen stehende Groumlszligen angesehen werden reshypraumlsentieren den Zusammenhang zwischen verschiedenen Ausgangsvariablen Beshyvor solche Faktoren ennittelt werden koumlnnen ist es zunaumlchst erforderlich die Zushysammenhaumlnge zwischen den Ausgangsvariablen meszligbar zu machen Als meshythodisches Hilfsmittel wird hierzu die Korrelationsrechnung herangezogen
Bereits anhand der Korrelationen laumlszligt sich erkennen ob Zusammenhaumlnge zwishyschen Paaren von Variablen bestehen so daszlig Variablen als voneinander abhaumlngig und damit als buumlndelungsfaumlhig angesehen werden koumlnnen
Fuumlr die Mittelwertmatrix (Abbildung 54) in obigem Beispiel laumlszligt sich zB die Korrelation zwischen x 1 (Anteil ungesaumlttigter Fettsaumluren) und x2 (Kaloriengehalt) wie folgt berechnen
~ IV taAtvJuAtJ(U)0
Korrelationskoeffizient
K 2(Xkl-XI)(XkZ -X2)
k = I (1)r = -===========XX2 I K K
2 (Xkl _X))2 2(XkZ -X2Y k = I k = I
mit
Auspraumlgung der Variablen I bei Objekt k (in unserem BeispielXkl laumluft k von 1 bis 6 (6 Markenraquo Mittelwert der Auspraumlgung von Variable 1 uumlber alle Objekte k Xl Auspraumlgung der Variablen 2 bei Objekt k xkZ Mittelwert der Auspraumlgung von Variable 2 uumlber alle Objekte k X2
Setzt man in Formel (1) die entsprechenden Werte der Ausgangsdatenmatrix ein so ergibt sich ein Korrelationskoeffizient von rbullbull =071176 Um die im einshy
1 2
zeInen notwendigen Rechenschritte zu erleichtern bedient man sich zurErmittlung der Korrelationskoeffizienten am besten der Hilfstabelle (Abbildung 59) Dabei stellt Xl den Mittelwert uumlber alle Marken rur die Eigenschaft Ungesaumlttigte Fettshy
saumluren ((1+2+4+5+2+36=283) und X2 ftlr die Eigenschaft Kaloriengeshy
halt ((1+6+5+6+3+46=417) dar
Abbildung 59 Hilfstabelle zur Berechnung eines Korrelationskoeffizienten
(x-l() (x-llt) (x-x)(x-J()(x -x) (x-llt)
336110 1002780 580555183333 -316667Rama 336110 middot152777-083333 183333 069444Sanella 069444 097222116667 063333 136112Becel 336110 397222216667 183333 469446Du darfst 097222middot083333 -116667 069444 136111Holt Butter 002778 -002778016667 -016667 002778Weihnechtsbutter
1083334 1883333 1016666 ----__----~--------__~-~~------_
(xx) I6 (xx) I6
(x-i)(xx) k=1 k=1
1016664r =VOuml8333011883333 =071176
Berechnet man die Korrelationskoeffizienten uumlber alle Eigenschaften ergibt sich rur die Mittelwertmatrix die in Abbildung 510 abgebildete Korrelationsmatrix
vorgenenswelse L 1
Abbildung 510 Korrelationsmatrix rur das 6-Produkte-Beispiel
UNGEFETI KALORlEN VITAMIN HALTBARK PREIS
-------------------- ---_--- ----------UNGEFETT 100000 KALORlEN 071176 100000
VITAMIN Q~~Pplusmn _QJQ~~__ 19PPQQ __ HALTBARK 010894 013771 007825 ri~oumloumloumloumloumlmiddot-------------------
PREIS 004385 006652 002362 098334 100000
In der Regel empfiehlt es sich die Ausgangsdatenmatrix vorab zu standardisieren da dadurch
- die Korrelationsrechnung und die im Rahmen der Faktorenanalyse erforderlishychen Rechenschritte erleichtert werden
- Interpretationserleichterungen erzielt werden - eine Vergleichbarkeit der Variablen ermoumlglicht wird die in unterschiedlichen
Maszligeinheiten erhoben wurden (zB Einkommen gemessen in Euro und Verkauf von Guumltern in Stck)
Eine Standardisierung der Datenmatrix erfolgt durch die Bildung der Differenz zwischen dem Mittelwert und dem jeweiligen Beobachtungswert einer Variablen sowie der anschlieszligenden Division durch die Standardabweichung Dadurch wird sichergestellt daszlig der neue Mittelwert gleich Null und die Standardabweichung einer Variablen gleich Eins ist Die Werte einer standardisierten Datenmatrix beshyzeichnen wir im folgenden nicht mehr mit x sondern mit z
Standardisierte Variable
Xk -x Zkj = J j
Sj
mit
Xkj BeobachtungSlVert der Variablenj bei Objekt k
Xj Durchschnitt aller Beobachtungswerte der Variablenj uumlber alle Objekte
s j Standardabweichung der Variablen j
Zkj Standardisierter Beobachtungswert der Variablen j bei Objekt k
Aus der standardisierten Datenmatrix ergibt sich auch eine einfachere Berechnung der Korrelationsmatrix R nach folgender Formel
R=_I_ZmiddotZ (2)K-I
272 Faktorenanalyse Vorgehensweise 273
wobei Z die transponierte Matrix der standardisierten Ausgangsdatenmatrix Z darstellt
Der Leser moumlge selbst anhand des Beispiels die Guumlltigkeit der Formel uumlberpruumlshyfen Dabei wird klar werden daszlig die Korrelationsmatrix auf Basis der Ausshygangsdaten identisch ist mit der Korrelationsmatrix auf Basis der standardisierten Daten Wird die Korrelationsmatrix aus standardisierten Daten errechnet so sind in diesem Falle Varianz-Kovarianzmatrix und Korrelationsmatrix identisch Fuumlr den Korrelationskoeffizienten laumlszligt sich auch schreiben
S 1middot2 SI ( - )( - )rx =-- mit x x =--t xkl-x Xk2-x 2
1 2 S S Imiddot 2 K -1 k XI X2
Da wegen der Standardisierung die beiden Varia~zen im Nenner 1 sind folgt daszlig Korrelationskoeffizient und Kovarianz SIX2) identisch sind
Die Korrelationsmatrix zeigt dem Anwender auf welche Variablen der Ausgangsshybefragung offenbar mit welchen anderen Variablen dieser Befragung irgendwie zusammenhaumlngen Sie zeigt ihm jedoch nicht ob
I die Variablen sich gegenseitig bedingen
oder
2 das Zustandekommen der Korrelationswerte durch einen oder mehrere hinter den zusammenhaumlngenden Variablen stehenden Faktoren bestimmt wird
Angesichts der beiden klar trennbaren Bloumlcke der Korrelationsmatrix (vgL die abshygegrenzten Vierecke) laumlszligt sich vermuten daszlig die Variablen XI bis x3 und x4xS durch zwei Faktoren erklaumlrt werden koumlnnten
Ausgehend von dieser Hypothese stellt sich unmittelbar die Frage mit welchem Gewicht denn die beiden Faktoren an der Beschreibung der beobachteten Zusamshymenhaumlnge beteiligt sind Es ist ja denkbar daszlig der Faktor Gesundheit als alleinishyger Beschreibungsfaktor filr die Variablen Xl bis x3 fast filr die gesamten Untershyschiede in der Ausgangsbefragung verantwortlich ist Es kann aber auch sein daszlig er nur einen Teil der unterschiedlichen Beurteilungen in der Ausgangsbefragung erklaumlrt Die groumlszligere oder geringere Bedeutung beider Faktoren laumlszligt sich in einer Gewichtszahl ausdrucken die im Rahmen einer Faktorenanalyse auch als Eigenshywert bezeichnet wird
5Ul Eignung der Korrelationsmatrix
Zu Beginn des Abschnittes 521 hatten wir bereits darauf hingewiesen daszlig sich die Eignung der Ausgangsdaten filr faktoranalytische Zwecke in der Korrelatishyonsmatrix widerspiegelt Dabei liefern bereits die Ausgangsdaten selbst einen Anshyhaltspunkt zur Eignungsbeurteilung der Daten zum Zwecke der Faktorenanalyse da die Houmlhe der Korrelationskoeffizienten durch die Verteilung der Variablen in der Erhebungsgesamtheit (Symmetrie Schiefe und Woumllbung der Verteilung) beeinfluszligt wird Liegt einer Erhebung eine heterogene Datenstruktur zugrunde so
macht sich dies durch viele kleine Werte in der Korrelationsmatrix bemerkbar II womit eine sinnvolle Anwendung der Faktorenanalyse in Frage gestellt ist Es ist
deshalb vorab eine Prufung der Variablen auf Normalverteilung ZUmindest aber auf Gleichartigkeit der Verteilungen empfehlenswert obwohl die Faktorenanalyseselbst keine Verteilungsannahmen setzt
Bezogen auf unser 6-Produkte-Beispiel treten neben sehr hohen Werten (gt 07) insbesondere im unteren Teil der Matrix kleine Korrelationen auf (vgl Abbildung 510) so daszlig die Korrelationsmatrix selbst kein eindeutiges Urteil uumlber die Eigshynung der Daten zur Faktorenanalyse zulaumlszligt
Es ist deshalb zweckmaumlszligig weitere Kriterien zur Pruumlfung heranzuziehen Hierzu bieten sich insbesondere statistische Prufkriterien an die eine Uumlberpruumlfung der Korrelationskoeffizienten auf Eignung zur Faktorenanalyse ermoumlglichen Es ist durchaus empfehlenswert mehr als ein Kriterium zur faktoranalytischen Eignung der Datenmatrix anzuwenden da die verschiedenen Kriterien unterschiedliche Vor- und Nachteile haben Im einzelnen werden durch SPSS folgende Kriterien bereitgestellt
Signifikanzniveaus der Korrelationen
Ein Signifikanzniveau uumlberpruumlft die Wahrscheinlichkeit mit der eine ZUvor formushylierte Hypothese zutrifft oder nicht Fuumlr alle Korrelationskoeffizienten lassen sich die Signifikanzniveaus anfilhren Zuvor wird eine sogenannte Ho-Hypothese forshymuliert die aussagt daszlig kein Zusammenhang zwischen den Variablen besteht Das Signifikanzniveau des Korrelationskoeffizienten berechnet anschlieszligend mit welshycher Irrtums wahrscheinlichkeit eben diese Ho-Hypothese abgelehnt werden kann Ein beispielhaftes Signifikanzniveau von 000 bedeutet daszlig mit dieser Irrtumsshywahrscheinlichkeit die Ho-Hypothese abgelehnt werden kann sprich zu 00 wird sich der Anwender taumluschen wenn er von einem Zusammenhang ungleich Null zwischen den Variablen ausgeht Anders ausgedruckt Mit einer Wahrscheinlichshykeit von 100 wird sich die Korrelation von Null unterscheiden
Abbildung 511 Signifikanzniveaus der Korrelationskoeffizienten im 6-ProdukteshyBeispiel
KOrrelatlonmatrix
UNGEFETT KALORIEN VITAMIN HALTBARKISignIfikanz (l-seitlg) UNGEFETT PREIS05632 00111 411lSZ 46713KAlORIEN 05632 05924 39737 45018VITAMIN 00111 05924 44144 49229HALTBARK 41862 39737 44144 00021PREIS 46713 45018 48229 00021
Fuumlr unser Beispiel zeigt Abbildung 511 daszlig sich genau diejenigen Korrelationsshykoeffizienten signifikant von Null unterscheiden (niedrige Werte in Abbildung 511) die in Abbildung 510 hbhe Werte (gt 07) aufweisen waumlhrend die Korrelashy
f
274 Faktorenanalyse
tionskoeffizienten mit geringen Werten auch ein hohes Signifikanzniveau (Wertegt 04) besitzen Das bedeutet daszlig sich ZB die Korrelation zwischen den Variablen Vitamingehalt und Haltbarkeit nur mit einer Wahrscheinlichkeit von (1- 044 =) 56 von Null unterscheidet
Inverse der Korrelationsmatrix
Die Eignung einer Korrelationsmatrix fuumlr die Faktorenanalyse laumlszligt sich weiterhin an der Struktur der Inversen der Korrelationsmatrix erkennen Dabei wird davon ausgegangen daszlig eine Eignung dann gegeben ist wenn die Inverse eine Diagoshynamatrix darstellt d h die Nicht-diagonal-Elemente der inversen Korrelatishyonsmatrix moumlglichst nahe bei Null liegen Fuumlr das 6-Produkte-Beispiel zeigt Abbildung 512 daszlig insbesondere fuumlr die Werte der Variablen Ungesaumlttigte Fettshysaumluren und Vitamingehalt sowie Haltbarkeit und Preis hohe Werte auftreshyten waumlhrend alle anderen Werte relativ nahe bei Null liegen Es existiert allerdings kein allgemeinguumlltiges Kriterium dafuumlr wie stark und wie haumlufig die Nicht-diashygonal-Elemente von Null abweichen duumlrfen
Abbildung 512 Inverse der Korrelationsmatrix im 6-Produkte-Beispie1
Inverse KorrelationsmatrIx
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS UNIiIIt
KALORIEN VITAMIN
HALTBARK
PREIS
1449910 -60678
-1319772 -558018 520353
-60678 217944 -82863
-218066 204555
-1319772 -82863
1400000 479257
-440959
-558018 -218066 479257
3817871 -3126624
520353 204555
-440959 -3726624 3738542
Bartlett-Test (test of spherlcity)
Der Bartlett-Test uumlberpruumlft die Hypothese ob die Stichprobe aus einer Grundgeshysamtheit entstammt in der die Variablen unkorreliert sinds
Gleichbedeutend mit dieser Aussage ist die Frage ob die Korrelationsmatrix nur zuflillig von einer Einheitsmatrix abweicht da im Falle der Einheitsmatrix alle Nicht-diagonal-Elemente Null sind d h keine Korrelationen zwischen den Varishyablen vorliegen Es werden folgende Hypothesen formuliert
HO Die Variablen in der Erhebungsgesamtheit sind unkorreliert
H1 Die Variablen in der Erhebungsgesamtheit sind korreliert
Der Bartlett-Test setzt voraus daszlig die Variablen in der Erhebungsgesamtheit einer Normaverteiung folgen und die entsprechende Pruumlf groumlszlige annaumlhernd ChishyQuadrat-verteilt ist Letzteres aber bedeutet daszlig der Wert der Pruumlfgroumlszlige in hohem
5 Vgl Dziuban C DlShirkey E C 1974 S 358 ff bull
Vorgehensweise 275
Maszlige durch die Groumlszlige der Stichprobe beeinfluszligt wird Fuumlr unser Beispiel erbrachshyte der Bartlett-Test eine Pruumlfgroumlszlige von 17371 bei einem Signifikanzniveau von 00665 Das bedeutet daszlig mit einer Wahrscheinlichkeit von (1- 00655=)9345
davon auszugehen ist daszlig die Variablen der Erhebungsgesamtheit korreliert sind Setzt man als kritische Irrtumswahrscheinlichkeit einen Wert von 005 fest so waumlshyre fuumlr unser Beispiel die Nullhypothese anzunehmen und folglich die Korrelatishyonsmatrix nur zufaumlllig von der Einheitsmatrix verschieden Das laumlszligt dann den Schluszlig zu daszlig die Ausgangsvariablen in unserem Fall unkorreliert sind
Allerdings sei an dieser Stelle nochmals darauf hingewiesen daszlig die Anwenshydung des Bartlett-Tests eine Pruumlfung der Ausgangsdaten auf Normalverteilung voraussetzt die in unserem Fall noch erfolgen muumlszligte
Anti-Image-Kovarianz-Matrix
Der Begriff Anti-Image stammt aus der Image-Analyse von Guttmann6 Guttrnann geht davon aus daszlig sich die Varianz einer Variablen in zwei Teile zerlegen laumlszligt das Image und das Anti-Image
Das Image beschreibt dabei den Anteil der Varianz der durch die verbleibenden Variablen mit Hilfe einer multiplen Regressionsanalyse (vgl Kapitel 1) erklaumlrt werden kann waumlhrend das Anti-Image denjenigen Teil darstellt der von den uumlbrishygen Variablen unabhaumlngig istlDa die Faktorenanalyse unterstellt daszlig den Variabshylen gemeinsame Faktoren zugrunde liegen ist es unmittelbar einsichtig daszlig Varishyablen nur dann fuumlr eine Faktorenanalyse geeriiet sind wenn das Anti-Image der Variablen moumlglichst gering ausflilltDas ab bedJJltet daszlig die Nicht-diagonalshyElemente der Anti-Image-Kovarianz-Matrix m glichst nahe bei Null liegen muumlsshysen bzw diese Matrix eine Diagonamatrix darstellen sollte Fuumlr das 6-ProdukteshyBeispiel zeigt Abbildung 513 daszlig die Forderung nach einer Diagonalmatrix ershyfiiHt ist
Abbildung 513 Anti-Image-Kovarianz-Matrix im 6-Produkte-Beispiel
AnIlJmIU_atrIzen
UNGEFETT KALORIEN VITAMIN HALTBARKi Arililinage-lltovananz PREISUNuumll1 06897 -01920 -06502 -01008 00960KAlORIEN -01920 45883 -02716 -02621 02511VITAMIN -06502 02716 07143 00897 -00842HALTBARK -01008 02621 00697 02619 -02611PREIS 00960 02511 -00842 middot02611 02675
Als Kriterium dafilr wann die Forderung nach einer Diagonalmatrix erfuumlllt ist schlagen Dziuban und Shirkey vor die Korrelationsmatrix dann als fuumlr die Fakshytorenanalyse ungeeignet anzusehen wenn der Anteil der Nicht-diagonal-Elemente die ungleich Null sind (gt 009) in der Anti-Image-Kovarianzmatrix (AIC) 25
Vgl Guttmann L 1953 S 277 ff
LIO r aKlOrenanalyse
oder mehr betraumlgt7 Das trifft in unserem Fall filr keines der Nicht-diagonalshyElemente der Ale-Matrix zu womit nach diesem Kriterium die Korrelationsmatrix filr faktoranalytische Auswertungen geeignet ist
Kaiser-Meyer-Olkin-Kriterium
Waumlhrend die Uumlberlegungen von Dziuban und Shirkey auf Plausibilitaumlt beruhen haben Kaiser Meyer und Olkin versucht eine geeignete Pruumlfgroumlszlige zu entwickeln und diese zur Entscheidungsfindung heranzuziehen Sie berechnen ihre PTUumlfgroumlszlige die als measure 0sampling adequacy (MSA) bezeichnet wird auf Basis der Anshyti-Image-KorrelationsmatrixbullDas MSA-Kriterium zeigt an in welchem Umfang die Ausgangsvariablen zusammengehoumlren und dient somit als Indikator dafilr ob eine Faktorenanalyse sinnvoll erscheint oder nichtDas MSA-Kriterium erlaubt sowohl eine Beurteilung der Korrelationsmatrix insgesamt als auch einzelner Varishyablen sein Wertebereich liegt zwischen degund 1 Kaiser und Rice schlagen folgenshy
8de Beurteilungen vor
MSA 2 09 marvelous (erstaunlich) MSA 2 08 meritorious (verdienstvoll) MSA 2 07 middling (ziemlich gut) MSA 2 06 mediocre (mittelmaumlszligig) MSA 2 05 miserable (klaumlglich) MSA lt05 unacceptable (untragbar)
Sie vertreten die Meinung daszlig sich eine Korrelationsmatrix mit MSA lt 05 nicht rur eine Faktorenanalyse eignet9 Als wuumlnschenswert sehen sie einen Wert von MSA 2 08 an lO In der Literatur wird das MSA-Kriterium das auch als KaisershyMeyer-Olkin-Kriterium (KMK) bezeichnet wird als das beste zur Verrugung steshyhende Verfahren zur Pruumlfung der Korrelationsmatrix angesehen weshalb seine Anwendunrvor der Durchfuhrung einer Faktorenanalyse auf jeden Fall zu empshyfehlen ist 1
Bezogen auf unser 6-Produkte-Beispiel ergab sich rur die Korrelationsmatrix insgesamt ein MSA-Wert von 0576 womit sich rur unser Beispiel ein riur klaumlglishyches Ergebnis ergibt Daruumlber hinaus gibt SPSS in der Diagonalen der AntishyImage-Korrelationsmatrix aber auch das MSA-Kriterium rur die einzelnen Variabshylen an
7 Vgl Dziuban C DlShirkey E C 1974 S 359
8 Vgl Kaiser H FRice J 1974 S 111 ff
9 Vgl Cureton E EDAgostino R B 1983 S 389 f
10 Vgl Kaiser H F 1970 S 405
II Vgl Stewart D W 1981 S 57 f Dziuban C DlShirkey E C 1974 S 360 f
Vorgehensweise 277
Abbildung 514 Anti-Image-Korrelations-Matrix im 6-Produkte-Beispiel
Antllmlge-Matrlun
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS AntI-lmageMrrelilllOn UNGEFETT 59680middot 10794 -92633 -23717 22350
KALORIEN -10794 87789 -15001 -23906 22661 VITAMIN -92633 -15001 59755 20730 -19274 HALTSARK -23717 -23906 20730 47060 -98640 PREIS 22350 22561 -19274 -95640 45701
8 Maszlig der StlchplObenelgnung
Abbildung 514 macht deutlich daszlig lediglich die Variable Kaloriengehalt mit einem MSA-Wert von 087789 als verdienstvoll anzusehen ist waumlhrend alle uumlbshyrigen Variablen eher klaumlgliche oder untragbare Ergebnisse aufweisen Die vashyriablenspezifischen MSA-Werte liefern damit rur den Anwender einen Anshyhaltspunkt dafuumlr welche Variablen aus der Analyse auszuschlieszligen waumlren wobei sich ein sukzessiver Ausschluszlig von Variablen mit jeweiliger Pruumlfung der vorgeshystellten Kriterien empfiehlt
522 Extraktion der Faktoren
(4) Zahl der Faktoren
(5) Faktorinterp~etat~ (6) Bestimmung der
Faktorwerte
Die bisherigen Ausruhrungen haben verdeutlicht daszlig bei Faktorenanalysen groszlige Sorgfalt auf die Wahl der Untersuchungsmerkmale und -einheiten zu verwenden ist da durch die Guumlte der Korrelationsmatrix die den Startpunkt der Faktorenanalyse darstellt alle Ershygebnisse der Faktorenanalyse beeinfluszligt werden Im folgenden ist nun zu fragen wie denn nun die Faktoren rein rechnerisch aus den Variablen ermittelt werden koumlnnen Wir werden im folgenden zunaumlchst das Funshydamentaltheorem der Faktorenanalyse darstellen und anschlieszligend die Extraktion auf graphischem Wege plausibel machen Auf die Unterschiede zwischen konkreten (rechnerischen) Faktorextraktionsverfahren gehen wir dann im Zusammenhang mit der Bestimshymung der Kommunalitaumlten (Abs~hnitt 523) ein
278 Faktorenanalyse
5221 Das FundamentaItheorem
Waumlhrend die bisherigen Uumlberlegungen die Ausgangsdaten und ihre Eignung fuumlr faktoranalytische Zwecke betrafen stellt sich nun die Frage wie sich die Faktoren rechnerisch aus den Variablen ennitteln lassen Zu diesem Zweck geht die Faktoshyrenanalyse von folgender grundlegenden Annahme aus
Jeder Beobachtungswert einer Ausgangsvariablen Xj oder der stanshydardisierten Variablen Zj laumlszligt sich als eine Linearkombination mehshyrerer (hypothetischer) Faktoren beschreiben
Mathematisch laumlszligt sich dieser Zusammenhang wie folgt fonnulieren
(3a)Xkj =ajl Pkl +ap PIa + +ajQ PkQ
bzw fuumlr standardisierte x-Werte
(3b)Zkj=ajIPkl+a j2middotPIa+middot+a jQmiddotPkQ=iajqPkq
q~l
Die obige Fonnel (3b) besagt fuumlr das 2-Faktorenbeispiel nichts anderes als daszlig zB die standardisierten Beobachtungswerte fuumlr Anteil ungesaumlttigter Fettsaumluren und Vitamingehalt beschrieben werden durch die Faktoren P 1 und P2 so wie sie im Hinblick auf Marke k gesehen wurden ltPIel bzw Pk2) jeweils multipliziert mit ihren Gewichten bzw Faktorenladungen beim Merkmal j also fuumlr Faktor 1 ajl und
fuumlr Faktor 2 a2 Oie Faktorradung gibt dabei an wieviel ein Faktor mit einer Ausgangsvariablen
zu tun hat Im mathematisch-statistischen Sinne sind Faktorladungen nichts andeshyres als eine Maszliggroumlszlige fuumlr den Zusammenhang zwischen Variablen und Faktor und das ist wiederum nichts anderes als ein Korrelationskoeffizient zwischen Fakshytor und Variablen
Um die Notation zu verkuumlrzen schreibt man haumlufig den Ausdruck (3b) auch in Matrixschreibweise Identisch mit Fonnel (3b) ist daher auch folgende Mashytrixschreibweise die die Grundgleichung der Faktorenanalyse darstellt
(3c)Z=pmiddotA
Aufbauend auf diesem Grundzusammenhang laumlszligt sich dann auch eine Rechenshyvorschrift ableiten die aufzeigt wie aus den erhobenen Daten die vennuteten Fakshytoren mathematisch ennittelt werden koumlnnen
Wir hatten gezeigt daszlig die Korrelationsmatrix R sich bei standardisierten Daten wie folgt aus der Datenmatrix Z ennitteln laumlszligt
R=_I_ZZ (2) K-l
Vorgehensweise 279
Da Z aber im Rahmen der Faktorenanalyse durch P A beschrieben wird (Z =PA) ist in (2) Z durch Fonnel (3c) zu ersetzen so daszlig sich folgende Fonnet
ergibt
R=_I_PA)PA) (4)K I
Nach Aufloumlsung der Klammem ergibt sich nach den Regeln der Matrixmultiplishykation
r------- R=_I_APPA=A-I_pPA (5)
K-I ~
~
Da alle Daten standardisiert sind laumlszligt sich der _1_ ptP Ausdruck in Formel (5)K-l ----y---J
auch als K(Jrrelationsmatrix der Faktoren (C) bezeichnen (vgl Fonnel (2raquo so daszlig sich schreiben laumlszligt
R = AmiddotCmiddotA (6)
Da die Faktoren als unkorreliert angenommen werden entspricht C einer Einheitsshymatrix (einer Matrix die auf der Hauptdiagonalen nur Einsen und sonst Nullen enthaumllt) Da die Multiplikation einer Matrix mit einer Einheitsmatrix aber wieder die Ausgangsmatrix ergibt vereinfacht sich die Fonnel (6) zu
R = AmiddotA (7)
Die Beziehungen (6) und (7) werden von Thurstone als das Fundamentaltheorem der Faktorenanalyse bezeichnet da sie den Zusammenhang zwischen Korrelatishyonsmatrix und Faktorladungsmatrix beschreiben
Das Fundarnentaltheorem der Faktorenanalyse besagt nicht anderes als daszlig sich die Korrelationsmatrix durch die Faktorladungen (Matrix A) und die Korrelationen zwischen den Faktoren (Matrix C) reproduzieren laumlszligt Fuumlr den Fall daszlig man von unabhaumlngigen (orthogonalen) Faktoren ausgeht reduziert sich das Funshydamentaltheorem auf Fonnel (7) Dabei muszlig sich der Anwender allerdings bewuszligt sein daszlig das Fundamentaltheorem der Faktorenanalyse nach Fonnel (7) stets nur unter der Praumlmisse einer Linearverknuumlpfung und Unabhaumlngigkeit der Faktoren Guumlltigkeit besitzt
5222 Graphische Interpretation von Faktoren
Der Infonnationsgehalt einer Korrelationsmatrix laumlszligt sich auch graphisch in einem Vektor-Diagramm darstellen in dem die jeweiligen Korrelationskoeffizienten als Winkel zwischen zwei Vektoren dargestellt werden Zwei Vektoren werden dann
280 Faktorenanalyse
als linear unabhaumlngig bezeichnet wenn sie senkrecht (orthogonal) aufeinander steshyhen Sind die beiden betrachteten Vektoren (Variablen) jedoch korreliert ist der Korrelationskoeffizient also C 0 zB 05 dann wird dies graphisch durch einen Winkel von 60deg zwischen den beiden Vektoren dargestellt
Es stellt sich die Frage Warum entspricht ein Korrelationskoeffizient von 05 genau einem Winkel von 60deg Die Verbindung wird uumlber den Cosinus des jeshy
weiligen Winkels hergestellt Verdeutlichen wir uns dies anhand des Ausgangsbeispiels (Abbildung 515)
In Abbildung 515 repraumlsentieren die Vektoren AC und AB zB die beiden Vashyriablen Kaloriengehalt und Vitamingehalt Zwischen den beid~_yariablen moumlge eine Korrelation von 05 gemessen worden sein Der Vektor AC der den Kaloriengehalt repraumlsentiert und der genau wie AB aufgrund der Standardisierung eine Laumlnge von 1 hat weist zu AB einen Winkel von 60deg auf Der Cosinus des Winkels 60deg der die Stellung der beiden Variablen zueinander (ihre Richtung) anmiddot gibt ist definiert als Quotient aus Ankathete und Hypothenuse also als AD AC Da AC aber gleich 1 ist ist der Korrelationskoeffizient identisch mit der Strecke
AD Wie Abbildung 516 ausschnitthaft zeigt ist zB der Cosinus eines 60deg-Winkels
gleich 05 Entsprechend laumlszligt sich jeder beliebige Korrelationskoeffizient zwischen zwei Variablen auch durch zwei Vektoren mit einem genau definierten Winkel zushyeinander darstellen Verdeutlichen wir uns dies noch einmal anband einer Korrelamiddot tionsmatrix mit drei Variablen (Abbildung 517)
Abbildung 515 Vektordarstellung einer Korrelation zwischen zwei Variablen
c
A 0 B
)V
Standardisierte LOnge von 1
Vorgehensweise 281
Abbildung 516 Werte rur den Cosinus (entnommen aus Geliert W JKuumlstnerHlHellwich MfKaumlstner H Kleine Enzyshyklopaumldie Mathematik Leipzig 1969 S 799)
Grad CO Grad cO
45 07071 90 00000 44 7193 89 0175 43 7314 88 0349 42 7431 87 0523 41 7547 86 0698 40 07660 85 0872 39 7771 84 1045 38 7880 83 1219 37 7986 82 1392 36 8090 81 1564 35 8192 80 01736 34 8290 79 1908 33 8387 78 2079 32 8480 77 2250 31 8572 76 2419 30 08660 75 2588 29 8746 74 2756 28 8829 73 2924 27 8910 72 3090 26 8988 71 3256 25 9063 70 03420 24 9135 69 3584 23 9205 68 3746 22 9272 67 3907 21 9336 middot66 4067 ZO 09397 65 4226 19 9455 64 4384 18 9511 63 4540 17 9563 62 4695 16 9613 61 4848 15 9659 60 05000 14 9703 59 5150 13 9744 58 5299 12 9781 57 5446 11 9816 56 5592 10 09848 55 5736 9 9877 54 5878 8 9903 53 6018 7 9925 52 6157 6 9945 51 6293 5 9962 50 06428 4 9976 49 6561 3 9986 48 6691 2 9994 47 6820 1 9998 46 6947 0 10000 45 7071
282 Faktorenanalyse
Abbildung 517 Korrelationsmatrix
R =r68660 1 06428lO1736 ~
R laumlszligt sich auch anders schreiben (vgl Abbildung 518)
Abbildung 518 Korrelationsmatrix mit Winkelausdrucken
l0deg R = 30deg 0deg
80deg 50deg 0deg
Der Leser moumlge die entsprechenden Werte selbst in einer Cosinus-Tabelle uumlbershy
pruumlfenDie der oben gezeigten Korrelationsmatrix zugrundeliegenden drei Variablen
und ihre Beziehungen zueinander lassen sich relativ leicht in einem zweidimen sionalen Raum darstellen (Abbildung 519)
Abbildung 519 Graphische Darstellung des 3-Variablen-Beispiels
Vektor X2
Vektorx3Vektor Xl
Vorgehensweise 283
Je mehr Variable jedoch zu beruumlcksichtigen sind desto mehr Dimensionen werden benoumltigt um die Vektoren in ihren entsprechenden Winkeln zueinander zu positioshy
nieren Die Faktorenanalyse trachtet nun danach das sich uumlber die Korrelationsshykoeffizienten gemessene Verhaumlltnis der Variablen zueinander in einem moumlglichst gering dimensionierten Raum zu reproduzieren Die Zahl der benoumltigten Achsen gibt dann die entsprechende Zahl der Faktoren an
Wenn man die Achsen als Faktoren ansieht dann stellt sich unmittelbar die Frashyge Wie werden diese Achsen (Faktoren) in ihrer Lage zu den jeweiligen Vektoren (Variablen) bestimmt
Dazu vergegenwaumlrtigt man sich am besten das Bild eines halboffenen Schirmes Die Zacken des Schirmgestaumlnges die alle in eine bestimmte Richtung weisend die Variablen repraumlsentieren lassen sich naumlherungsweise auch durch den Schirmstock darstellen Vereinfacht man diese Uumlberlegung aus DarstellungsgrQnden noch weishyter auf den 2-Variablen-Fall wie in AbbiIdu8520 die einen Korrelationskoshyeffizienten von 05 fuumlr die durch die Vektoren OA und OB dargestellten Variablen repraumlsentiert dann gibt der Vektor OC eine zusammenfassende (faktorielle) Beshyschreibung wieder Die beiden Winkel von 30deg zwischen Vektor I bzw Vektor II und Faktor-Vektor geben wiederum an inwieweit der gefundene Faktor mit Vekshytor (Variable) I bzw II zusammenhaumlngt Sie repraumlsentieren ebenfalls Korrelationsshykoeffizienten und zwar die zwischen den jeweiligen Variablen und dem Faktor Diese Korrelationskoeffizienten hatten wir oben als Faktorladungen bezeichnet Die Faktorladungen des 1 Faktors betragen also in bezug auf Variable I und Varishyable II cos 30deg = 08660
Abbildung 520 FaktorlOsung bei 2 Variablen
j
A
Vektor x
~---------__------~---- C
Resultante
e Vektor X
284 Faktorenanalyse
5223 Das Problem der Faktorextraktion
Nachdem wir nun wissen was eine Faktorladung inhaltlich bedeutet ist zu fragen Wie findet man einen solchen Vektor (Faktor) der stellvertretend ftir mehrere zushysammenhaumlngende Variable fungieren kann Erinnern wir uns noch einmal des Ausgangsbeispiels Aufstrichfette waren nach den ftinfMerkmalen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt - Haltbarkeit - Preis bewertet worden l2
Aus dieser Bewertung sei die Korrelationsmatrix in Abbildung 521 berechnet worden
Abbildung 521 Spiegelbildlich identische KOlTelationsmatrix
x X x x x
x 70 100 09848 90middotX 03420 30x 00000 10middotx
X -01736
Diese Korrelationsmatrix enthaumllt in der unteren Dreiecks-Matrix die Korrelationsshywerte in der oberen (spiegelbildlich identischen) Dreiecks-Matrix die entshysprechenden Winkel Graphisch ist der Inhalt dieser Matrix in Abbildung 522 darshygestellt
Das Beispiel wurde so gewaumlhlt daszlig die Winkel zwischen den Faktoren in einer zweidimensionalen Darstellung abgebildet werden koumlnnen - ein Fall der in der Realitaumlt allerdings kaum relevant ist
Wie findet man nun den 1 Faktor in dieser Vektordarstellung Bleiben wir zunaumlchst bei der graphischen Darstellung dann sucht man den
Schwerpunkt aus den ftinf Vektoren Der Leser moumlge sich dazu folgendes verdeutlichen
In Abbildung 522 ist der Faktor nichts anderes als die Resultante der funfVektoshyren Wuumlrden die ftinfVektoren funf Seile darstellen mit einem Gewicht in 0 und jeweils ein Mann wuumlrde mit gleicher Staumlrke an den Enden der Seile ziehen dann wuumlrde sich das Gewicht in eine bestimmte Richtung bewegen (vgl die gestrichelte
12 Es werden hier andere Werte als im Ausgangsbeispiel verwendet um zunaumlchst eine einshydeutige graphische Loumlsung zu ermoumlglichen
Vorgehensweise 285
Linie in Abbildung 523) Diesen Vektor bezeichnen wir als Resultante Er ist die graphische Repraumlsentation des 1 Faktors
Abbildung 522 Graphische Darstellung des 5-Variablen-Beispiels
~
XsXl
bull
Abbildung 523 Graphische Darstellung des Schwerpunktes
X2
XIX
Faktorshyvektor2
Betrachtet man nun die jetzt gebildeten Winkel zwischen dem 1 Faktor und den Ausgangsvektoren dann hat man auch die gesuchten Faktorladungen gefunden
(Erste Reshysultante)
4512
-------o
- -
286 Faktorenanalyse
Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen
Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben
Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge
die Werte selbst uumlberpruumlfen)
Abbildung 524 Einfaktorielle Ladungsmatrix
Faktor
05707Xl 07046x2 bull 09668x3
08211x4
07096
Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)
Abbildung 525 ZweifaktorieHe Ladungsmatrix
Faktor 1 Faktor 2
Xl 05707 -08211
x2 07046 -07096
x3 09668 02554
x4 08211 05707
Xs 07096 07046
Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa
Vorgehensweise 287
In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum
I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1
~~ 00
2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation
Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist
Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt
Sf = 1 = Ijj (9)J
3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt
Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)
Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung
Resutlanie 2 (Faktor 2)
A Vektor x o
120lt= fH bull C Resultante 1 (Faktor 1)
B Vektor x
288 Faktorenanalyse
Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB
Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel
Wenn obige Behauptung stimmt muumlszligte gelten
(lOa)[~J +[~~J =1
Uumlberpruumlfung 2 2 uumlc2
OC 00 +002 (lOb)--+-shy 2
OA OA OA2 2
In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)
Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)
(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)
2 2 OC +00
4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten
sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)
wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-
q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1
(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix
(2) Extraktion der
(5) Faktorinterpretatiln
(6) Bestimmung der Faktorwerte
Vorgehensweise 289
523 Bestimmung der Kommunalitaumlten
In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem
Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy
fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig
mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da
J
i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins
Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung
erklaumlrte Variant
standardisierte Gesamtvariant = 1
290 Faktorenanalyse
Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung
2 a j1 =07
2 2 8 j2 = 01 siRest= 02
Kommunalitat H =08 (erllt1arte Varianz)
Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)
R AmiddotA+U (7a)
Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet
Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion
Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer
Vorgehensweise 291
100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY
In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy
weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen
Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen
1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen
2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit
2 2I ~ ~ R j ~ mx rjk
Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse
- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy
13 Vgl Loehlin J C 1998 S 154 14
Vgl Uberla K 1972 S 155 ff
292 Faktorenanalyse
nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird
- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit
Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy
15formationsverlust deklariert wird
Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen
Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy
15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt
Vorgehensweise 293
tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder
Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren
Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen
Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren
Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist
Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf
Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden
Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel
Kommunalltlten
Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325
Extraktionsmelhode Hauptachsen-Faktorenanalyse
bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix
294 Faktorenanalyse
Abbildung 530 Faktorladungen im 6-Produkte-Beispiel
Faktoranmatrixmiddot
Faktor
1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608
Extraktionsmethode Hauptachsen-Faktorenanalyse
a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt
Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert
Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel
Reproduzierte Korrelationen
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT
KALORIEN
VITAMIN
HALTBARK
PREIS
96845 71193 96034 11035 04241
71193 52552b
70480
12709
07717
96034 70480 95292b
08461 01722
11035
12709 08461 99056b
8325
04241 07717 01722 98325 98070b
Residuun1 UNGEFETi
KALORIEN
VITAMIN
HALTBARK
PREIS
-00017 00101
-00141 00144
-00017
-00083 01001
- 01005
00101 -00083
-00036 00640
-00141 01061
-00636
00010
00144 -01005 00640 00010
ExtrakHonsmethode Hauptllchsenfaktorenanalyse
a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005
b Reproduzierte Kommunalltaumlten
Vorgehensweise 295
Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen
Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R
524 Zahl der Faktoren
(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix
(2) Extraktion der Faktoren
(6) Bestimmung der Faktorwerte
Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff
Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-
q N
trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N
Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden
Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy
296 Faktorenanalyse
Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre
Abbildung 532 Bestimmung der Eigenwerte
Faktorenmatrix
Faktor
1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)
Eigenwerte 25068 19112
Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil
Kom munalltaumlten
Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807
- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren
V orgehensweise 297
Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung
Abbildung 534 Scree-Test im 6-Produkte-Beispiel
Eigen- Screeplot wert 30
25
20
15
Kaiser-Kriterium
10 1 Elbow5
00 2 3 4 5
Faktomummer
298 Faktorenanalyse
525 Faktorinterpretation
Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)
Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt
(1) Variablenauswalll und Errechnung der Korrelationsmalrix
(2) Extraktion der Faktoran
(3) Bestimmung der Kommunalltaumllen
(6) Bestimmung derFaktorwerte _______---11
middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull
geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht
Abbildung 535 Faktorladungen im 6-Produkte-Beispiel
Preis Haltbarkeit
Extraktionsmethode Hauptachsen-Faktorenanalyse
Vorgehensweise 299
Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist
Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig
Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16
Abbildung 536 Unrotierte Faktorladungen
F
F
Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung
Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f
300 Faktorenanalyse
536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy
tert
Abbildung 537 Rotierte Faktorladungen
F (Ausgangssituation)2
11 F2 (rotiert)
F1
-- shy
(Ausgangssituation)
11
F1 (rotiert)
SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen
1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen
(rechtwinkligen) Rotation
2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren
Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die
vorgenenswelse j U 1
Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind
Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel
Faktor
1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt
Haltbarkeit
72152 bull 07020
07962 I 99208 Preis 01060 99025
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung
Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen
A bull =A T mit TC~SI7 - sina ] sma cosa
Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links
A T A 094331 - 028039 098357 003229
[C0s341570 - sin34 157 ]070669 016156 072152 007020
sin34157deg cos34157092825 - 030210 097615 000694
038926 091599 007962 099208
032320 093608 001060 099025
Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)
Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix
Faktor 1 2
1 94868 31622
2 -31622 94868
Il
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung
Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig
von a=1843deg
526 Bestimmung der Faktorwerte
(1) Variablenauswanl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitaumlten
Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte
Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt
(3c)Z=PmiddotA
Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY
(12)Z AT1p AAT
Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt
(13)ZArl=pE
Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten
(3c) wird von rechts mit A multipliziert
ZmiddotA=PmiddotAmiddotA (15)
Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar
ZAmiddot(A At1=P(A A) (A Atl (16)
Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt
P=ZA(AAt l (17)
In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren
In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term
AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte
Abbildung 540 Koeffizientenmatrix der Faktorwerte
Faktor 1 2
Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression
Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die
xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf
SjDa p E=P ist ergibt sich
Seite 271 zu (14)
P=ZAT
304 Faktorenanalyse
Abbildung 541 Standardisierte Ausgangsdatenmatrix Z
45ampt6R4LJL4
Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542
Abbildung 542 Faktorwerte im 6-Produkte-Beispiel
Vorgehensweise 305
Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel
Du darfst
VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG
E 11 BecelS
U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T
Sanella IIII Holl Butter
-1
bull Rama
-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18
WIRTSCHAFTLICHKEIT
Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen
527 Zusammenfassende Darstellung der Faktorenanalyse
Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy
e Vorgehensweise 307 306 Faktorenanalyse
Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen
sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-
schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy
tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig
wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy
nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy
chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy
analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte
Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht
Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der
Verwendung des Verfahrens offenzulegen
I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _
CQ)l2CQgtQ ~ i
-Q)C t l5~11
0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C
CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O
~ ~ 11 t 3
uj~fi
t Imiddot~ J1 ~SHaa
It c~
c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~
-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi
o~ ~ -gEG)
I ~l c c ~l~ampi
2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E
U~a ]i E
J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy
~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--
----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt
Fallbeispiel 309308 Faktorenanalyse
Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert
531 Problemstellung
In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften
Variable und Objekte des BeispielsAbbildung 545
EigenschaftenMarken M k (k=I Il) xj(j=I IO)
A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado
5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H
I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama
Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist
Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)
Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern
Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse
---
310Faktorenanalyse
532 Ergebnisse
1 Variablenauswahl und Errechnung der Korrelationsmatrix
Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung
548 wiedergegeben
Abbildung 548 Die Korrelationskoeffizienten -_ -
-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy
In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der
Fallbeispiel 311
Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet
Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie
-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -
06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170
-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260
62444 -97126 66229 -83532 -62589
-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545
-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno
Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)
Abbildung 550 Dialogfeld Deskriptive Statistik
312 Faktorenanalyse
2 Bestimmung der Kommunalitilten
Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt
wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend
bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich
von den Startwerten abweichen
Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten
Hauptkomponentenanalyse Hauptachsenanalyse
Variable Korrunuriali- Kommunali- Korrununali- Kommunali-
Ut (Startwerte)
tlt (Endwerte)
tlIl (Startwerte )
tlIl (End werte)
STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR
100000 100000 100000 100000 100000 100000 100000 100000 100000 100000
88619
76855
89167 85324 76043 84012 80223 92668 63297 88786
97414
89018
79497
85847
96501
98810
97132
99166
78019
96445
85325
55717
85754
91075
55819
82330
73903
94796
40402
87851
Fallbeispiel 313
Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy
I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren
Abbildung 552 Dialogfeld Extraktion
Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist
3 Wabl der Extraktionsmetbode
Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen
4 Zabl der Faktoren
Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen
Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet
Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch
17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f
1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden
Erklaumlrte Gesamtvarianz
Anfaumlngliche Eigenwerte
314 Faktorenanalyse
Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy
den sich fUnfFaktoren ergeben
Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien
95) der Varianz erklaumlrt sind
2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)
3 Extrahiere n (zB 3) Faktoren
4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy
renzahl
5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein
6 Extrahiere alle Faktoren die nach der
Vom Computer automatisch verwandt wenn keine andere Spezifikation
Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden
Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden
Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist
Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt
Fallbeispiel 315
Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil
Faktor 1
2 3
4
5
6
7
8
9
10
Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden
Abbildung 555 Scree-Test und Kaiser-Kriterium
Eigen- -=gtcreeplot wert
5
4
3
2
10
o Kaisershy
~ 3 i i 7 i Q
Faktornummer
Gesamt 505188
177106
142700
81935
42961
24709
15928
06190
02943
00340
der Varianz 5051883
1771061
1427002
819349 429611
247085
159275
61902
29434
03398
Kumulierte 5051883
6822944
8249946
9069295
9498905
9745991
9905266
9967168
9996602
10000000
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
ov nlIUOrtII11IlllIYSt Problemstellung 261
51 Problemstellung Abbildung 51 Anwendungsbeispiele der Faktorenanalyse
Fuumlr viele wissenschaftliche und praktische Fragestellungen geht es darum den Wirkungszusammenhang zwischen zwei oder mehreren Variablen zu untersuchen Methodisches Hilfsmittel dafilr sind in der Regel die Regressions- und Korrelatishyonsanalyse Reicht eine relativ geringe Zahl von unabhaumlngigen Variablen zur Ershyklaumlrung einer abhaumlngigen Variablen aus und lassen sich die unabhaumlngigen Variabshylen relativ leicht ermitteln so wirft diese Vorgehensweise kaum schwerwiegende Probleme auf
In manchen - insbesondere naturwissenschaftlichen - Bereichen kommt man in der Tat haumlufig mit einer relativ kleinen Zahl von Variablen aus um zB bestimmte physikalische Effekte erklaumlren bzw prognostizieren zu koumlnnen
In den Sozialwissenschaften ist die Situation jedoch anders 1 d R ist zur Erklaumlshyrung menschlicher Verhaltensweisen oder allgemeiner sozialer Phaumlnomene eine Vielzahl von Einfluszligfaktoren (Variablen) zu beruumlcksichtigen Je groumlszliger jedoch die Zahl der notwendigen Erklaumlrungsvariablen wird um so weniger ist gesichert daszlig diese auch tatsaumlchlich alle unabhaumlngig voneinander zur Erklaumlrung des Sachshyverhaltes notwendig sind Bedingen sich die Erklaumlrungsvariablen gegenseitig dann fuumlhrt die Einbeziehung aller Variablen zu unbefriedigenden Erklaumlrungswerten
Eines der Hauptprobleme sozialwissenschaftlicher Erklaumlrungsansaumltze liegt daher darin aus der Vielzahl moumlglicher Variablen die voneinander unabhaumlngigen Einfluszligfaktoren herauszukristallisieren die dann weiteren Analysen zugrunde geshylegt werden koumlnnen Genau das macht sich die Faktorenanalyse zur Aufgabe Im Gegensatz beispielsweise zur Regressionsanalyse versucht die Faktorenanalyse also einen Beitrag zur Entdeckung von untereinander unabhaumlngigen Beshyschreibungs- und Erklaumlrungsvariablen zu finden
Gelingt es tatsaumlchlich die Vielzahl moumlglicher Variablen auf wenige wichtige Einfluszligfaktoren zuruumlckzufuumlhren (zu reduzieren) lassen sich fuumlr empirische Unshytersuchungen erhebliche Vorteile realisieren So kann zB eine Vielzahl moumlglicher Einfluszligfaktoren getestet werden und es muszlig erst im nachhinein entschieden wershyden welche Variablen oder Variablenbuumlndel tatsaumlchlich erklaumlrungsrelevant sind Daruumlber hinaus ermoumlglicht dieses Verfahren durch die Datenreduktion eine Ershyleichterung empirischer Forschungsarbeit
In Abbildung 51 sind einige Anwendungsbeispiele der Faktorenanalyse zusamshymengestellt Sie vermitteln einen Einblick in die Problemstellung die Zahl und Art der Merkmale die aus den Merkmalen extrahierten Faktoren sowie die jeweiligen Untersuchungseinheiten
Problemstellung Merkmale Faktoren
StadtanalyseI
Bevoumllkerungszahl Bevoumllkerungs- und Beschaumlftigtenzahl Beschaumlftigtenfaktor Dienstleistungsangebot Ausbildungs- und Schulbildung Wirtschaftsfaktor Haumluserwert
Untersuchungen der Streckenplanung Bildliche kognitiven Gruppierung von Faumlhigkeit Faumlhigkeiten
2 Symbolen Erkennung von Aumlhnlichkeitenetc Wortschatz Verbale
~ Schluszligfolgerungs- Faumlhigkeit shy eigenschaften
Satzbau etc Kostenanalyse
3 18 Kostenarten Beeinfluszligbarkei t differenziert nach Deckungsdringlichshyjeweils 5 Kosten- keit eigenschaften
Blutdruckmessung4 1 SB DM Systolischer 2 bis 12 SBDM Blutdruck I OBDM Diastolischer 2 bis 12 DBDM Blutdruck
(SBDM = Systolische Blutdruckmessung DBOM =Diastolische Blutdruckmessung)
Veranschaulichen wir uns die Problemstellung noch einmal anhand eines konkreshyten Beispiels In einer Befragung seien Hausfrauen nach ihrer Einschaumltzung von Emulsionsfetten (Butter Margarine) befragt worden Dabei seien die Marken Rashyma Sanella Becel Du darfst Hollaumlndische Markenbutter und Weihnachtsbutter anband der Variablen Anteil ungesaumlttigter Fettsaumluren Kaloriengehalt Vitamingeshyhalt Haltbarkeit und Preis auf einer siebenstufigen Skala von hoch bis niedrig beshyurteilt worden
I VgL Harman H H 1976 S 13 ff
2 VgL Carroll J 8 1993
3 Vgl Plinke W 1985 S 118 ff 4
Vgl Uberla K 1977 S 264 ff
262 Faktorenanalyse
Die nachfolgende Abbildung 52 zeigt einen Ausschnitt aus dem entsprechenden Fragebogen
Abbildung 52 Fragebogenausschnitt
Beurteilen Sie bitte die Margarinemarke Rama an hand folgender Eigenschaften
niedrig hoch
Anteil ung Fettsaumluren
Kaloriengehalt
Vitamingehalt
Haltbarkeit
Preis 1 2
I 3
I 4
I 5
I 6
I 7
Die Beantwortung des obigen Fragebogenausschnitts durch die 30 befragten Proshybanden liefert subjektive Eigenschaftsurteile der fuumlnf Variablenftlr die Margashyrinemarke Rama so da~ eine (30 x 5)-Matrix entsteht Diese Matrix kann der weishyteren Analyse zugrunde gelegt werden Wir haben dann 5 Eigenschaften und 30 Faumllle wobei wir ft1r unsere Analyse unterstellen daszlig die Befragtenurteile unshyabhaumlngig voneinander sind
Will man jedoch die sechs Marken gleichzeitig analysieren so werden haumlufig ftlr jede Eigenschaft pro Marke Durchschnittswerte uumlber alle 30 Befragten gebildet Wir erhalten dann eine (6 x 5)-Matrix wobei die Marken als Faumllle interpretiert werden Bei einer ~olchen Durchschnittsbildung muszlig man sich allerdings bewuszligt sein daszlig man bestimmte Informationen (naumlmlich die uumlber die Streuung der Ausshypraumlgung zwischen den Personen) verliert
Je groumlszliger die Streuung der Stichprobenwerte ist um so problematischer ist der Aussagewert bei einer solchen Vorgehensweise Da in praktischen Faumlllen haumlufig dennoch so vorgegangen wird beziehen sich auch die nachfolgenden Ausfuumlhshyrungen auf die der (6 x 5)-Matrix zugrundeliegenden Durchschnittswerte uumlber alle Personen Im abschlieszligenden Kapitel wird ein Loumlsungsvorschlag rur eine Alshyternative zur Durchschnittsbildung vorgestellt
Problemstellung 263
Wir jassen zusammen Unsere Befragung liefert uns folgende Daten
Abbildung 53 Ausgangsdaten im Beispiel
VARIABLEN (Anteil unges Fettsaumluren V bull bull V
0 bull VPerson 1
OBJEKT Pelllon 2 (8_1
bull bull bull Vusw) f------ -c-
Person 3 O
L V bull v I 0
LJ~ -~
Es sei unterstellt daszlig die ausgewaumlhlten Eigenschaften fiir die Beurteilung von Emulsionsfetten auch als relevant angesehen werden koumlnnen Fuumlr die folgenden Betrachtungen verdichten wir nun die Werte aus Abbildung 53 durch Bildung der arithmetischen Mittel rur jede ObjektlVariablen-Kombination uumlber alle 30 Befragshyten Als Durchschnittswert der 30 befragten Probanden moumlgen sich bei dieser Beshyfragung uumlber alle Hausfrauen folgende Werte ergeben haben (Abbildung 54)
Miszligt man den Informationsgehalt einer Datenstruktur an der in ihr enthaltenen Streuung (Varianz) der Befragungswerte so verliert man durch die Durchshyschnittsbildung einen Teil der urspruumlnglichen Informationen (Streuungen) und der Informationsgehalt der Mittelwertmatrix in Abbildung 54 enthaumllt jetzt nur noch die Streuung der durchschnittlichen Beurteilungen uumlber die verschiedenen EmushyISionsjette
Ein erster Blick auf die Ausgangsdatenmatrix macht bereits deutlich daszlig die Eishygenschaften (Variablen) XI bis x3 bei den Margarinemarken (Sanella Becel und Du darfst Ausnahme Rama) tendenziell houmlher bewertet wurden als bei den Buttershysorten (Hollaumlndische Butter und Weihnachtsbutter) waumlhrend die Eigenschaften x4 und Xs primaumlr bei den Buttersorten houmlher ausgepraumlgt sind Die Ausgangsdaten geshyben damit in diesem Beispiel bereits einen Hinweis darauf daszlig zwei Gruppen (xl x2 x3 und x4 xS) aumlhnlich beurteilter Variablen existieren die sich in der Beurteishylung untereinander aber unterscheiden Damit laumlszligt sich in diesem Beispiel bereits aus der Datenstruktur ein Beziehungszusammenhang vermuten Will man diese Vermutung genauer uumlberpruumlfen so ist es erforderlich auf ein statistisches Kriterishy
264 Faktorenanalyse
um zuruumlckzugreifen das die Quantifizierung von Beziehungen zwischen Variablen erlaubt Ein solches statistisches Kriterium stellt der Korrelationskoeffizient dar Durch die Berechnung von Korrelationen zwischen allen Variablen laumlszligt sich die Staumlrke der Beziehungszusammenhaumlnge zwischen allen Variablen berechnen
Abbildung 54 Mittelwertmatrix fuumlr das 6-Produkte-Beispiel
Eigenschaften
Marken Xl X2 x3 x4 Xs Rama I I 2 I 2 Sanella 2 6 334 Becel 4 5 445 Du darfst 5 6 623 Hollaumlndische Butter 2 3 3 5 7 Weihnachtsbutter 3 4 4 6 7
wobei x I = Anteil ungesaumlttigter Fettsaumluren x2 = Kaloriengehalt x3 = Vitamingehalt x4 = Haltbarkeit Xs = Preis
Dabei ist jedoch zu beachtlaquon daszlig Korrelationen grundsaumltzlich auf drei verschieshydene Arten kausal interpretiert werden koumlnnen Wir wollen dies an dem Beispiel der Variablen Fettsaumluren und Vitamingehalt verdeutlichen
1 Die Korrelation zwischen Fettsaumluren und Vitamingehalt resultiert daraus daszlig sich durch die Erhoumlhung des Anteils ungesaumlttigter Fettsaumluren auch der Vitamingehalt erhoumlht
2 Die Korrelation zwischen Fettsaumluren und Vitamingehalt resultiert daraus daszlig durch eine Erhoumlhung des Vitamingehalts auch der Anteil ungesaumlttigter Fettsaumluren gesteigert wird
3 Fuumlr die Korrelation zwischen Fettsaumluren und Vitamingehalt ist eine hinshyter diesen beiden Variablen stehende Groumlszlige kausal verantwortlich d h diese hypothetische Groumlszlige stellt die Ursache fuumlr das Zustandekommen der Korrelashytion dar
An dieser Stelle wird bereits deutlich daszlig aus inhaltlichen Uumlberlegungen heraus entschieden werden muszlig welche der obigen drei Interpretationsmoumlglichkeiten in einer bestimmten Anwendungssituation Guumlltigkeit besitzt Die Faktorenanalyse unterstellt daszlig immer die dritte Interpretationsvariante zutrifft Nur wenn dem aufshygrund sachlogischer Uumlberlegungen zugestimmt werden kann darf eine Faktoshyrenanalyse angewendet werden
Problemstellung 26S
Verzichtet man zunaumlchst auf die Berechnung von Korrelationen und unterstellt die Guumlltigkeit der o g dritten Interpretationsart so koumlnnen wir in obigem Beispiel von der plausiblen Vermutung ausgehen daszlig Xl bis x3 sowie x4 und x5 lediglich Beshyschreibungen von zwei eigentlich hinter diesen Variablen stehenden Groumlszligen (Faktoren) darstellen
Diese Vermutung laumlszligt sich graphisch wie in Abbildung 55 dargestellt vershydeutlichen
Abbildung 55 Grundgedanke der Faktorenanalyse im Beispiel
VARIABLEN FAKTOREN
x Anteil ungesaumltshy tigter Fettsaumluren I~---___-
x Kaloriengehalt rmiddot------=~31 F 1 GESUNDHEIT
~
x Vitamingehalt
I Hba ~___= F WIRTSCHAFTshy
LICHKEITI x bull Preis ~ _ _shy
Ausgehend von den flinf Eigenschaften die in der Befragung verwendet wurden wird aufgrund der sich in den Daten manifestierenden Beziehungen zwischen xl bis x3 bzw x4 und Xs vermutet daszlig eigentlich nur zwei unabhaumlngige Beschreishybungsdimensionen fuumlr die Aufstrichfette existieren (die die Variationen in den Vashyriablen bedingen) Xl bis x3 koumlnnten ZB Ausdruck eines Faktors sein den man etwa mit Gesundheit bezeichnen koumlnnte denn sowohl der Anteil ungesaumlttigter Fettsaumluren als auch Kaloriengehalt und Vitamingehalt haben etwas mit der Geshysundheit zu tun Ebenso koumlnnen die Variablen x4 und Xs (Haltbarkeit und Preis) Ausdruck fuumlr Wirtschaftlichkeitsuumlberlegungen sein Man koumlnnte also vermuten daszlig sich die Variablen Xl bis Xs in diesem konkreten Fall auf zwei komplexere Vashyriablenbuumlndel verdichten lassen Diese Variablenbuumlndel bezeichnen wir im folshygenden als Faktoren
266 Faktorenanalyse
Werden die im Ausgang betrachteten Eigenschaften zu Faktoren zusammengefaszligt so ist unmittelbar einsichtig daszlig gegenuumlber der Mittelwertmatrix in Abbildung 54 ein weiterer Informationsverlust entsteht da idR weniger Faktoren alsursprilngshyliehe Eigenschaften betrachtet werden Dieser Informationsverlust ist darin zu seshyhen daszlig zum einen die Faktoren in der Summe nur weniger Varianz erklaumlren koumlnshynen als die fuumlnf Ausgangsvariablen und zum anderen die Varianz einer jeden Ausshygangs groumlszlige in der Erhebungsgesamtheit ebenfalls durch die Faktoren idR nicht vollstaumlndig erklaumlrt werden kann Der Verlust an erklaumlrter Varianz wird im Rahmen der Faktorenanalyse zugunsten der Variablenverdichtung bewuszligt in Kauf genomshymen Allerdings muszlig sich der Anwender vorab uumlberlegen in welchem Ausmaszlig dieser Erklaumlrungsverlust (im Sinne eines Varianzverlustes) bei den einzelnen Ausshygangsvariablen toleriert bzw wieviel Varianz durch die Faktoren bei einer beshystimmten Variablen erklaumlrt werden soll Den Umfang an Varianzerklaumlrung den die Faktoren gemeinsam fllr eine Ausgangsvariable liefern wird als Komm~nalitaumlt beshyzeichnet Die Art und Weise mit der die Kommunalitaumlten bestimmt werden ist unmittelbar an die Methode der Faktorenermittlung (Faktorextraktionsmethode) gekoppelt Je nachdem welche Uumlberlegungen der Kommunalitaumltenbestimmung zugrunde liegen werden unterschiedliche Faktorenanalyseverfahren relevant
Ist eine Entscheidung uumlber die HOumlhe der Kommunalitaumlten der einzelnen Ausshygangsvariablen getroffen so muszlig weiterhin uumlber die Anzahl der zu extrahierenden Faktoren entschieden werden da das Ziel der Faktorenanalyse gerade darin zu seshyhen ist weniger Faktoren als urspruumlngliche Variable zu erhalten Hier steht der Anwender vor dem Zielkonflikt daszlig mit einer geringen Faktorenzahl tendenziell ein groszliger Informationsverlust (im Sfnne von nicht erklaumlrter Varianz) verbunden ist und umgekehrt In unserem Beispiel hatten wir uns aufgrund einer Plaushysibilitaumltsbetrachtung fllr zwei Faktoren entschieden
Ist schlieszliglich die Anzahl der Faktoren bestimmt so ist es von besonderem Inshyteresse die Beziehungen zwischen den Ausgangsvariablen und den Faktoren zu kennen Zu diesem Zweck werden Korrelationen berechnet die ein Maszlig tuumlr die Staumlrke und die Richtung der Zusammenhaumlnge zwischen Faktoren und urshyspruumlnglichen Variablen angeben Diese Korrelationen werden als Faktorladungen bezeichnet und in der sog Faktorladungsmatrix zusarnmengefaBt Abschlieszligend ist es dann von Interesse wie die befragten Personen die Marken Rama SaneUa Becel Du darfst Hollaumlndische Markenbutter und Weihnachtsbutter im Hinblick auf die beiden kuumlnstlichen Faktoren Gesundheit und Wirtschaftlichkeit beshyurteilen wuumlrden Gesucht ist also die entsprechende Matrix zu Abbildung 54 die die Einschaumltzung der Marken bezuumlglich der beiden Faktoren Gesundheit und Wirtschaftlichkeit enthaumllt Diese Einschaumltzungen werden als Faktorwerte beshyzeichnet Abbildung 56 zeigt die entsprechende Faktorwerte-Matrix fuumlr unser kleines Ausgangsbeispiel Die Darstellung enthaumllt standardisierte Werte wobei die Auspraumlgungen als Abweichungen vom Mittelwert dargestellt sind
Problemstellung 267
Abbildung 56 Faktorwerte-Matrix r-shy
Faktor 1 Faktor 2
Rama -121136 -125027 Sanella -048288 -026891 Becel 057050 019027 Du darfst 156374 -088742 Hall Butter -063529 094719 Weihnachtsbutter 019530 126914
Die Faktorwerte liefern nicht nur einen Anhaltspunkt fuumlr die Einschaumltzung der Margarinesorten bezuumlglich der gefundenen Faktoren sondern erlauben daruumlber hinaus (im Fall einer 2- oder 3-Faktorloumlsung) eine graphische Darstellung der Faktorenergebnisse Durch solche Mappings lassen sich besonders gut die Poshysitionen von Objekten (hier Margarinemarken) im Hinblick auf die gefundenen Faktoren visualisieren (vgl Abbildung 57)
Abbildung 57 Mapping der Faktorwerte
F 20 a k 15 t 0 r 10
05
00
-05
-10
-15
Du darfstbull f-
Becelbull Weihnachtsbutter
bull Sanellabull Holl Butterbull
Rama
bull I
-15 -10 -05 00 05 10 15
Faktor 2
268 Faktorenanalyse
Dabei wird deutlich daszlig es sich bei diesem mapping um eine relative Darstelshylung handelt Die Faktorwerte werden als Abweichung vom auf Null nonnierten Mittelwert dargestellt so daszlig hohe positive Faktorwerte stark uumlberdurchschnittlishyche hohe negative Faktorwerte stark unterdurchschnittliche Auspraumlgungen kennshy
zeichnen Der in Abbildung 58 dargestellte knappe Aufriszlig der Faktorenanalyse enthaumllt die
wesentlichen Teilschritte bei der Durchfiihrung einer Faktorenanalyse und ist unshyten als Ablaufdiagramm dargestellt Entsprechend diesem Ablaufdiagramm sind die nachfolgenden Betrachtungen aufgebaut Allerdings ist zu beachten daszlig sich bei konkreten Anwendungen der Faktorenanalyse insbesondere die Schritte (2) und (3) gegenseitig bedingen und nur schwer voneinander trennen lassen Aus dishydaktischen Gruumlnden wurde hier aber eine Trennung vorgenommen
bull Abbildung 58 Ablauf einer Faktorenanalyse
(1) Variablenauswahl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitaumlten
(4) Zahl der Faktoren
(5) Faktorinterpretation
(6) Bestimmung der Faktorwerte
Vorgehensweise 269
52 Vorgehensweise
5 Variablenauswahl und Errechnung der Korrelationsmatrix
Die Guumlte der Ergebnisse einer Faktorenanalyse ist von der Zuverlaumlssigkeit der Ausgangsdaten abhaumlngig Es muszlig deshalb besondere Sorgfalt auf die Wahl der Unshytersuchungsmerkmale verwendet werden Insbesondere
~ (2) Extraktion der Faktoren I
(3) Bestimmung der Kommunalitaumlten
u
(6) Bestimmung der Faktorwerte
ist darauf zu achten daszlig die erhobenen Merkmale auch fuumlr den Untersuchungsgegenstand relevant sind Irreleshyvante Merkmale sind vorab auszusortieren sowie als aumlhnlich erachtete Kriterien muumlssen zusammengefaszligt werden Insbesondere bei der Formulierung von Befragungsitems ist darauf zu achten daszlig bereits die Wortwahl der Fragestellungen das Antwortverhalten der Befragten und damit die Streuung der Daten beeinfluszligt Weiterhin sollten die Befragten einer rnoumlgshylichst homogenen Stichprobe entstammen da die Houmlhej bull
der KorrelatIOnen ZWischen den Untersuchungsmerk- malen (Variablen) durch den Homogenitaumltsgrad der Befragungsstichprobe beeinshyfluszligt wird
Die oben aufgezeigten Sachverhalte schlagen sich insgesamt in den Korrelashytionen nieder die als Maszlig fuumlr den Zusammenhang zwischen Variablen errechnet werden Es wurden deshalb Pruumlfkriterien entwickelt die es erlauben Variablenshyzusammenhaumlnge auf ihre Eignung fuumlr eine Faktorenanalyse zu uumlberpruumlfen Wir werden deshalb im folgenden zunaumlchst auf die Ermittlung von Korrelationen naumlher eingehen und sodann ausgewaumlhlte (statistische) Pruumlfkriterien erlaumlutern
5211 Korrelationsanalyse zur Aufdeckung der Variablenzusammenhaumlnge
Faktoren die als hinter den Variablen stehende Groumlszligen angesehen werden reshypraumlsentieren den Zusammenhang zwischen verschiedenen Ausgangsvariablen Beshyvor solche Faktoren ennittelt werden koumlnnen ist es zunaumlchst erforderlich die Zushysammenhaumlnge zwischen den Ausgangsvariablen meszligbar zu machen Als meshythodisches Hilfsmittel wird hierzu die Korrelationsrechnung herangezogen
Bereits anhand der Korrelationen laumlszligt sich erkennen ob Zusammenhaumlnge zwishyschen Paaren von Variablen bestehen so daszlig Variablen als voneinander abhaumlngig und damit als buumlndelungsfaumlhig angesehen werden koumlnnen
Fuumlr die Mittelwertmatrix (Abbildung 54) in obigem Beispiel laumlszligt sich zB die Korrelation zwischen x 1 (Anteil ungesaumlttigter Fettsaumluren) und x2 (Kaloriengehalt) wie folgt berechnen
~ IV taAtvJuAtJ(U)0
Korrelationskoeffizient
K 2(Xkl-XI)(XkZ -X2)
k = I (1)r = -===========XX2 I K K
2 (Xkl _X))2 2(XkZ -X2Y k = I k = I
mit
Auspraumlgung der Variablen I bei Objekt k (in unserem BeispielXkl laumluft k von 1 bis 6 (6 Markenraquo Mittelwert der Auspraumlgung von Variable 1 uumlber alle Objekte k Xl Auspraumlgung der Variablen 2 bei Objekt k xkZ Mittelwert der Auspraumlgung von Variable 2 uumlber alle Objekte k X2
Setzt man in Formel (1) die entsprechenden Werte der Ausgangsdatenmatrix ein so ergibt sich ein Korrelationskoeffizient von rbullbull =071176 Um die im einshy
1 2
zeInen notwendigen Rechenschritte zu erleichtern bedient man sich zurErmittlung der Korrelationskoeffizienten am besten der Hilfstabelle (Abbildung 59) Dabei stellt Xl den Mittelwert uumlber alle Marken rur die Eigenschaft Ungesaumlttigte Fettshy
saumluren ((1+2+4+5+2+36=283) und X2 ftlr die Eigenschaft Kaloriengeshy
halt ((1+6+5+6+3+46=417) dar
Abbildung 59 Hilfstabelle zur Berechnung eines Korrelationskoeffizienten
(x-l() (x-llt) (x-x)(x-J()(x -x) (x-llt)
336110 1002780 580555183333 -316667Rama 336110 middot152777-083333 183333 069444Sanella 069444 097222116667 063333 136112Becel 336110 397222216667 183333 469446Du darfst 097222middot083333 -116667 069444 136111Holt Butter 002778 -002778016667 -016667 002778Weihnechtsbutter
1083334 1883333 1016666 ----__----~--------__~-~~------_
(xx) I6 (xx) I6
(x-i)(xx) k=1 k=1
1016664r =VOuml8333011883333 =071176
Berechnet man die Korrelationskoeffizienten uumlber alle Eigenschaften ergibt sich rur die Mittelwertmatrix die in Abbildung 510 abgebildete Korrelationsmatrix
vorgenenswelse L 1
Abbildung 510 Korrelationsmatrix rur das 6-Produkte-Beispiel
UNGEFETI KALORlEN VITAMIN HALTBARK PREIS
-------------------- ---_--- ----------UNGEFETT 100000 KALORlEN 071176 100000
VITAMIN Q~~Pplusmn _QJQ~~__ 19PPQQ __ HALTBARK 010894 013771 007825 ri~oumloumloumloumloumlmiddot-------------------
PREIS 004385 006652 002362 098334 100000
In der Regel empfiehlt es sich die Ausgangsdatenmatrix vorab zu standardisieren da dadurch
- die Korrelationsrechnung und die im Rahmen der Faktorenanalyse erforderlishychen Rechenschritte erleichtert werden
- Interpretationserleichterungen erzielt werden - eine Vergleichbarkeit der Variablen ermoumlglicht wird die in unterschiedlichen
Maszligeinheiten erhoben wurden (zB Einkommen gemessen in Euro und Verkauf von Guumltern in Stck)
Eine Standardisierung der Datenmatrix erfolgt durch die Bildung der Differenz zwischen dem Mittelwert und dem jeweiligen Beobachtungswert einer Variablen sowie der anschlieszligenden Division durch die Standardabweichung Dadurch wird sichergestellt daszlig der neue Mittelwert gleich Null und die Standardabweichung einer Variablen gleich Eins ist Die Werte einer standardisierten Datenmatrix beshyzeichnen wir im folgenden nicht mehr mit x sondern mit z
Standardisierte Variable
Xk -x Zkj = J j
Sj
mit
Xkj BeobachtungSlVert der Variablenj bei Objekt k
Xj Durchschnitt aller Beobachtungswerte der Variablenj uumlber alle Objekte
s j Standardabweichung der Variablen j
Zkj Standardisierter Beobachtungswert der Variablen j bei Objekt k
Aus der standardisierten Datenmatrix ergibt sich auch eine einfachere Berechnung der Korrelationsmatrix R nach folgender Formel
R=_I_ZmiddotZ (2)K-I
272 Faktorenanalyse Vorgehensweise 273
wobei Z die transponierte Matrix der standardisierten Ausgangsdatenmatrix Z darstellt
Der Leser moumlge selbst anhand des Beispiels die Guumlltigkeit der Formel uumlberpruumlshyfen Dabei wird klar werden daszlig die Korrelationsmatrix auf Basis der Ausshygangsdaten identisch ist mit der Korrelationsmatrix auf Basis der standardisierten Daten Wird die Korrelationsmatrix aus standardisierten Daten errechnet so sind in diesem Falle Varianz-Kovarianzmatrix und Korrelationsmatrix identisch Fuumlr den Korrelationskoeffizienten laumlszligt sich auch schreiben
S 1middot2 SI ( - )( - )rx =-- mit x x =--t xkl-x Xk2-x 2
1 2 S S Imiddot 2 K -1 k XI X2
Da wegen der Standardisierung die beiden Varia~zen im Nenner 1 sind folgt daszlig Korrelationskoeffizient und Kovarianz SIX2) identisch sind
Die Korrelationsmatrix zeigt dem Anwender auf welche Variablen der Ausgangsshybefragung offenbar mit welchen anderen Variablen dieser Befragung irgendwie zusammenhaumlngen Sie zeigt ihm jedoch nicht ob
I die Variablen sich gegenseitig bedingen
oder
2 das Zustandekommen der Korrelationswerte durch einen oder mehrere hinter den zusammenhaumlngenden Variablen stehenden Faktoren bestimmt wird
Angesichts der beiden klar trennbaren Bloumlcke der Korrelationsmatrix (vgL die abshygegrenzten Vierecke) laumlszligt sich vermuten daszlig die Variablen XI bis x3 und x4xS durch zwei Faktoren erklaumlrt werden koumlnnten
Ausgehend von dieser Hypothese stellt sich unmittelbar die Frage mit welchem Gewicht denn die beiden Faktoren an der Beschreibung der beobachteten Zusamshymenhaumlnge beteiligt sind Es ist ja denkbar daszlig der Faktor Gesundheit als alleinishyger Beschreibungsfaktor filr die Variablen Xl bis x3 fast filr die gesamten Untershyschiede in der Ausgangsbefragung verantwortlich ist Es kann aber auch sein daszlig er nur einen Teil der unterschiedlichen Beurteilungen in der Ausgangsbefragung erklaumlrt Die groumlszligere oder geringere Bedeutung beider Faktoren laumlszligt sich in einer Gewichtszahl ausdrucken die im Rahmen einer Faktorenanalyse auch als Eigenshywert bezeichnet wird
5Ul Eignung der Korrelationsmatrix
Zu Beginn des Abschnittes 521 hatten wir bereits darauf hingewiesen daszlig sich die Eignung der Ausgangsdaten filr faktoranalytische Zwecke in der Korrelatishyonsmatrix widerspiegelt Dabei liefern bereits die Ausgangsdaten selbst einen Anshyhaltspunkt zur Eignungsbeurteilung der Daten zum Zwecke der Faktorenanalyse da die Houmlhe der Korrelationskoeffizienten durch die Verteilung der Variablen in der Erhebungsgesamtheit (Symmetrie Schiefe und Woumllbung der Verteilung) beeinfluszligt wird Liegt einer Erhebung eine heterogene Datenstruktur zugrunde so
macht sich dies durch viele kleine Werte in der Korrelationsmatrix bemerkbar II womit eine sinnvolle Anwendung der Faktorenanalyse in Frage gestellt ist Es ist
deshalb vorab eine Prufung der Variablen auf Normalverteilung ZUmindest aber auf Gleichartigkeit der Verteilungen empfehlenswert obwohl die Faktorenanalyseselbst keine Verteilungsannahmen setzt
Bezogen auf unser 6-Produkte-Beispiel treten neben sehr hohen Werten (gt 07) insbesondere im unteren Teil der Matrix kleine Korrelationen auf (vgl Abbildung 510) so daszlig die Korrelationsmatrix selbst kein eindeutiges Urteil uumlber die Eigshynung der Daten zur Faktorenanalyse zulaumlszligt
Es ist deshalb zweckmaumlszligig weitere Kriterien zur Pruumlfung heranzuziehen Hierzu bieten sich insbesondere statistische Prufkriterien an die eine Uumlberpruumlfung der Korrelationskoeffizienten auf Eignung zur Faktorenanalyse ermoumlglichen Es ist durchaus empfehlenswert mehr als ein Kriterium zur faktoranalytischen Eignung der Datenmatrix anzuwenden da die verschiedenen Kriterien unterschiedliche Vor- und Nachteile haben Im einzelnen werden durch SPSS folgende Kriterien bereitgestellt
Signifikanzniveaus der Korrelationen
Ein Signifikanzniveau uumlberpruumlft die Wahrscheinlichkeit mit der eine ZUvor formushylierte Hypothese zutrifft oder nicht Fuumlr alle Korrelationskoeffizienten lassen sich die Signifikanzniveaus anfilhren Zuvor wird eine sogenannte Ho-Hypothese forshymuliert die aussagt daszlig kein Zusammenhang zwischen den Variablen besteht Das Signifikanzniveau des Korrelationskoeffizienten berechnet anschlieszligend mit welshycher Irrtums wahrscheinlichkeit eben diese Ho-Hypothese abgelehnt werden kann Ein beispielhaftes Signifikanzniveau von 000 bedeutet daszlig mit dieser Irrtumsshywahrscheinlichkeit die Ho-Hypothese abgelehnt werden kann sprich zu 00 wird sich der Anwender taumluschen wenn er von einem Zusammenhang ungleich Null zwischen den Variablen ausgeht Anders ausgedruckt Mit einer Wahrscheinlichshykeit von 100 wird sich die Korrelation von Null unterscheiden
Abbildung 511 Signifikanzniveaus der Korrelationskoeffizienten im 6-ProdukteshyBeispiel
KOrrelatlonmatrix
UNGEFETT KALORIEN VITAMIN HALTBARKISignIfikanz (l-seitlg) UNGEFETT PREIS05632 00111 411lSZ 46713KAlORIEN 05632 05924 39737 45018VITAMIN 00111 05924 44144 49229HALTBARK 41862 39737 44144 00021PREIS 46713 45018 48229 00021
Fuumlr unser Beispiel zeigt Abbildung 511 daszlig sich genau diejenigen Korrelationsshykoeffizienten signifikant von Null unterscheiden (niedrige Werte in Abbildung 511) die in Abbildung 510 hbhe Werte (gt 07) aufweisen waumlhrend die Korrelashy
f
274 Faktorenanalyse
tionskoeffizienten mit geringen Werten auch ein hohes Signifikanzniveau (Wertegt 04) besitzen Das bedeutet daszlig sich ZB die Korrelation zwischen den Variablen Vitamingehalt und Haltbarkeit nur mit einer Wahrscheinlichkeit von (1- 044 =) 56 von Null unterscheidet
Inverse der Korrelationsmatrix
Die Eignung einer Korrelationsmatrix fuumlr die Faktorenanalyse laumlszligt sich weiterhin an der Struktur der Inversen der Korrelationsmatrix erkennen Dabei wird davon ausgegangen daszlig eine Eignung dann gegeben ist wenn die Inverse eine Diagoshynamatrix darstellt d h die Nicht-diagonal-Elemente der inversen Korrelatishyonsmatrix moumlglichst nahe bei Null liegen Fuumlr das 6-Produkte-Beispiel zeigt Abbildung 512 daszlig insbesondere fuumlr die Werte der Variablen Ungesaumlttigte Fettshysaumluren und Vitamingehalt sowie Haltbarkeit und Preis hohe Werte auftreshyten waumlhrend alle anderen Werte relativ nahe bei Null liegen Es existiert allerdings kein allgemeinguumlltiges Kriterium dafuumlr wie stark und wie haumlufig die Nicht-diashygonal-Elemente von Null abweichen duumlrfen
Abbildung 512 Inverse der Korrelationsmatrix im 6-Produkte-Beispie1
Inverse KorrelationsmatrIx
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS UNIiIIt
KALORIEN VITAMIN
HALTBARK
PREIS
1449910 -60678
-1319772 -558018 520353
-60678 217944 -82863
-218066 204555
-1319772 -82863
1400000 479257
-440959
-558018 -218066 479257
3817871 -3126624
520353 204555
-440959 -3726624 3738542
Bartlett-Test (test of spherlcity)
Der Bartlett-Test uumlberpruumlft die Hypothese ob die Stichprobe aus einer Grundgeshysamtheit entstammt in der die Variablen unkorreliert sinds
Gleichbedeutend mit dieser Aussage ist die Frage ob die Korrelationsmatrix nur zuflillig von einer Einheitsmatrix abweicht da im Falle der Einheitsmatrix alle Nicht-diagonal-Elemente Null sind d h keine Korrelationen zwischen den Varishyablen vorliegen Es werden folgende Hypothesen formuliert
HO Die Variablen in der Erhebungsgesamtheit sind unkorreliert
H1 Die Variablen in der Erhebungsgesamtheit sind korreliert
Der Bartlett-Test setzt voraus daszlig die Variablen in der Erhebungsgesamtheit einer Normaverteiung folgen und die entsprechende Pruumlf groumlszlige annaumlhernd ChishyQuadrat-verteilt ist Letzteres aber bedeutet daszlig der Wert der Pruumlfgroumlszlige in hohem
5 Vgl Dziuban C DlShirkey E C 1974 S 358 ff bull
Vorgehensweise 275
Maszlige durch die Groumlszlige der Stichprobe beeinfluszligt wird Fuumlr unser Beispiel erbrachshyte der Bartlett-Test eine Pruumlfgroumlszlige von 17371 bei einem Signifikanzniveau von 00665 Das bedeutet daszlig mit einer Wahrscheinlichkeit von (1- 00655=)9345
davon auszugehen ist daszlig die Variablen der Erhebungsgesamtheit korreliert sind Setzt man als kritische Irrtumswahrscheinlichkeit einen Wert von 005 fest so waumlshyre fuumlr unser Beispiel die Nullhypothese anzunehmen und folglich die Korrelatishyonsmatrix nur zufaumlllig von der Einheitsmatrix verschieden Das laumlszligt dann den Schluszlig zu daszlig die Ausgangsvariablen in unserem Fall unkorreliert sind
Allerdings sei an dieser Stelle nochmals darauf hingewiesen daszlig die Anwenshydung des Bartlett-Tests eine Pruumlfung der Ausgangsdaten auf Normalverteilung voraussetzt die in unserem Fall noch erfolgen muumlszligte
Anti-Image-Kovarianz-Matrix
Der Begriff Anti-Image stammt aus der Image-Analyse von Guttmann6 Guttrnann geht davon aus daszlig sich die Varianz einer Variablen in zwei Teile zerlegen laumlszligt das Image und das Anti-Image
Das Image beschreibt dabei den Anteil der Varianz der durch die verbleibenden Variablen mit Hilfe einer multiplen Regressionsanalyse (vgl Kapitel 1) erklaumlrt werden kann waumlhrend das Anti-Image denjenigen Teil darstellt der von den uumlbrishygen Variablen unabhaumlngig istlDa die Faktorenanalyse unterstellt daszlig den Variabshylen gemeinsame Faktoren zugrunde liegen ist es unmittelbar einsichtig daszlig Varishyablen nur dann fuumlr eine Faktorenanalyse geeriiet sind wenn das Anti-Image der Variablen moumlglichst gering ausflilltDas ab bedJJltet daszlig die Nicht-diagonalshyElemente der Anti-Image-Kovarianz-Matrix m glichst nahe bei Null liegen muumlsshysen bzw diese Matrix eine Diagonamatrix darstellen sollte Fuumlr das 6-ProdukteshyBeispiel zeigt Abbildung 513 daszlig die Forderung nach einer Diagonalmatrix ershyfiiHt ist
Abbildung 513 Anti-Image-Kovarianz-Matrix im 6-Produkte-Beispiel
AnIlJmIU_atrIzen
UNGEFETT KALORIEN VITAMIN HALTBARKi Arililinage-lltovananz PREISUNuumll1 06897 -01920 -06502 -01008 00960KAlORIEN -01920 45883 -02716 -02621 02511VITAMIN -06502 02716 07143 00897 -00842HALTBARK -01008 02621 00697 02619 -02611PREIS 00960 02511 -00842 middot02611 02675
Als Kriterium dafilr wann die Forderung nach einer Diagonalmatrix erfuumlllt ist schlagen Dziuban und Shirkey vor die Korrelationsmatrix dann als fuumlr die Fakshytorenanalyse ungeeignet anzusehen wenn der Anteil der Nicht-diagonal-Elemente die ungleich Null sind (gt 009) in der Anti-Image-Kovarianzmatrix (AIC) 25
Vgl Guttmann L 1953 S 277 ff
LIO r aKlOrenanalyse
oder mehr betraumlgt7 Das trifft in unserem Fall filr keines der Nicht-diagonalshyElemente der Ale-Matrix zu womit nach diesem Kriterium die Korrelationsmatrix filr faktoranalytische Auswertungen geeignet ist
Kaiser-Meyer-Olkin-Kriterium
Waumlhrend die Uumlberlegungen von Dziuban und Shirkey auf Plausibilitaumlt beruhen haben Kaiser Meyer und Olkin versucht eine geeignete Pruumlfgroumlszlige zu entwickeln und diese zur Entscheidungsfindung heranzuziehen Sie berechnen ihre PTUumlfgroumlszlige die als measure 0sampling adequacy (MSA) bezeichnet wird auf Basis der Anshyti-Image-KorrelationsmatrixbullDas MSA-Kriterium zeigt an in welchem Umfang die Ausgangsvariablen zusammengehoumlren und dient somit als Indikator dafilr ob eine Faktorenanalyse sinnvoll erscheint oder nichtDas MSA-Kriterium erlaubt sowohl eine Beurteilung der Korrelationsmatrix insgesamt als auch einzelner Varishyablen sein Wertebereich liegt zwischen degund 1 Kaiser und Rice schlagen folgenshy
8de Beurteilungen vor
MSA 2 09 marvelous (erstaunlich) MSA 2 08 meritorious (verdienstvoll) MSA 2 07 middling (ziemlich gut) MSA 2 06 mediocre (mittelmaumlszligig) MSA 2 05 miserable (klaumlglich) MSA lt05 unacceptable (untragbar)
Sie vertreten die Meinung daszlig sich eine Korrelationsmatrix mit MSA lt 05 nicht rur eine Faktorenanalyse eignet9 Als wuumlnschenswert sehen sie einen Wert von MSA 2 08 an lO In der Literatur wird das MSA-Kriterium das auch als KaisershyMeyer-Olkin-Kriterium (KMK) bezeichnet wird als das beste zur Verrugung steshyhende Verfahren zur Pruumlfung der Korrelationsmatrix angesehen weshalb seine Anwendunrvor der Durchfuhrung einer Faktorenanalyse auf jeden Fall zu empshyfehlen ist 1
Bezogen auf unser 6-Produkte-Beispiel ergab sich rur die Korrelationsmatrix insgesamt ein MSA-Wert von 0576 womit sich rur unser Beispiel ein riur klaumlglishyches Ergebnis ergibt Daruumlber hinaus gibt SPSS in der Diagonalen der AntishyImage-Korrelationsmatrix aber auch das MSA-Kriterium rur die einzelnen Variabshylen an
7 Vgl Dziuban C DlShirkey E C 1974 S 359
8 Vgl Kaiser H FRice J 1974 S 111 ff
9 Vgl Cureton E EDAgostino R B 1983 S 389 f
10 Vgl Kaiser H F 1970 S 405
II Vgl Stewart D W 1981 S 57 f Dziuban C DlShirkey E C 1974 S 360 f
Vorgehensweise 277
Abbildung 514 Anti-Image-Korrelations-Matrix im 6-Produkte-Beispiel
Antllmlge-Matrlun
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS AntI-lmageMrrelilllOn UNGEFETT 59680middot 10794 -92633 -23717 22350
KALORIEN -10794 87789 -15001 -23906 22661 VITAMIN -92633 -15001 59755 20730 -19274 HALTSARK -23717 -23906 20730 47060 -98640 PREIS 22350 22561 -19274 -95640 45701
8 Maszlig der StlchplObenelgnung
Abbildung 514 macht deutlich daszlig lediglich die Variable Kaloriengehalt mit einem MSA-Wert von 087789 als verdienstvoll anzusehen ist waumlhrend alle uumlbshyrigen Variablen eher klaumlgliche oder untragbare Ergebnisse aufweisen Die vashyriablenspezifischen MSA-Werte liefern damit rur den Anwender einen Anshyhaltspunkt dafuumlr welche Variablen aus der Analyse auszuschlieszligen waumlren wobei sich ein sukzessiver Ausschluszlig von Variablen mit jeweiliger Pruumlfung der vorgeshystellten Kriterien empfiehlt
522 Extraktion der Faktoren
(4) Zahl der Faktoren
(5) Faktorinterp~etat~ (6) Bestimmung der
Faktorwerte
Die bisherigen Ausruhrungen haben verdeutlicht daszlig bei Faktorenanalysen groszlige Sorgfalt auf die Wahl der Untersuchungsmerkmale und -einheiten zu verwenden ist da durch die Guumlte der Korrelationsmatrix die den Startpunkt der Faktorenanalyse darstellt alle Ershygebnisse der Faktorenanalyse beeinfluszligt werden Im folgenden ist nun zu fragen wie denn nun die Faktoren rein rechnerisch aus den Variablen ermittelt werden koumlnnen Wir werden im folgenden zunaumlchst das Funshydamentaltheorem der Faktorenanalyse darstellen und anschlieszligend die Extraktion auf graphischem Wege plausibel machen Auf die Unterschiede zwischen konkreten (rechnerischen) Faktorextraktionsverfahren gehen wir dann im Zusammenhang mit der Bestimshymung der Kommunalitaumlten (Abs~hnitt 523) ein
278 Faktorenanalyse
5221 Das FundamentaItheorem
Waumlhrend die bisherigen Uumlberlegungen die Ausgangsdaten und ihre Eignung fuumlr faktoranalytische Zwecke betrafen stellt sich nun die Frage wie sich die Faktoren rechnerisch aus den Variablen ennitteln lassen Zu diesem Zweck geht die Faktoshyrenanalyse von folgender grundlegenden Annahme aus
Jeder Beobachtungswert einer Ausgangsvariablen Xj oder der stanshydardisierten Variablen Zj laumlszligt sich als eine Linearkombination mehshyrerer (hypothetischer) Faktoren beschreiben
Mathematisch laumlszligt sich dieser Zusammenhang wie folgt fonnulieren
(3a)Xkj =ajl Pkl +ap PIa + +ajQ PkQ
bzw fuumlr standardisierte x-Werte
(3b)Zkj=ajIPkl+a j2middotPIa+middot+a jQmiddotPkQ=iajqPkq
q~l
Die obige Fonnel (3b) besagt fuumlr das 2-Faktorenbeispiel nichts anderes als daszlig zB die standardisierten Beobachtungswerte fuumlr Anteil ungesaumlttigter Fettsaumluren und Vitamingehalt beschrieben werden durch die Faktoren P 1 und P2 so wie sie im Hinblick auf Marke k gesehen wurden ltPIel bzw Pk2) jeweils multipliziert mit ihren Gewichten bzw Faktorenladungen beim Merkmal j also fuumlr Faktor 1 ajl und
fuumlr Faktor 2 a2 Oie Faktorradung gibt dabei an wieviel ein Faktor mit einer Ausgangsvariablen
zu tun hat Im mathematisch-statistischen Sinne sind Faktorladungen nichts andeshyres als eine Maszliggroumlszlige fuumlr den Zusammenhang zwischen Variablen und Faktor und das ist wiederum nichts anderes als ein Korrelationskoeffizient zwischen Fakshytor und Variablen
Um die Notation zu verkuumlrzen schreibt man haumlufig den Ausdruck (3b) auch in Matrixschreibweise Identisch mit Fonnel (3b) ist daher auch folgende Mashytrixschreibweise die die Grundgleichung der Faktorenanalyse darstellt
(3c)Z=pmiddotA
Aufbauend auf diesem Grundzusammenhang laumlszligt sich dann auch eine Rechenshyvorschrift ableiten die aufzeigt wie aus den erhobenen Daten die vennuteten Fakshytoren mathematisch ennittelt werden koumlnnen
Wir hatten gezeigt daszlig die Korrelationsmatrix R sich bei standardisierten Daten wie folgt aus der Datenmatrix Z ennitteln laumlszligt
R=_I_ZZ (2) K-l
Vorgehensweise 279
Da Z aber im Rahmen der Faktorenanalyse durch P A beschrieben wird (Z =PA) ist in (2) Z durch Fonnel (3c) zu ersetzen so daszlig sich folgende Fonnet
ergibt
R=_I_PA)PA) (4)K I
Nach Aufloumlsung der Klammem ergibt sich nach den Regeln der Matrixmultiplishykation
r------- R=_I_APPA=A-I_pPA (5)
K-I ~
~
Da alle Daten standardisiert sind laumlszligt sich der _1_ ptP Ausdruck in Formel (5)K-l ----y---J
auch als K(Jrrelationsmatrix der Faktoren (C) bezeichnen (vgl Fonnel (2raquo so daszlig sich schreiben laumlszligt
R = AmiddotCmiddotA (6)
Da die Faktoren als unkorreliert angenommen werden entspricht C einer Einheitsshymatrix (einer Matrix die auf der Hauptdiagonalen nur Einsen und sonst Nullen enthaumllt) Da die Multiplikation einer Matrix mit einer Einheitsmatrix aber wieder die Ausgangsmatrix ergibt vereinfacht sich die Fonnel (6) zu
R = AmiddotA (7)
Die Beziehungen (6) und (7) werden von Thurstone als das Fundamentaltheorem der Faktorenanalyse bezeichnet da sie den Zusammenhang zwischen Korrelatishyonsmatrix und Faktorladungsmatrix beschreiben
Das Fundarnentaltheorem der Faktorenanalyse besagt nicht anderes als daszlig sich die Korrelationsmatrix durch die Faktorladungen (Matrix A) und die Korrelationen zwischen den Faktoren (Matrix C) reproduzieren laumlszligt Fuumlr den Fall daszlig man von unabhaumlngigen (orthogonalen) Faktoren ausgeht reduziert sich das Funshydamentaltheorem auf Fonnel (7) Dabei muszlig sich der Anwender allerdings bewuszligt sein daszlig das Fundamentaltheorem der Faktorenanalyse nach Fonnel (7) stets nur unter der Praumlmisse einer Linearverknuumlpfung und Unabhaumlngigkeit der Faktoren Guumlltigkeit besitzt
5222 Graphische Interpretation von Faktoren
Der Infonnationsgehalt einer Korrelationsmatrix laumlszligt sich auch graphisch in einem Vektor-Diagramm darstellen in dem die jeweiligen Korrelationskoeffizienten als Winkel zwischen zwei Vektoren dargestellt werden Zwei Vektoren werden dann
280 Faktorenanalyse
als linear unabhaumlngig bezeichnet wenn sie senkrecht (orthogonal) aufeinander steshyhen Sind die beiden betrachteten Vektoren (Variablen) jedoch korreliert ist der Korrelationskoeffizient also C 0 zB 05 dann wird dies graphisch durch einen Winkel von 60deg zwischen den beiden Vektoren dargestellt
Es stellt sich die Frage Warum entspricht ein Korrelationskoeffizient von 05 genau einem Winkel von 60deg Die Verbindung wird uumlber den Cosinus des jeshy
weiligen Winkels hergestellt Verdeutlichen wir uns dies anhand des Ausgangsbeispiels (Abbildung 515)
In Abbildung 515 repraumlsentieren die Vektoren AC und AB zB die beiden Vashyriablen Kaloriengehalt und Vitamingehalt Zwischen den beid~_yariablen moumlge eine Korrelation von 05 gemessen worden sein Der Vektor AC der den Kaloriengehalt repraumlsentiert und der genau wie AB aufgrund der Standardisierung eine Laumlnge von 1 hat weist zu AB einen Winkel von 60deg auf Der Cosinus des Winkels 60deg der die Stellung der beiden Variablen zueinander (ihre Richtung) anmiddot gibt ist definiert als Quotient aus Ankathete und Hypothenuse also als AD AC Da AC aber gleich 1 ist ist der Korrelationskoeffizient identisch mit der Strecke
AD Wie Abbildung 516 ausschnitthaft zeigt ist zB der Cosinus eines 60deg-Winkels
gleich 05 Entsprechend laumlszligt sich jeder beliebige Korrelationskoeffizient zwischen zwei Variablen auch durch zwei Vektoren mit einem genau definierten Winkel zushyeinander darstellen Verdeutlichen wir uns dies noch einmal anband einer Korrelamiddot tionsmatrix mit drei Variablen (Abbildung 517)
Abbildung 515 Vektordarstellung einer Korrelation zwischen zwei Variablen
c
A 0 B
)V
Standardisierte LOnge von 1
Vorgehensweise 281
Abbildung 516 Werte rur den Cosinus (entnommen aus Geliert W JKuumlstnerHlHellwich MfKaumlstner H Kleine Enzyshyklopaumldie Mathematik Leipzig 1969 S 799)
Grad CO Grad cO
45 07071 90 00000 44 7193 89 0175 43 7314 88 0349 42 7431 87 0523 41 7547 86 0698 40 07660 85 0872 39 7771 84 1045 38 7880 83 1219 37 7986 82 1392 36 8090 81 1564 35 8192 80 01736 34 8290 79 1908 33 8387 78 2079 32 8480 77 2250 31 8572 76 2419 30 08660 75 2588 29 8746 74 2756 28 8829 73 2924 27 8910 72 3090 26 8988 71 3256 25 9063 70 03420 24 9135 69 3584 23 9205 68 3746 22 9272 67 3907 21 9336 middot66 4067 ZO 09397 65 4226 19 9455 64 4384 18 9511 63 4540 17 9563 62 4695 16 9613 61 4848 15 9659 60 05000 14 9703 59 5150 13 9744 58 5299 12 9781 57 5446 11 9816 56 5592 10 09848 55 5736 9 9877 54 5878 8 9903 53 6018 7 9925 52 6157 6 9945 51 6293 5 9962 50 06428 4 9976 49 6561 3 9986 48 6691 2 9994 47 6820 1 9998 46 6947 0 10000 45 7071
282 Faktorenanalyse
Abbildung 517 Korrelationsmatrix
R =r68660 1 06428lO1736 ~
R laumlszligt sich auch anders schreiben (vgl Abbildung 518)
Abbildung 518 Korrelationsmatrix mit Winkelausdrucken
l0deg R = 30deg 0deg
80deg 50deg 0deg
Der Leser moumlge die entsprechenden Werte selbst in einer Cosinus-Tabelle uumlbershy
pruumlfenDie der oben gezeigten Korrelationsmatrix zugrundeliegenden drei Variablen
und ihre Beziehungen zueinander lassen sich relativ leicht in einem zweidimen sionalen Raum darstellen (Abbildung 519)
Abbildung 519 Graphische Darstellung des 3-Variablen-Beispiels
Vektor X2
Vektorx3Vektor Xl
Vorgehensweise 283
Je mehr Variable jedoch zu beruumlcksichtigen sind desto mehr Dimensionen werden benoumltigt um die Vektoren in ihren entsprechenden Winkeln zueinander zu positioshy
nieren Die Faktorenanalyse trachtet nun danach das sich uumlber die Korrelationsshykoeffizienten gemessene Verhaumlltnis der Variablen zueinander in einem moumlglichst gering dimensionierten Raum zu reproduzieren Die Zahl der benoumltigten Achsen gibt dann die entsprechende Zahl der Faktoren an
Wenn man die Achsen als Faktoren ansieht dann stellt sich unmittelbar die Frashyge Wie werden diese Achsen (Faktoren) in ihrer Lage zu den jeweiligen Vektoren (Variablen) bestimmt
Dazu vergegenwaumlrtigt man sich am besten das Bild eines halboffenen Schirmes Die Zacken des Schirmgestaumlnges die alle in eine bestimmte Richtung weisend die Variablen repraumlsentieren lassen sich naumlherungsweise auch durch den Schirmstock darstellen Vereinfacht man diese Uumlberlegung aus DarstellungsgrQnden noch weishyter auf den 2-Variablen-Fall wie in AbbiIdu8520 die einen Korrelationskoshyeffizienten von 05 fuumlr die durch die Vektoren OA und OB dargestellten Variablen repraumlsentiert dann gibt der Vektor OC eine zusammenfassende (faktorielle) Beshyschreibung wieder Die beiden Winkel von 30deg zwischen Vektor I bzw Vektor II und Faktor-Vektor geben wiederum an inwieweit der gefundene Faktor mit Vekshytor (Variable) I bzw II zusammenhaumlngt Sie repraumlsentieren ebenfalls Korrelationsshykoeffizienten und zwar die zwischen den jeweiligen Variablen und dem Faktor Diese Korrelationskoeffizienten hatten wir oben als Faktorladungen bezeichnet Die Faktorladungen des 1 Faktors betragen also in bezug auf Variable I und Varishyable II cos 30deg = 08660
Abbildung 520 FaktorlOsung bei 2 Variablen
j
A
Vektor x
~---------__------~---- C
Resultante
e Vektor X
284 Faktorenanalyse
5223 Das Problem der Faktorextraktion
Nachdem wir nun wissen was eine Faktorladung inhaltlich bedeutet ist zu fragen Wie findet man einen solchen Vektor (Faktor) der stellvertretend ftir mehrere zushysammenhaumlngende Variable fungieren kann Erinnern wir uns noch einmal des Ausgangsbeispiels Aufstrichfette waren nach den ftinfMerkmalen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt - Haltbarkeit - Preis bewertet worden l2
Aus dieser Bewertung sei die Korrelationsmatrix in Abbildung 521 berechnet worden
Abbildung 521 Spiegelbildlich identische KOlTelationsmatrix
x X x x x
x 70 100 09848 90middotX 03420 30x 00000 10middotx
X -01736
Diese Korrelationsmatrix enthaumllt in der unteren Dreiecks-Matrix die Korrelationsshywerte in der oberen (spiegelbildlich identischen) Dreiecks-Matrix die entshysprechenden Winkel Graphisch ist der Inhalt dieser Matrix in Abbildung 522 darshygestellt
Das Beispiel wurde so gewaumlhlt daszlig die Winkel zwischen den Faktoren in einer zweidimensionalen Darstellung abgebildet werden koumlnnen - ein Fall der in der Realitaumlt allerdings kaum relevant ist
Wie findet man nun den 1 Faktor in dieser Vektordarstellung Bleiben wir zunaumlchst bei der graphischen Darstellung dann sucht man den
Schwerpunkt aus den ftinf Vektoren Der Leser moumlge sich dazu folgendes verdeutlichen
In Abbildung 522 ist der Faktor nichts anderes als die Resultante der funfVektoshyren Wuumlrden die ftinfVektoren funf Seile darstellen mit einem Gewicht in 0 und jeweils ein Mann wuumlrde mit gleicher Staumlrke an den Enden der Seile ziehen dann wuumlrde sich das Gewicht in eine bestimmte Richtung bewegen (vgl die gestrichelte
12 Es werden hier andere Werte als im Ausgangsbeispiel verwendet um zunaumlchst eine einshydeutige graphische Loumlsung zu ermoumlglichen
Vorgehensweise 285
Linie in Abbildung 523) Diesen Vektor bezeichnen wir als Resultante Er ist die graphische Repraumlsentation des 1 Faktors
Abbildung 522 Graphische Darstellung des 5-Variablen-Beispiels
~
XsXl
bull
Abbildung 523 Graphische Darstellung des Schwerpunktes
X2
XIX
Faktorshyvektor2
Betrachtet man nun die jetzt gebildeten Winkel zwischen dem 1 Faktor und den Ausgangsvektoren dann hat man auch die gesuchten Faktorladungen gefunden
(Erste Reshysultante)
4512
-------o
- -
286 Faktorenanalyse
Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen
Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben
Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge
die Werte selbst uumlberpruumlfen)
Abbildung 524 Einfaktorielle Ladungsmatrix
Faktor
05707Xl 07046x2 bull 09668x3
08211x4
07096
Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)
Abbildung 525 ZweifaktorieHe Ladungsmatrix
Faktor 1 Faktor 2
Xl 05707 -08211
x2 07046 -07096
x3 09668 02554
x4 08211 05707
Xs 07096 07046
Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa
Vorgehensweise 287
In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum
I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1
~~ 00
2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation
Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist
Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt
Sf = 1 = Ijj (9)J
3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt
Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)
Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung
Resutlanie 2 (Faktor 2)
A Vektor x o
120lt= fH bull C Resultante 1 (Faktor 1)
B Vektor x
288 Faktorenanalyse
Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB
Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel
Wenn obige Behauptung stimmt muumlszligte gelten
(lOa)[~J +[~~J =1
Uumlberpruumlfung 2 2 uumlc2
OC 00 +002 (lOb)--+-shy 2
OA OA OA2 2
In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)
Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)
(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)
2 2 OC +00
4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten
sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)
wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-
q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1
(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix
(2) Extraktion der
(5) Faktorinterpretatiln
(6) Bestimmung der Faktorwerte
Vorgehensweise 289
523 Bestimmung der Kommunalitaumlten
In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem
Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy
fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig
mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da
J
i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins
Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung
erklaumlrte Variant
standardisierte Gesamtvariant = 1
290 Faktorenanalyse
Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung
2 a j1 =07
2 2 8 j2 = 01 siRest= 02
Kommunalitat H =08 (erllt1arte Varianz)
Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)
R AmiddotA+U (7a)
Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet
Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion
Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer
Vorgehensweise 291
100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY
In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy
weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen
Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen
1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen
2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit
2 2I ~ ~ R j ~ mx rjk
Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse
- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy
13 Vgl Loehlin J C 1998 S 154 14
Vgl Uberla K 1972 S 155 ff
292 Faktorenanalyse
nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird
- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit
Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy
15formationsverlust deklariert wird
Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen
Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy
15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt
Vorgehensweise 293
tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder
Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren
Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen
Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren
Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist
Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf
Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden
Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel
Kommunalltlten
Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325
Extraktionsmelhode Hauptachsen-Faktorenanalyse
bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix
294 Faktorenanalyse
Abbildung 530 Faktorladungen im 6-Produkte-Beispiel
Faktoranmatrixmiddot
Faktor
1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608
Extraktionsmethode Hauptachsen-Faktorenanalyse
a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt
Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert
Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel
Reproduzierte Korrelationen
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT
KALORIEN
VITAMIN
HALTBARK
PREIS
96845 71193 96034 11035 04241
71193 52552b
70480
12709
07717
96034 70480 95292b
08461 01722
11035
12709 08461 99056b
8325
04241 07717 01722 98325 98070b
Residuun1 UNGEFETi
KALORIEN
VITAMIN
HALTBARK
PREIS
-00017 00101
-00141 00144
-00017
-00083 01001
- 01005
00101 -00083
-00036 00640
-00141 01061
-00636
00010
00144 -01005 00640 00010
ExtrakHonsmethode Hauptllchsenfaktorenanalyse
a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005
b Reproduzierte Kommunalltaumlten
Vorgehensweise 295
Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen
Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R
524 Zahl der Faktoren
(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix
(2) Extraktion der Faktoren
(6) Bestimmung der Faktorwerte
Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff
Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-
q N
trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N
Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden
Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy
296 Faktorenanalyse
Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre
Abbildung 532 Bestimmung der Eigenwerte
Faktorenmatrix
Faktor
1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)
Eigenwerte 25068 19112
Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil
Kom munalltaumlten
Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807
- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren
V orgehensweise 297
Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung
Abbildung 534 Scree-Test im 6-Produkte-Beispiel
Eigen- Screeplot wert 30
25
20
15
Kaiser-Kriterium
10 1 Elbow5
00 2 3 4 5
Faktomummer
298 Faktorenanalyse
525 Faktorinterpretation
Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)
Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt
(1) Variablenauswalll und Errechnung der Korrelationsmalrix
(2) Extraktion der Faktoran
(3) Bestimmung der Kommunalltaumllen
(6) Bestimmung derFaktorwerte _______---11
middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull
geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht
Abbildung 535 Faktorladungen im 6-Produkte-Beispiel
Preis Haltbarkeit
Extraktionsmethode Hauptachsen-Faktorenanalyse
Vorgehensweise 299
Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist
Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig
Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16
Abbildung 536 Unrotierte Faktorladungen
F
F
Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung
Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f
300 Faktorenanalyse
536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy
tert
Abbildung 537 Rotierte Faktorladungen
F (Ausgangssituation)2
11 F2 (rotiert)
F1
-- shy
(Ausgangssituation)
11
F1 (rotiert)
SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen
1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen
(rechtwinkligen) Rotation
2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren
Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die
vorgenenswelse j U 1
Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind
Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel
Faktor
1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt
Haltbarkeit
72152 bull 07020
07962 I 99208 Preis 01060 99025
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung
Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen
A bull =A T mit TC~SI7 - sina ] sma cosa
Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links
A T A 094331 - 028039 098357 003229
[C0s341570 - sin34 157 ]070669 016156 072152 007020
sin34157deg cos34157092825 - 030210 097615 000694
038926 091599 007962 099208
032320 093608 001060 099025
Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)
Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix
Faktor 1 2
1 94868 31622
2 -31622 94868
Il
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung
Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig
von a=1843deg
526 Bestimmung der Faktorwerte
(1) Variablenauswanl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitaumlten
Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte
Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt
(3c)Z=PmiddotA
Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY
(12)Z AT1p AAT
Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt
(13)ZArl=pE
Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten
(3c) wird von rechts mit A multipliziert
ZmiddotA=PmiddotAmiddotA (15)
Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar
ZAmiddot(A At1=P(A A) (A Atl (16)
Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt
P=ZA(AAt l (17)
In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren
In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term
AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte
Abbildung 540 Koeffizientenmatrix der Faktorwerte
Faktor 1 2
Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression
Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die
xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf
SjDa p E=P ist ergibt sich
Seite 271 zu (14)
P=ZAT
304 Faktorenanalyse
Abbildung 541 Standardisierte Ausgangsdatenmatrix Z
45ampt6R4LJL4
Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542
Abbildung 542 Faktorwerte im 6-Produkte-Beispiel
Vorgehensweise 305
Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel
Du darfst
VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG
E 11 BecelS
U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T
Sanella IIII Holl Butter
-1
bull Rama
-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18
WIRTSCHAFTLICHKEIT
Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen
527 Zusammenfassende Darstellung der Faktorenanalyse
Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy
e Vorgehensweise 307 306 Faktorenanalyse
Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen
sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-
schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy
tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig
wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy
nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy
chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy
analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte
Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht
Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der
Verwendung des Verfahrens offenzulegen
I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _
CQ)l2CQgtQ ~ i
-Q)C t l5~11
0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C
CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O
~ ~ 11 t 3
uj~fi
t Imiddot~ J1 ~SHaa
It c~
c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~
-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi
o~ ~ -gEG)
I ~l c c ~l~ampi
2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E
U~a ]i E
J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy
~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--
----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt
Fallbeispiel 309308 Faktorenanalyse
Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert
531 Problemstellung
In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften
Variable und Objekte des BeispielsAbbildung 545
EigenschaftenMarken M k (k=I Il) xj(j=I IO)
A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado
5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H
I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama
Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist
Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)
Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern
Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse
---
310Faktorenanalyse
532 Ergebnisse
1 Variablenauswahl und Errechnung der Korrelationsmatrix
Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung
548 wiedergegeben
Abbildung 548 Die Korrelationskoeffizienten -_ -
-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy
In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der
Fallbeispiel 311
Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet
Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie
-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -
06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170
-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260
62444 -97126 66229 -83532 -62589
-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545
-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno
Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)
Abbildung 550 Dialogfeld Deskriptive Statistik
312 Faktorenanalyse
2 Bestimmung der Kommunalitilten
Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt
wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend
bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich
von den Startwerten abweichen
Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten
Hauptkomponentenanalyse Hauptachsenanalyse
Variable Korrunuriali- Kommunali- Korrununali- Kommunali-
Ut (Startwerte)
tlt (Endwerte)
tlIl (Startwerte )
tlIl (End werte)
STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR
100000 100000 100000 100000 100000 100000 100000 100000 100000 100000
88619
76855
89167 85324 76043 84012 80223 92668 63297 88786
97414
89018
79497
85847
96501
98810
97132
99166
78019
96445
85325
55717
85754
91075
55819
82330
73903
94796
40402
87851
Fallbeispiel 313
Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy
I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren
Abbildung 552 Dialogfeld Extraktion
Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist
3 Wabl der Extraktionsmetbode
Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen
4 Zabl der Faktoren
Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen
Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet
Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch
17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f
1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden
Erklaumlrte Gesamtvarianz
Anfaumlngliche Eigenwerte
314 Faktorenanalyse
Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy
den sich fUnfFaktoren ergeben
Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien
95) der Varianz erklaumlrt sind
2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)
3 Extrahiere n (zB 3) Faktoren
4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy
renzahl
5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein
6 Extrahiere alle Faktoren die nach der
Vom Computer automatisch verwandt wenn keine andere Spezifikation
Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden
Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden
Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist
Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt
Fallbeispiel 315
Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil
Faktor 1
2 3
4
5
6
7
8
9
10
Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden
Abbildung 555 Scree-Test und Kaiser-Kriterium
Eigen- -=gtcreeplot wert
5
4
3
2
10
o Kaisershy
~ 3 i i 7 i Q
Faktornummer
Gesamt 505188
177106
142700
81935
42961
24709
15928
06190
02943
00340
der Varianz 5051883
1771061
1427002
819349 429611
247085
159275
61902
29434
03398
Kumulierte 5051883
6822944
8249946
9069295
9498905
9745991
9905266
9967168
9996602
10000000
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
262 Faktorenanalyse
Die nachfolgende Abbildung 52 zeigt einen Ausschnitt aus dem entsprechenden Fragebogen
Abbildung 52 Fragebogenausschnitt
Beurteilen Sie bitte die Margarinemarke Rama an hand folgender Eigenschaften
niedrig hoch
Anteil ung Fettsaumluren
Kaloriengehalt
Vitamingehalt
Haltbarkeit
Preis 1 2
I 3
I 4
I 5
I 6
I 7
Die Beantwortung des obigen Fragebogenausschnitts durch die 30 befragten Proshybanden liefert subjektive Eigenschaftsurteile der fuumlnf Variablenftlr die Margashyrinemarke Rama so da~ eine (30 x 5)-Matrix entsteht Diese Matrix kann der weishyteren Analyse zugrunde gelegt werden Wir haben dann 5 Eigenschaften und 30 Faumllle wobei wir ft1r unsere Analyse unterstellen daszlig die Befragtenurteile unshyabhaumlngig voneinander sind
Will man jedoch die sechs Marken gleichzeitig analysieren so werden haumlufig ftlr jede Eigenschaft pro Marke Durchschnittswerte uumlber alle 30 Befragten gebildet Wir erhalten dann eine (6 x 5)-Matrix wobei die Marken als Faumllle interpretiert werden Bei einer ~olchen Durchschnittsbildung muszlig man sich allerdings bewuszligt sein daszlig man bestimmte Informationen (naumlmlich die uumlber die Streuung der Ausshypraumlgung zwischen den Personen) verliert
Je groumlszliger die Streuung der Stichprobenwerte ist um so problematischer ist der Aussagewert bei einer solchen Vorgehensweise Da in praktischen Faumlllen haumlufig dennoch so vorgegangen wird beziehen sich auch die nachfolgenden Ausfuumlhshyrungen auf die der (6 x 5)-Matrix zugrundeliegenden Durchschnittswerte uumlber alle Personen Im abschlieszligenden Kapitel wird ein Loumlsungsvorschlag rur eine Alshyternative zur Durchschnittsbildung vorgestellt
Problemstellung 263
Wir jassen zusammen Unsere Befragung liefert uns folgende Daten
Abbildung 53 Ausgangsdaten im Beispiel
VARIABLEN (Anteil unges Fettsaumluren V bull bull V
0 bull VPerson 1
OBJEKT Pelllon 2 (8_1
bull bull bull Vusw) f------ -c-
Person 3 O
L V bull v I 0
LJ~ -~
Es sei unterstellt daszlig die ausgewaumlhlten Eigenschaften fiir die Beurteilung von Emulsionsfetten auch als relevant angesehen werden koumlnnen Fuumlr die folgenden Betrachtungen verdichten wir nun die Werte aus Abbildung 53 durch Bildung der arithmetischen Mittel rur jede ObjektlVariablen-Kombination uumlber alle 30 Befragshyten Als Durchschnittswert der 30 befragten Probanden moumlgen sich bei dieser Beshyfragung uumlber alle Hausfrauen folgende Werte ergeben haben (Abbildung 54)
Miszligt man den Informationsgehalt einer Datenstruktur an der in ihr enthaltenen Streuung (Varianz) der Befragungswerte so verliert man durch die Durchshyschnittsbildung einen Teil der urspruumlnglichen Informationen (Streuungen) und der Informationsgehalt der Mittelwertmatrix in Abbildung 54 enthaumllt jetzt nur noch die Streuung der durchschnittlichen Beurteilungen uumlber die verschiedenen EmushyISionsjette
Ein erster Blick auf die Ausgangsdatenmatrix macht bereits deutlich daszlig die Eishygenschaften (Variablen) XI bis x3 bei den Margarinemarken (Sanella Becel und Du darfst Ausnahme Rama) tendenziell houmlher bewertet wurden als bei den Buttershysorten (Hollaumlndische Butter und Weihnachtsbutter) waumlhrend die Eigenschaften x4 und Xs primaumlr bei den Buttersorten houmlher ausgepraumlgt sind Die Ausgangsdaten geshyben damit in diesem Beispiel bereits einen Hinweis darauf daszlig zwei Gruppen (xl x2 x3 und x4 xS) aumlhnlich beurteilter Variablen existieren die sich in der Beurteishylung untereinander aber unterscheiden Damit laumlszligt sich in diesem Beispiel bereits aus der Datenstruktur ein Beziehungszusammenhang vermuten Will man diese Vermutung genauer uumlberpruumlfen so ist es erforderlich auf ein statistisches Kriterishy
264 Faktorenanalyse
um zuruumlckzugreifen das die Quantifizierung von Beziehungen zwischen Variablen erlaubt Ein solches statistisches Kriterium stellt der Korrelationskoeffizient dar Durch die Berechnung von Korrelationen zwischen allen Variablen laumlszligt sich die Staumlrke der Beziehungszusammenhaumlnge zwischen allen Variablen berechnen
Abbildung 54 Mittelwertmatrix fuumlr das 6-Produkte-Beispiel
Eigenschaften
Marken Xl X2 x3 x4 Xs Rama I I 2 I 2 Sanella 2 6 334 Becel 4 5 445 Du darfst 5 6 623 Hollaumlndische Butter 2 3 3 5 7 Weihnachtsbutter 3 4 4 6 7
wobei x I = Anteil ungesaumlttigter Fettsaumluren x2 = Kaloriengehalt x3 = Vitamingehalt x4 = Haltbarkeit Xs = Preis
Dabei ist jedoch zu beachtlaquon daszlig Korrelationen grundsaumltzlich auf drei verschieshydene Arten kausal interpretiert werden koumlnnen Wir wollen dies an dem Beispiel der Variablen Fettsaumluren und Vitamingehalt verdeutlichen
1 Die Korrelation zwischen Fettsaumluren und Vitamingehalt resultiert daraus daszlig sich durch die Erhoumlhung des Anteils ungesaumlttigter Fettsaumluren auch der Vitamingehalt erhoumlht
2 Die Korrelation zwischen Fettsaumluren und Vitamingehalt resultiert daraus daszlig durch eine Erhoumlhung des Vitamingehalts auch der Anteil ungesaumlttigter Fettsaumluren gesteigert wird
3 Fuumlr die Korrelation zwischen Fettsaumluren und Vitamingehalt ist eine hinshyter diesen beiden Variablen stehende Groumlszlige kausal verantwortlich d h diese hypothetische Groumlszlige stellt die Ursache fuumlr das Zustandekommen der Korrelashytion dar
An dieser Stelle wird bereits deutlich daszlig aus inhaltlichen Uumlberlegungen heraus entschieden werden muszlig welche der obigen drei Interpretationsmoumlglichkeiten in einer bestimmten Anwendungssituation Guumlltigkeit besitzt Die Faktorenanalyse unterstellt daszlig immer die dritte Interpretationsvariante zutrifft Nur wenn dem aufshygrund sachlogischer Uumlberlegungen zugestimmt werden kann darf eine Faktoshyrenanalyse angewendet werden
Problemstellung 26S
Verzichtet man zunaumlchst auf die Berechnung von Korrelationen und unterstellt die Guumlltigkeit der o g dritten Interpretationsart so koumlnnen wir in obigem Beispiel von der plausiblen Vermutung ausgehen daszlig Xl bis x3 sowie x4 und x5 lediglich Beshyschreibungen von zwei eigentlich hinter diesen Variablen stehenden Groumlszligen (Faktoren) darstellen
Diese Vermutung laumlszligt sich graphisch wie in Abbildung 55 dargestellt vershydeutlichen
Abbildung 55 Grundgedanke der Faktorenanalyse im Beispiel
VARIABLEN FAKTOREN
x Anteil ungesaumltshy tigter Fettsaumluren I~---___-
x Kaloriengehalt rmiddot------=~31 F 1 GESUNDHEIT
~
x Vitamingehalt
I Hba ~___= F WIRTSCHAFTshy
LICHKEITI x bull Preis ~ _ _shy
Ausgehend von den flinf Eigenschaften die in der Befragung verwendet wurden wird aufgrund der sich in den Daten manifestierenden Beziehungen zwischen xl bis x3 bzw x4 und Xs vermutet daszlig eigentlich nur zwei unabhaumlngige Beschreishybungsdimensionen fuumlr die Aufstrichfette existieren (die die Variationen in den Vashyriablen bedingen) Xl bis x3 koumlnnten ZB Ausdruck eines Faktors sein den man etwa mit Gesundheit bezeichnen koumlnnte denn sowohl der Anteil ungesaumlttigter Fettsaumluren als auch Kaloriengehalt und Vitamingehalt haben etwas mit der Geshysundheit zu tun Ebenso koumlnnen die Variablen x4 und Xs (Haltbarkeit und Preis) Ausdruck fuumlr Wirtschaftlichkeitsuumlberlegungen sein Man koumlnnte also vermuten daszlig sich die Variablen Xl bis Xs in diesem konkreten Fall auf zwei komplexere Vashyriablenbuumlndel verdichten lassen Diese Variablenbuumlndel bezeichnen wir im folshygenden als Faktoren
266 Faktorenanalyse
Werden die im Ausgang betrachteten Eigenschaften zu Faktoren zusammengefaszligt so ist unmittelbar einsichtig daszlig gegenuumlber der Mittelwertmatrix in Abbildung 54 ein weiterer Informationsverlust entsteht da idR weniger Faktoren alsursprilngshyliehe Eigenschaften betrachtet werden Dieser Informationsverlust ist darin zu seshyhen daszlig zum einen die Faktoren in der Summe nur weniger Varianz erklaumlren koumlnshynen als die fuumlnf Ausgangsvariablen und zum anderen die Varianz einer jeden Ausshygangs groumlszlige in der Erhebungsgesamtheit ebenfalls durch die Faktoren idR nicht vollstaumlndig erklaumlrt werden kann Der Verlust an erklaumlrter Varianz wird im Rahmen der Faktorenanalyse zugunsten der Variablenverdichtung bewuszligt in Kauf genomshymen Allerdings muszlig sich der Anwender vorab uumlberlegen in welchem Ausmaszlig dieser Erklaumlrungsverlust (im Sinne eines Varianzverlustes) bei den einzelnen Ausshygangsvariablen toleriert bzw wieviel Varianz durch die Faktoren bei einer beshystimmten Variablen erklaumlrt werden soll Den Umfang an Varianzerklaumlrung den die Faktoren gemeinsam fllr eine Ausgangsvariable liefern wird als Komm~nalitaumlt beshyzeichnet Die Art und Weise mit der die Kommunalitaumlten bestimmt werden ist unmittelbar an die Methode der Faktorenermittlung (Faktorextraktionsmethode) gekoppelt Je nachdem welche Uumlberlegungen der Kommunalitaumltenbestimmung zugrunde liegen werden unterschiedliche Faktorenanalyseverfahren relevant
Ist eine Entscheidung uumlber die HOumlhe der Kommunalitaumlten der einzelnen Ausshygangsvariablen getroffen so muszlig weiterhin uumlber die Anzahl der zu extrahierenden Faktoren entschieden werden da das Ziel der Faktorenanalyse gerade darin zu seshyhen ist weniger Faktoren als urspruumlngliche Variable zu erhalten Hier steht der Anwender vor dem Zielkonflikt daszlig mit einer geringen Faktorenzahl tendenziell ein groszliger Informationsverlust (im Sfnne von nicht erklaumlrter Varianz) verbunden ist und umgekehrt In unserem Beispiel hatten wir uns aufgrund einer Plaushysibilitaumltsbetrachtung fllr zwei Faktoren entschieden
Ist schlieszliglich die Anzahl der Faktoren bestimmt so ist es von besonderem Inshyteresse die Beziehungen zwischen den Ausgangsvariablen und den Faktoren zu kennen Zu diesem Zweck werden Korrelationen berechnet die ein Maszlig tuumlr die Staumlrke und die Richtung der Zusammenhaumlnge zwischen Faktoren und urshyspruumlnglichen Variablen angeben Diese Korrelationen werden als Faktorladungen bezeichnet und in der sog Faktorladungsmatrix zusarnmengefaBt Abschlieszligend ist es dann von Interesse wie die befragten Personen die Marken Rama SaneUa Becel Du darfst Hollaumlndische Markenbutter und Weihnachtsbutter im Hinblick auf die beiden kuumlnstlichen Faktoren Gesundheit und Wirtschaftlichkeit beshyurteilen wuumlrden Gesucht ist also die entsprechende Matrix zu Abbildung 54 die die Einschaumltzung der Marken bezuumlglich der beiden Faktoren Gesundheit und Wirtschaftlichkeit enthaumllt Diese Einschaumltzungen werden als Faktorwerte beshyzeichnet Abbildung 56 zeigt die entsprechende Faktorwerte-Matrix fuumlr unser kleines Ausgangsbeispiel Die Darstellung enthaumllt standardisierte Werte wobei die Auspraumlgungen als Abweichungen vom Mittelwert dargestellt sind
Problemstellung 267
Abbildung 56 Faktorwerte-Matrix r-shy
Faktor 1 Faktor 2
Rama -121136 -125027 Sanella -048288 -026891 Becel 057050 019027 Du darfst 156374 -088742 Hall Butter -063529 094719 Weihnachtsbutter 019530 126914
Die Faktorwerte liefern nicht nur einen Anhaltspunkt fuumlr die Einschaumltzung der Margarinesorten bezuumlglich der gefundenen Faktoren sondern erlauben daruumlber hinaus (im Fall einer 2- oder 3-Faktorloumlsung) eine graphische Darstellung der Faktorenergebnisse Durch solche Mappings lassen sich besonders gut die Poshysitionen von Objekten (hier Margarinemarken) im Hinblick auf die gefundenen Faktoren visualisieren (vgl Abbildung 57)
Abbildung 57 Mapping der Faktorwerte
F 20 a k 15 t 0 r 10
05
00
-05
-10
-15
Du darfstbull f-
Becelbull Weihnachtsbutter
bull Sanellabull Holl Butterbull
Rama
bull I
-15 -10 -05 00 05 10 15
Faktor 2
268 Faktorenanalyse
Dabei wird deutlich daszlig es sich bei diesem mapping um eine relative Darstelshylung handelt Die Faktorwerte werden als Abweichung vom auf Null nonnierten Mittelwert dargestellt so daszlig hohe positive Faktorwerte stark uumlberdurchschnittlishyche hohe negative Faktorwerte stark unterdurchschnittliche Auspraumlgungen kennshy
zeichnen Der in Abbildung 58 dargestellte knappe Aufriszlig der Faktorenanalyse enthaumllt die
wesentlichen Teilschritte bei der Durchfiihrung einer Faktorenanalyse und ist unshyten als Ablaufdiagramm dargestellt Entsprechend diesem Ablaufdiagramm sind die nachfolgenden Betrachtungen aufgebaut Allerdings ist zu beachten daszlig sich bei konkreten Anwendungen der Faktorenanalyse insbesondere die Schritte (2) und (3) gegenseitig bedingen und nur schwer voneinander trennen lassen Aus dishydaktischen Gruumlnden wurde hier aber eine Trennung vorgenommen
bull Abbildung 58 Ablauf einer Faktorenanalyse
(1) Variablenauswahl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitaumlten
(4) Zahl der Faktoren
(5) Faktorinterpretation
(6) Bestimmung der Faktorwerte
Vorgehensweise 269
52 Vorgehensweise
5 Variablenauswahl und Errechnung der Korrelationsmatrix
Die Guumlte der Ergebnisse einer Faktorenanalyse ist von der Zuverlaumlssigkeit der Ausgangsdaten abhaumlngig Es muszlig deshalb besondere Sorgfalt auf die Wahl der Unshytersuchungsmerkmale verwendet werden Insbesondere
~ (2) Extraktion der Faktoren I
(3) Bestimmung der Kommunalitaumlten
u
(6) Bestimmung der Faktorwerte
ist darauf zu achten daszlig die erhobenen Merkmale auch fuumlr den Untersuchungsgegenstand relevant sind Irreleshyvante Merkmale sind vorab auszusortieren sowie als aumlhnlich erachtete Kriterien muumlssen zusammengefaszligt werden Insbesondere bei der Formulierung von Befragungsitems ist darauf zu achten daszlig bereits die Wortwahl der Fragestellungen das Antwortverhalten der Befragten und damit die Streuung der Daten beeinfluszligt Weiterhin sollten die Befragten einer rnoumlgshylichst homogenen Stichprobe entstammen da die Houmlhej bull
der KorrelatIOnen ZWischen den Untersuchungsmerk- malen (Variablen) durch den Homogenitaumltsgrad der Befragungsstichprobe beeinshyfluszligt wird
Die oben aufgezeigten Sachverhalte schlagen sich insgesamt in den Korrelashytionen nieder die als Maszlig fuumlr den Zusammenhang zwischen Variablen errechnet werden Es wurden deshalb Pruumlfkriterien entwickelt die es erlauben Variablenshyzusammenhaumlnge auf ihre Eignung fuumlr eine Faktorenanalyse zu uumlberpruumlfen Wir werden deshalb im folgenden zunaumlchst auf die Ermittlung von Korrelationen naumlher eingehen und sodann ausgewaumlhlte (statistische) Pruumlfkriterien erlaumlutern
5211 Korrelationsanalyse zur Aufdeckung der Variablenzusammenhaumlnge
Faktoren die als hinter den Variablen stehende Groumlszligen angesehen werden reshypraumlsentieren den Zusammenhang zwischen verschiedenen Ausgangsvariablen Beshyvor solche Faktoren ennittelt werden koumlnnen ist es zunaumlchst erforderlich die Zushysammenhaumlnge zwischen den Ausgangsvariablen meszligbar zu machen Als meshythodisches Hilfsmittel wird hierzu die Korrelationsrechnung herangezogen
Bereits anhand der Korrelationen laumlszligt sich erkennen ob Zusammenhaumlnge zwishyschen Paaren von Variablen bestehen so daszlig Variablen als voneinander abhaumlngig und damit als buumlndelungsfaumlhig angesehen werden koumlnnen
Fuumlr die Mittelwertmatrix (Abbildung 54) in obigem Beispiel laumlszligt sich zB die Korrelation zwischen x 1 (Anteil ungesaumlttigter Fettsaumluren) und x2 (Kaloriengehalt) wie folgt berechnen
~ IV taAtvJuAtJ(U)0
Korrelationskoeffizient
K 2(Xkl-XI)(XkZ -X2)
k = I (1)r = -===========XX2 I K K
2 (Xkl _X))2 2(XkZ -X2Y k = I k = I
mit
Auspraumlgung der Variablen I bei Objekt k (in unserem BeispielXkl laumluft k von 1 bis 6 (6 Markenraquo Mittelwert der Auspraumlgung von Variable 1 uumlber alle Objekte k Xl Auspraumlgung der Variablen 2 bei Objekt k xkZ Mittelwert der Auspraumlgung von Variable 2 uumlber alle Objekte k X2
Setzt man in Formel (1) die entsprechenden Werte der Ausgangsdatenmatrix ein so ergibt sich ein Korrelationskoeffizient von rbullbull =071176 Um die im einshy
1 2
zeInen notwendigen Rechenschritte zu erleichtern bedient man sich zurErmittlung der Korrelationskoeffizienten am besten der Hilfstabelle (Abbildung 59) Dabei stellt Xl den Mittelwert uumlber alle Marken rur die Eigenschaft Ungesaumlttigte Fettshy
saumluren ((1+2+4+5+2+36=283) und X2 ftlr die Eigenschaft Kaloriengeshy
halt ((1+6+5+6+3+46=417) dar
Abbildung 59 Hilfstabelle zur Berechnung eines Korrelationskoeffizienten
(x-l() (x-llt) (x-x)(x-J()(x -x) (x-llt)
336110 1002780 580555183333 -316667Rama 336110 middot152777-083333 183333 069444Sanella 069444 097222116667 063333 136112Becel 336110 397222216667 183333 469446Du darfst 097222middot083333 -116667 069444 136111Holt Butter 002778 -002778016667 -016667 002778Weihnechtsbutter
1083334 1883333 1016666 ----__----~--------__~-~~------_
(xx) I6 (xx) I6
(x-i)(xx) k=1 k=1
1016664r =VOuml8333011883333 =071176
Berechnet man die Korrelationskoeffizienten uumlber alle Eigenschaften ergibt sich rur die Mittelwertmatrix die in Abbildung 510 abgebildete Korrelationsmatrix
vorgenenswelse L 1
Abbildung 510 Korrelationsmatrix rur das 6-Produkte-Beispiel
UNGEFETI KALORlEN VITAMIN HALTBARK PREIS
-------------------- ---_--- ----------UNGEFETT 100000 KALORlEN 071176 100000
VITAMIN Q~~Pplusmn _QJQ~~__ 19PPQQ __ HALTBARK 010894 013771 007825 ri~oumloumloumloumloumlmiddot-------------------
PREIS 004385 006652 002362 098334 100000
In der Regel empfiehlt es sich die Ausgangsdatenmatrix vorab zu standardisieren da dadurch
- die Korrelationsrechnung und die im Rahmen der Faktorenanalyse erforderlishychen Rechenschritte erleichtert werden
- Interpretationserleichterungen erzielt werden - eine Vergleichbarkeit der Variablen ermoumlglicht wird die in unterschiedlichen
Maszligeinheiten erhoben wurden (zB Einkommen gemessen in Euro und Verkauf von Guumltern in Stck)
Eine Standardisierung der Datenmatrix erfolgt durch die Bildung der Differenz zwischen dem Mittelwert und dem jeweiligen Beobachtungswert einer Variablen sowie der anschlieszligenden Division durch die Standardabweichung Dadurch wird sichergestellt daszlig der neue Mittelwert gleich Null und die Standardabweichung einer Variablen gleich Eins ist Die Werte einer standardisierten Datenmatrix beshyzeichnen wir im folgenden nicht mehr mit x sondern mit z
Standardisierte Variable
Xk -x Zkj = J j
Sj
mit
Xkj BeobachtungSlVert der Variablenj bei Objekt k
Xj Durchschnitt aller Beobachtungswerte der Variablenj uumlber alle Objekte
s j Standardabweichung der Variablen j
Zkj Standardisierter Beobachtungswert der Variablen j bei Objekt k
Aus der standardisierten Datenmatrix ergibt sich auch eine einfachere Berechnung der Korrelationsmatrix R nach folgender Formel
R=_I_ZmiddotZ (2)K-I
272 Faktorenanalyse Vorgehensweise 273
wobei Z die transponierte Matrix der standardisierten Ausgangsdatenmatrix Z darstellt
Der Leser moumlge selbst anhand des Beispiels die Guumlltigkeit der Formel uumlberpruumlshyfen Dabei wird klar werden daszlig die Korrelationsmatrix auf Basis der Ausshygangsdaten identisch ist mit der Korrelationsmatrix auf Basis der standardisierten Daten Wird die Korrelationsmatrix aus standardisierten Daten errechnet so sind in diesem Falle Varianz-Kovarianzmatrix und Korrelationsmatrix identisch Fuumlr den Korrelationskoeffizienten laumlszligt sich auch schreiben
S 1middot2 SI ( - )( - )rx =-- mit x x =--t xkl-x Xk2-x 2
1 2 S S Imiddot 2 K -1 k XI X2
Da wegen der Standardisierung die beiden Varia~zen im Nenner 1 sind folgt daszlig Korrelationskoeffizient und Kovarianz SIX2) identisch sind
Die Korrelationsmatrix zeigt dem Anwender auf welche Variablen der Ausgangsshybefragung offenbar mit welchen anderen Variablen dieser Befragung irgendwie zusammenhaumlngen Sie zeigt ihm jedoch nicht ob
I die Variablen sich gegenseitig bedingen
oder
2 das Zustandekommen der Korrelationswerte durch einen oder mehrere hinter den zusammenhaumlngenden Variablen stehenden Faktoren bestimmt wird
Angesichts der beiden klar trennbaren Bloumlcke der Korrelationsmatrix (vgL die abshygegrenzten Vierecke) laumlszligt sich vermuten daszlig die Variablen XI bis x3 und x4xS durch zwei Faktoren erklaumlrt werden koumlnnten
Ausgehend von dieser Hypothese stellt sich unmittelbar die Frage mit welchem Gewicht denn die beiden Faktoren an der Beschreibung der beobachteten Zusamshymenhaumlnge beteiligt sind Es ist ja denkbar daszlig der Faktor Gesundheit als alleinishyger Beschreibungsfaktor filr die Variablen Xl bis x3 fast filr die gesamten Untershyschiede in der Ausgangsbefragung verantwortlich ist Es kann aber auch sein daszlig er nur einen Teil der unterschiedlichen Beurteilungen in der Ausgangsbefragung erklaumlrt Die groumlszligere oder geringere Bedeutung beider Faktoren laumlszligt sich in einer Gewichtszahl ausdrucken die im Rahmen einer Faktorenanalyse auch als Eigenshywert bezeichnet wird
5Ul Eignung der Korrelationsmatrix
Zu Beginn des Abschnittes 521 hatten wir bereits darauf hingewiesen daszlig sich die Eignung der Ausgangsdaten filr faktoranalytische Zwecke in der Korrelatishyonsmatrix widerspiegelt Dabei liefern bereits die Ausgangsdaten selbst einen Anshyhaltspunkt zur Eignungsbeurteilung der Daten zum Zwecke der Faktorenanalyse da die Houmlhe der Korrelationskoeffizienten durch die Verteilung der Variablen in der Erhebungsgesamtheit (Symmetrie Schiefe und Woumllbung der Verteilung) beeinfluszligt wird Liegt einer Erhebung eine heterogene Datenstruktur zugrunde so
macht sich dies durch viele kleine Werte in der Korrelationsmatrix bemerkbar II womit eine sinnvolle Anwendung der Faktorenanalyse in Frage gestellt ist Es ist
deshalb vorab eine Prufung der Variablen auf Normalverteilung ZUmindest aber auf Gleichartigkeit der Verteilungen empfehlenswert obwohl die Faktorenanalyseselbst keine Verteilungsannahmen setzt
Bezogen auf unser 6-Produkte-Beispiel treten neben sehr hohen Werten (gt 07) insbesondere im unteren Teil der Matrix kleine Korrelationen auf (vgl Abbildung 510) so daszlig die Korrelationsmatrix selbst kein eindeutiges Urteil uumlber die Eigshynung der Daten zur Faktorenanalyse zulaumlszligt
Es ist deshalb zweckmaumlszligig weitere Kriterien zur Pruumlfung heranzuziehen Hierzu bieten sich insbesondere statistische Prufkriterien an die eine Uumlberpruumlfung der Korrelationskoeffizienten auf Eignung zur Faktorenanalyse ermoumlglichen Es ist durchaus empfehlenswert mehr als ein Kriterium zur faktoranalytischen Eignung der Datenmatrix anzuwenden da die verschiedenen Kriterien unterschiedliche Vor- und Nachteile haben Im einzelnen werden durch SPSS folgende Kriterien bereitgestellt
Signifikanzniveaus der Korrelationen
Ein Signifikanzniveau uumlberpruumlft die Wahrscheinlichkeit mit der eine ZUvor formushylierte Hypothese zutrifft oder nicht Fuumlr alle Korrelationskoeffizienten lassen sich die Signifikanzniveaus anfilhren Zuvor wird eine sogenannte Ho-Hypothese forshymuliert die aussagt daszlig kein Zusammenhang zwischen den Variablen besteht Das Signifikanzniveau des Korrelationskoeffizienten berechnet anschlieszligend mit welshycher Irrtums wahrscheinlichkeit eben diese Ho-Hypothese abgelehnt werden kann Ein beispielhaftes Signifikanzniveau von 000 bedeutet daszlig mit dieser Irrtumsshywahrscheinlichkeit die Ho-Hypothese abgelehnt werden kann sprich zu 00 wird sich der Anwender taumluschen wenn er von einem Zusammenhang ungleich Null zwischen den Variablen ausgeht Anders ausgedruckt Mit einer Wahrscheinlichshykeit von 100 wird sich die Korrelation von Null unterscheiden
Abbildung 511 Signifikanzniveaus der Korrelationskoeffizienten im 6-ProdukteshyBeispiel
KOrrelatlonmatrix
UNGEFETT KALORIEN VITAMIN HALTBARKISignIfikanz (l-seitlg) UNGEFETT PREIS05632 00111 411lSZ 46713KAlORIEN 05632 05924 39737 45018VITAMIN 00111 05924 44144 49229HALTBARK 41862 39737 44144 00021PREIS 46713 45018 48229 00021
Fuumlr unser Beispiel zeigt Abbildung 511 daszlig sich genau diejenigen Korrelationsshykoeffizienten signifikant von Null unterscheiden (niedrige Werte in Abbildung 511) die in Abbildung 510 hbhe Werte (gt 07) aufweisen waumlhrend die Korrelashy
f
274 Faktorenanalyse
tionskoeffizienten mit geringen Werten auch ein hohes Signifikanzniveau (Wertegt 04) besitzen Das bedeutet daszlig sich ZB die Korrelation zwischen den Variablen Vitamingehalt und Haltbarkeit nur mit einer Wahrscheinlichkeit von (1- 044 =) 56 von Null unterscheidet
Inverse der Korrelationsmatrix
Die Eignung einer Korrelationsmatrix fuumlr die Faktorenanalyse laumlszligt sich weiterhin an der Struktur der Inversen der Korrelationsmatrix erkennen Dabei wird davon ausgegangen daszlig eine Eignung dann gegeben ist wenn die Inverse eine Diagoshynamatrix darstellt d h die Nicht-diagonal-Elemente der inversen Korrelatishyonsmatrix moumlglichst nahe bei Null liegen Fuumlr das 6-Produkte-Beispiel zeigt Abbildung 512 daszlig insbesondere fuumlr die Werte der Variablen Ungesaumlttigte Fettshysaumluren und Vitamingehalt sowie Haltbarkeit und Preis hohe Werte auftreshyten waumlhrend alle anderen Werte relativ nahe bei Null liegen Es existiert allerdings kein allgemeinguumlltiges Kriterium dafuumlr wie stark und wie haumlufig die Nicht-diashygonal-Elemente von Null abweichen duumlrfen
Abbildung 512 Inverse der Korrelationsmatrix im 6-Produkte-Beispie1
Inverse KorrelationsmatrIx
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS UNIiIIt
KALORIEN VITAMIN
HALTBARK
PREIS
1449910 -60678
-1319772 -558018 520353
-60678 217944 -82863
-218066 204555
-1319772 -82863
1400000 479257
-440959
-558018 -218066 479257
3817871 -3126624
520353 204555
-440959 -3726624 3738542
Bartlett-Test (test of spherlcity)
Der Bartlett-Test uumlberpruumlft die Hypothese ob die Stichprobe aus einer Grundgeshysamtheit entstammt in der die Variablen unkorreliert sinds
Gleichbedeutend mit dieser Aussage ist die Frage ob die Korrelationsmatrix nur zuflillig von einer Einheitsmatrix abweicht da im Falle der Einheitsmatrix alle Nicht-diagonal-Elemente Null sind d h keine Korrelationen zwischen den Varishyablen vorliegen Es werden folgende Hypothesen formuliert
HO Die Variablen in der Erhebungsgesamtheit sind unkorreliert
H1 Die Variablen in der Erhebungsgesamtheit sind korreliert
Der Bartlett-Test setzt voraus daszlig die Variablen in der Erhebungsgesamtheit einer Normaverteiung folgen und die entsprechende Pruumlf groumlszlige annaumlhernd ChishyQuadrat-verteilt ist Letzteres aber bedeutet daszlig der Wert der Pruumlfgroumlszlige in hohem
5 Vgl Dziuban C DlShirkey E C 1974 S 358 ff bull
Vorgehensweise 275
Maszlige durch die Groumlszlige der Stichprobe beeinfluszligt wird Fuumlr unser Beispiel erbrachshyte der Bartlett-Test eine Pruumlfgroumlszlige von 17371 bei einem Signifikanzniveau von 00665 Das bedeutet daszlig mit einer Wahrscheinlichkeit von (1- 00655=)9345
davon auszugehen ist daszlig die Variablen der Erhebungsgesamtheit korreliert sind Setzt man als kritische Irrtumswahrscheinlichkeit einen Wert von 005 fest so waumlshyre fuumlr unser Beispiel die Nullhypothese anzunehmen und folglich die Korrelatishyonsmatrix nur zufaumlllig von der Einheitsmatrix verschieden Das laumlszligt dann den Schluszlig zu daszlig die Ausgangsvariablen in unserem Fall unkorreliert sind
Allerdings sei an dieser Stelle nochmals darauf hingewiesen daszlig die Anwenshydung des Bartlett-Tests eine Pruumlfung der Ausgangsdaten auf Normalverteilung voraussetzt die in unserem Fall noch erfolgen muumlszligte
Anti-Image-Kovarianz-Matrix
Der Begriff Anti-Image stammt aus der Image-Analyse von Guttmann6 Guttrnann geht davon aus daszlig sich die Varianz einer Variablen in zwei Teile zerlegen laumlszligt das Image und das Anti-Image
Das Image beschreibt dabei den Anteil der Varianz der durch die verbleibenden Variablen mit Hilfe einer multiplen Regressionsanalyse (vgl Kapitel 1) erklaumlrt werden kann waumlhrend das Anti-Image denjenigen Teil darstellt der von den uumlbrishygen Variablen unabhaumlngig istlDa die Faktorenanalyse unterstellt daszlig den Variabshylen gemeinsame Faktoren zugrunde liegen ist es unmittelbar einsichtig daszlig Varishyablen nur dann fuumlr eine Faktorenanalyse geeriiet sind wenn das Anti-Image der Variablen moumlglichst gering ausflilltDas ab bedJJltet daszlig die Nicht-diagonalshyElemente der Anti-Image-Kovarianz-Matrix m glichst nahe bei Null liegen muumlsshysen bzw diese Matrix eine Diagonamatrix darstellen sollte Fuumlr das 6-ProdukteshyBeispiel zeigt Abbildung 513 daszlig die Forderung nach einer Diagonalmatrix ershyfiiHt ist
Abbildung 513 Anti-Image-Kovarianz-Matrix im 6-Produkte-Beispiel
AnIlJmIU_atrIzen
UNGEFETT KALORIEN VITAMIN HALTBARKi Arililinage-lltovananz PREISUNuumll1 06897 -01920 -06502 -01008 00960KAlORIEN -01920 45883 -02716 -02621 02511VITAMIN -06502 02716 07143 00897 -00842HALTBARK -01008 02621 00697 02619 -02611PREIS 00960 02511 -00842 middot02611 02675
Als Kriterium dafilr wann die Forderung nach einer Diagonalmatrix erfuumlllt ist schlagen Dziuban und Shirkey vor die Korrelationsmatrix dann als fuumlr die Fakshytorenanalyse ungeeignet anzusehen wenn der Anteil der Nicht-diagonal-Elemente die ungleich Null sind (gt 009) in der Anti-Image-Kovarianzmatrix (AIC) 25
Vgl Guttmann L 1953 S 277 ff
LIO r aKlOrenanalyse
oder mehr betraumlgt7 Das trifft in unserem Fall filr keines der Nicht-diagonalshyElemente der Ale-Matrix zu womit nach diesem Kriterium die Korrelationsmatrix filr faktoranalytische Auswertungen geeignet ist
Kaiser-Meyer-Olkin-Kriterium
Waumlhrend die Uumlberlegungen von Dziuban und Shirkey auf Plausibilitaumlt beruhen haben Kaiser Meyer und Olkin versucht eine geeignete Pruumlfgroumlszlige zu entwickeln und diese zur Entscheidungsfindung heranzuziehen Sie berechnen ihre PTUumlfgroumlszlige die als measure 0sampling adequacy (MSA) bezeichnet wird auf Basis der Anshyti-Image-KorrelationsmatrixbullDas MSA-Kriterium zeigt an in welchem Umfang die Ausgangsvariablen zusammengehoumlren und dient somit als Indikator dafilr ob eine Faktorenanalyse sinnvoll erscheint oder nichtDas MSA-Kriterium erlaubt sowohl eine Beurteilung der Korrelationsmatrix insgesamt als auch einzelner Varishyablen sein Wertebereich liegt zwischen degund 1 Kaiser und Rice schlagen folgenshy
8de Beurteilungen vor
MSA 2 09 marvelous (erstaunlich) MSA 2 08 meritorious (verdienstvoll) MSA 2 07 middling (ziemlich gut) MSA 2 06 mediocre (mittelmaumlszligig) MSA 2 05 miserable (klaumlglich) MSA lt05 unacceptable (untragbar)
Sie vertreten die Meinung daszlig sich eine Korrelationsmatrix mit MSA lt 05 nicht rur eine Faktorenanalyse eignet9 Als wuumlnschenswert sehen sie einen Wert von MSA 2 08 an lO In der Literatur wird das MSA-Kriterium das auch als KaisershyMeyer-Olkin-Kriterium (KMK) bezeichnet wird als das beste zur Verrugung steshyhende Verfahren zur Pruumlfung der Korrelationsmatrix angesehen weshalb seine Anwendunrvor der Durchfuhrung einer Faktorenanalyse auf jeden Fall zu empshyfehlen ist 1
Bezogen auf unser 6-Produkte-Beispiel ergab sich rur die Korrelationsmatrix insgesamt ein MSA-Wert von 0576 womit sich rur unser Beispiel ein riur klaumlglishyches Ergebnis ergibt Daruumlber hinaus gibt SPSS in der Diagonalen der AntishyImage-Korrelationsmatrix aber auch das MSA-Kriterium rur die einzelnen Variabshylen an
7 Vgl Dziuban C DlShirkey E C 1974 S 359
8 Vgl Kaiser H FRice J 1974 S 111 ff
9 Vgl Cureton E EDAgostino R B 1983 S 389 f
10 Vgl Kaiser H F 1970 S 405
II Vgl Stewart D W 1981 S 57 f Dziuban C DlShirkey E C 1974 S 360 f
Vorgehensweise 277
Abbildung 514 Anti-Image-Korrelations-Matrix im 6-Produkte-Beispiel
Antllmlge-Matrlun
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS AntI-lmageMrrelilllOn UNGEFETT 59680middot 10794 -92633 -23717 22350
KALORIEN -10794 87789 -15001 -23906 22661 VITAMIN -92633 -15001 59755 20730 -19274 HALTSARK -23717 -23906 20730 47060 -98640 PREIS 22350 22561 -19274 -95640 45701
8 Maszlig der StlchplObenelgnung
Abbildung 514 macht deutlich daszlig lediglich die Variable Kaloriengehalt mit einem MSA-Wert von 087789 als verdienstvoll anzusehen ist waumlhrend alle uumlbshyrigen Variablen eher klaumlgliche oder untragbare Ergebnisse aufweisen Die vashyriablenspezifischen MSA-Werte liefern damit rur den Anwender einen Anshyhaltspunkt dafuumlr welche Variablen aus der Analyse auszuschlieszligen waumlren wobei sich ein sukzessiver Ausschluszlig von Variablen mit jeweiliger Pruumlfung der vorgeshystellten Kriterien empfiehlt
522 Extraktion der Faktoren
(4) Zahl der Faktoren
(5) Faktorinterp~etat~ (6) Bestimmung der
Faktorwerte
Die bisherigen Ausruhrungen haben verdeutlicht daszlig bei Faktorenanalysen groszlige Sorgfalt auf die Wahl der Untersuchungsmerkmale und -einheiten zu verwenden ist da durch die Guumlte der Korrelationsmatrix die den Startpunkt der Faktorenanalyse darstellt alle Ershygebnisse der Faktorenanalyse beeinfluszligt werden Im folgenden ist nun zu fragen wie denn nun die Faktoren rein rechnerisch aus den Variablen ermittelt werden koumlnnen Wir werden im folgenden zunaumlchst das Funshydamentaltheorem der Faktorenanalyse darstellen und anschlieszligend die Extraktion auf graphischem Wege plausibel machen Auf die Unterschiede zwischen konkreten (rechnerischen) Faktorextraktionsverfahren gehen wir dann im Zusammenhang mit der Bestimshymung der Kommunalitaumlten (Abs~hnitt 523) ein
278 Faktorenanalyse
5221 Das FundamentaItheorem
Waumlhrend die bisherigen Uumlberlegungen die Ausgangsdaten und ihre Eignung fuumlr faktoranalytische Zwecke betrafen stellt sich nun die Frage wie sich die Faktoren rechnerisch aus den Variablen ennitteln lassen Zu diesem Zweck geht die Faktoshyrenanalyse von folgender grundlegenden Annahme aus
Jeder Beobachtungswert einer Ausgangsvariablen Xj oder der stanshydardisierten Variablen Zj laumlszligt sich als eine Linearkombination mehshyrerer (hypothetischer) Faktoren beschreiben
Mathematisch laumlszligt sich dieser Zusammenhang wie folgt fonnulieren
(3a)Xkj =ajl Pkl +ap PIa + +ajQ PkQ
bzw fuumlr standardisierte x-Werte
(3b)Zkj=ajIPkl+a j2middotPIa+middot+a jQmiddotPkQ=iajqPkq
q~l
Die obige Fonnel (3b) besagt fuumlr das 2-Faktorenbeispiel nichts anderes als daszlig zB die standardisierten Beobachtungswerte fuumlr Anteil ungesaumlttigter Fettsaumluren und Vitamingehalt beschrieben werden durch die Faktoren P 1 und P2 so wie sie im Hinblick auf Marke k gesehen wurden ltPIel bzw Pk2) jeweils multipliziert mit ihren Gewichten bzw Faktorenladungen beim Merkmal j also fuumlr Faktor 1 ajl und
fuumlr Faktor 2 a2 Oie Faktorradung gibt dabei an wieviel ein Faktor mit einer Ausgangsvariablen
zu tun hat Im mathematisch-statistischen Sinne sind Faktorladungen nichts andeshyres als eine Maszliggroumlszlige fuumlr den Zusammenhang zwischen Variablen und Faktor und das ist wiederum nichts anderes als ein Korrelationskoeffizient zwischen Fakshytor und Variablen
Um die Notation zu verkuumlrzen schreibt man haumlufig den Ausdruck (3b) auch in Matrixschreibweise Identisch mit Fonnel (3b) ist daher auch folgende Mashytrixschreibweise die die Grundgleichung der Faktorenanalyse darstellt
(3c)Z=pmiddotA
Aufbauend auf diesem Grundzusammenhang laumlszligt sich dann auch eine Rechenshyvorschrift ableiten die aufzeigt wie aus den erhobenen Daten die vennuteten Fakshytoren mathematisch ennittelt werden koumlnnen
Wir hatten gezeigt daszlig die Korrelationsmatrix R sich bei standardisierten Daten wie folgt aus der Datenmatrix Z ennitteln laumlszligt
R=_I_ZZ (2) K-l
Vorgehensweise 279
Da Z aber im Rahmen der Faktorenanalyse durch P A beschrieben wird (Z =PA) ist in (2) Z durch Fonnel (3c) zu ersetzen so daszlig sich folgende Fonnet
ergibt
R=_I_PA)PA) (4)K I
Nach Aufloumlsung der Klammem ergibt sich nach den Regeln der Matrixmultiplishykation
r------- R=_I_APPA=A-I_pPA (5)
K-I ~
~
Da alle Daten standardisiert sind laumlszligt sich der _1_ ptP Ausdruck in Formel (5)K-l ----y---J
auch als K(Jrrelationsmatrix der Faktoren (C) bezeichnen (vgl Fonnel (2raquo so daszlig sich schreiben laumlszligt
R = AmiddotCmiddotA (6)
Da die Faktoren als unkorreliert angenommen werden entspricht C einer Einheitsshymatrix (einer Matrix die auf der Hauptdiagonalen nur Einsen und sonst Nullen enthaumllt) Da die Multiplikation einer Matrix mit einer Einheitsmatrix aber wieder die Ausgangsmatrix ergibt vereinfacht sich die Fonnel (6) zu
R = AmiddotA (7)
Die Beziehungen (6) und (7) werden von Thurstone als das Fundamentaltheorem der Faktorenanalyse bezeichnet da sie den Zusammenhang zwischen Korrelatishyonsmatrix und Faktorladungsmatrix beschreiben
Das Fundarnentaltheorem der Faktorenanalyse besagt nicht anderes als daszlig sich die Korrelationsmatrix durch die Faktorladungen (Matrix A) und die Korrelationen zwischen den Faktoren (Matrix C) reproduzieren laumlszligt Fuumlr den Fall daszlig man von unabhaumlngigen (orthogonalen) Faktoren ausgeht reduziert sich das Funshydamentaltheorem auf Fonnel (7) Dabei muszlig sich der Anwender allerdings bewuszligt sein daszlig das Fundamentaltheorem der Faktorenanalyse nach Fonnel (7) stets nur unter der Praumlmisse einer Linearverknuumlpfung und Unabhaumlngigkeit der Faktoren Guumlltigkeit besitzt
5222 Graphische Interpretation von Faktoren
Der Infonnationsgehalt einer Korrelationsmatrix laumlszligt sich auch graphisch in einem Vektor-Diagramm darstellen in dem die jeweiligen Korrelationskoeffizienten als Winkel zwischen zwei Vektoren dargestellt werden Zwei Vektoren werden dann
280 Faktorenanalyse
als linear unabhaumlngig bezeichnet wenn sie senkrecht (orthogonal) aufeinander steshyhen Sind die beiden betrachteten Vektoren (Variablen) jedoch korreliert ist der Korrelationskoeffizient also C 0 zB 05 dann wird dies graphisch durch einen Winkel von 60deg zwischen den beiden Vektoren dargestellt
Es stellt sich die Frage Warum entspricht ein Korrelationskoeffizient von 05 genau einem Winkel von 60deg Die Verbindung wird uumlber den Cosinus des jeshy
weiligen Winkels hergestellt Verdeutlichen wir uns dies anhand des Ausgangsbeispiels (Abbildung 515)
In Abbildung 515 repraumlsentieren die Vektoren AC und AB zB die beiden Vashyriablen Kaloriengehalt und Vitamingehalt Zwischen den beid~_yariablen moumlge eine Korrelation von 05 gemessen worden sein Der Vektor AC der den Kaloriengehalt repraumlsentiert und der genau wie AB aufgrund der Standardisierung eine Laumlnge von 1 hat weist zu AB einen Winkel von 60deg auf Der Cosinus des Winkels 60deg der die Stellung der beiden Variablen zueinander (ihre Richtung) anmiddot gibt ist definiert als Quotient aus Ankathete und Hypothenuse also als AD AC Da AC aber gleich 1 ist ist der Korrelationskoeffizient identisch mit der Strecke
AD Wie Abbildung 516 ausschnitthaft zeigt ist zB der Cosinus eines 60deg-Winkels
gleich 05 Entsprechend laumlszligt sich jeder beliebige Korrelationskoeffizient zwischen zwei Variablen auch durch zwei Vektoren mit einem genau definierten Winkel zushyeinander darstellen Verdeutlichen wir uns dies noch einmal anband einer Korrelamiddot tionsmatrix mit drei Variablen (Abbildung 517)
Abbildung 515 Vektordarstellung einer Korrelation zwischen zwei Variablen
c
A 0 B
)V
Standardisierte LOnge von 1
Vorgehensweise 281
Abbildung 516 Werte rur den Cosinus (entnommen aus Geliert W JKuumlstnerHlHellwich MfKaumlstner H Kleine Enzyshyklopaumldie Mathematik Leipzig 1969 S 799)
Grad CO Grad cO
45 07071 90 00000 44 7193 89 0175 43 7314 88 0349 42 7431 87 0523 41 7547 86 0698 40 07660 85 0872 39 7771 84 1045 38 7880 83 1219 37 7986 82 1392 36 8090 81 1564 35 8192 80 01736 34 8290 79 1908 33 8387 78 2079 32 8480 77 2250 31 8572 76 2419 30 08660 75 2588 29 8746 74 2756 28 8829 73 2924 27 8910 72 3090 26 8988 71 3256 25 9063 70 03420 24 9135 69 3584 23 9205 68 3746 22 9272 67 3907 21 9336 middot66 4067 ZO 09397 65 4226 19 9455 64 4384 18 9511 63 4540 17 9563 62 4695 16 9613 61 4848 15 9659 60 05000 14 9703 59 5150 13 9744 58 5299 12 9781 57 5446 11 9816 56 5592 10 09848 55 5736 9 9877 54 5878 8 9903 53 6018 7 9925 52 6157 6 9945 51 6293 5 9962 50 06428 4 9976 49 6561 3 9986 48 6691 2 9994 47 6820 1 9998 46 6947 0 10000 45 7071
282 Faktorenanalyse
Abbildung 517 Korrelationsmatrix
R =r68660 1 06428lO1736 ~
R laumlszligt sich auch anders schreiben (vgl Abbildung 518)
Abbildung 518 Korrelationsmatrix mit Winkelausdrucken
l0deg R = 30deg 0deg
80deg 50deg 0deg
Der Leser moumlge die entsprechenden Werte selbst in einer Cosinus-Tabelle uumlbershy
pruumlfenDie der oben gezeigten Korrelationsmatrix zugrundeliegenden drei Variablen
und ihre Beziehungen zueinander lassen sich relativ leicht in einem zweidimen sionalen Raum darstellen (Abbildung 519)
Abbildung 519 Graphische Darstellung des 3-Variablen-Beispiels
Vektor X2
Vektorx3Vektor Xl
Vorgehensweise 283
Je mehr Variable jedoch zu beruumlcksichtigen sind desto mehr Dimensionen werden benoumltigt um die Vektoren in ihren entsprechenden Winkeln zueinander zu positioshy
nieren Die Faktorenanalyse trachtet nun danach das sich uumlber die Korrelationsshykoeffizienten gemessene Verhaumlltnis der Variablen zueinander in einem moumlglichst gering dimensionierten Raum zu reproduzieren Die Zahl der benoumltigten Achsen gibt dann die entsprechende Zahl der Faktoren an
Wenn man die Achsen als Faktoren ansieht dann stellt sich unmittelbar die Frashyge Wie werden diese Achsen (Faktoren) in ihrer Lage zu den jeweiligen Vektoren (Variablen) bestimmt
Dazu vergegenwaumlrtigt man sich am besten das Bild eines halboffenen Schirmes Die Zacken des Schirmgestaumlnges die alle in eine bestimmte Richtung weisend die Variablen repraumlsentieren lassen sich naumlherungsweise auch durch den Schirmstock darstellen Vereinfacht man diese Uumlberlegung aus DarstellungsgrQnden noch weishyter auf den 2-Variablen-Fall wie in AbbiIdu8520 die einen Korrelationskoshyeffizienten von 05 fuumlr die durch die Vektoren OA und OB dargestellten Variablen repraumlsentiert dann gibt der Vektor OC eine zusammenfassende (faktorielle) Beshyschreibung wieder Die beiden Winkel von 30deg zwischen Vektor I bzw Vektor II und Faktor-Vektor geben wiederum an inwieweit der gefundene Faktor mit Vekshytor (Variable) I bzw II zusammenhaumlngt Sie repraumlsentieren ebenfalls Korrelationsshykoeffizienten und zwar die zwischen den jeweiligen Variablen und dem Faktor Diese Korrelationskoeffizienten hatten wir oben als Faktorladungen bezeichnet Die Faktorladungen des 1 Faktors betragen also in bezug auf Variable I und Varishyable II cos 30deg = 08660
Abbildung 520 FaktorlOsung bei 2 Variablen
j
A
Vektor x
~---------__------~---- C
Resultante
e Vektor X
284 Faktorenanalyse
5223 Das Problem der Faktorextraktion
Nachdem wir nun wissen was eine Faktorladung inhaltlich bedeutet ist zu fragen Wie findet man einen solchen Vektor (Faktor) der stellvertretend ftir mehrere zushysammenhaumlngende Variable fungieren kann Erinnern wir uns noch einmal des Ausgangsbeispiels Aufstrichfette waren nach den ftinfMerkmalen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt - Haltbarkeit - Preis bewertet worden l2
Aus dieser Bewertung sei die Korrelationsmatrix in Abbildung 521 berechnet worden
Abbildung 521 Spiegelbildlich identische KOlTelationsmatrix
x X x x x
x 70 100 09848 90middotX 03420 30x 00000 10middotx
X -01736
Diese Korrelationsmatrix enthaumllt in der unteren Dreiecks-Matrix die Korrelationsshywerte in der oberen (spiegelbildlich identischen) Dreiecks-Matrix die entshysprechenden Winkel Graphisch ist der Inhalt dieser Matrix in Abbildung 522 darshygestellt
Das Beispiel wurde so gewaumlhlt daszlig die Winkel zwischen den Faktoren in einer zweidimensionalen Darstellung abgebildet werden koumlnnen - ein Fall der in der Realitaumlt allerdings kaum relevant ist
Wie findet man nun den 1 Faktor in dieser Vektordarstellung Bleiben wir zunaumlchst bei der graphischen Darstellung dann sucht man den
Schwerpunkt aus den ftinf Vektoren Der Leser moumlge sich dazu folgendes verdeutlichen
In Abbildung 522 ist der Faktor nichts anderes als die Resultante der funfVektoshyren Wuumlrden die ftinfVektoren funf Seile darstellen mit einem Gewicht in 0 und jeweils ein Mann wuumlrde mit gleicher Staumlrke an den Enden der Seile ziehen dann wuumlrde sich das Gewicht in eine bestimmte Richtung bewegen (vgl die gestrichelte
12 Es werden hier andere Werte als im Ausgangsbeispiel verwendet um zunaumlchst eine einshydeutige graphische Loumlsung zu ermoumlglichen
Vorgehensweise 285
Linie in Abbildung 523) Diesen Vektor bezeichnen wir als Resultante Er ist die graphische Repraumlsentation des 1 Faktors
Abbildung 522 Graphische Darstellung des 5-Variablen-Beispiels
~
XsXl
bull
Abbildung 523 Graphische Darstellung des Schwerpunktes
X2
XIX
Faktorshyvektor2
Betrachtet man nun die jetzt gebildeten Winkel zwischen dem 1 Faktor und den Ausgangsvektoren dann hat man auch die gesuchten Faktorladungen gefunden
(Erste Reshysultante)
4512
-------o
- -
286 Faktorenanalyse
Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen
Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben
Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge
die Werte selbst uumlberpruumlfen)
Abbildung 524 Einfaktorielle Ladungsmatrix
Faktor
05707Xl 07046x2 bull 09668x3
08211x4
07096
Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)
Abbildung 525 ZweifaktorieHe Ladungsmatrix
Faktor 1 Faktor 2
Xl 05707 -08211
x2 07046 -07096
x3 09668 02554
x4 08211 05707
Xs 07096 07046
Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa
Vorgehensweise 287
In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum
I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1
~~ 00
2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation
Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist
Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt
Sf = 1 = Ijj (9)J
3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt
Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)
Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung
Resutlanie 2 (Faktor 2)
A Vektor x o
120lt= fH bull C Resultante 1 (Faktor 1)
B Vektor x
288 Faktorenanalyse
Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB
Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel
Wenn obige Behauptung stimmt muumlszligte gelten
(lOa)[~J +[~~J =1
Uumlberpruumlfung 2 2 uumlc2
OC 00 +002 (lOb)--+-shy 2
OA OA OA2 2
In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)
Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)
(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)
2 2 OC +00
4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten
sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)
wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-
q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1
(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix
(2) Extraktion der
(5) Faktorinterpretatiln
(6) Bestimmung der Faktorwerte
Vorgehensweise 289
523 Bestimmung der Kommunalitaumlten
In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem
Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy
fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig
mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da
J
i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins
Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung
erklaumlrte Variant
standardisierte Gesamtvariant = 1
290 Faktorenanalyse
Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung
2 a j1 =07
2 2 8 j2 = 01 siRest= 02
Kommunalitat H =08 (erllt1arte Varianz)
Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)
R AmiddotA+U (7a)
Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet
Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion
Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer
Vorgehensweise 291
100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY
In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy
weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen
Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen
1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen
2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit
2 2I ~ ~ R j ~ mx rjk
Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse
- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy
13 Vgl Loehlin J C 1998 S 154 14
Vgl Uberla K 1972 S 155 ff
292 Faktorenanalyse
nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird
- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit
Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy
15formationsverlust deklariert wird
Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen
Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy
15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt
Vorgehensweise 293
tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder
Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren
Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen
Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren
Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist
Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf
Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden
Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel
Kommunalltlten
Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325
Extraktionsmelhode Hauptachsen-Faktorenanalyse
bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix
294 Faktorenanalyse
Abbildung 530 Faktorladungen im 6-Produkte-Beispiel
Faktoranmatrixmiddot
Faktor
1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608
Extraktionsmethode Hauptachsen-Faktorenanalyse
a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt
Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert
Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel
Reproduzierte Korrelationen
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT
KALORIEN
VITAMIN
HALTBARK
PREIS
96845 71193 96034 11035 04241
71193 52552b
70480
12709
07717
96034 70480 95292b
08461 01722
11035
12709 08461 99056b
8325
04241 07717 01722 98325 98070b
Residuun1 UNGEFETi
KALORIEN
VITAMIN
HALTBARK
PREIS
-00017 00101
-00141 00144
-00017
-00083 01001
- 01005
00101 -00083
-00036 00640
-00141 01061
-00636
00010
00144 -01005 00640 00010
ExtrakHonsmethode Hauptllchsenfaktorenanalyse
a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005
b Reproduzierte Kommunalltaumlten
Vorgehensweise 295
Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen
Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R
524 Zahl der Faktoren
(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix
(2) Extraktion der Faktoren
(6) Bestimmung der Faktorwerte
Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff
Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-
q N
trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N
Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden
Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy
296 Faktorenanalyse
Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre
Abbildung 532 Bestimmung der Eigenwerte
Faktorenmatrix
Faktor
1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)
Eigenwerte 25068 19112
Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil
Kom munalltaumlten
Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807
- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren
V orgehensweise 297
Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung
Abbildung 534 Scree-Test im 6-Produkte-Beispiel
Eigen- Screeplot wert 30
25
20
15
Kaiser-Kriterium
10 1 Elbow5
00 2 3 4 5
Faktomummer
298 Faktorenanalyse
525 Faktorinterpretation
Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)
Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt
(1) Variablenauswalll und Errechnung der Korrelationsmalrix
(2) Extraktion der Faktoran
(3) Bestimmung der Kommunalltaumllen
(6) Bestimmung derFaktorwerte _______---11
middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull
geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht
Abbildung 535 Faktorladungen im 6-Produkte-Beispiel
Preis Haltbarkeit
Extraktionsmethode Hauptachsen-Faktorenanalyse
Vorgehensweise 299
Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist
Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig
Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16
Abbildung 536 Unrotierte Faktorladungen
F
F
Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung
Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f
300 Faktorenanalyse
536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy
tert
Abbildung 537 Rotierte Faktorladungen
F (Ausgangssituation)2
11 F2 (rotiert)
F1
-- shy
(Ausgangssituation)
11
F1 (rotiert)
SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen
1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen
(rechtwinkligen) Rotation
2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren
Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die
vorgenenswelse j U 1
Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind
Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel
Faktor
1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt
Haltbarkeit
72152 bull 07020
07962 I 99208 Preis 01060 99025
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung
Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen
A bull =A T mit TC~SI7 - sina ] sma cosa
Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links
A T A 094331 - 028039 098357 003229
[C0s341570 - sin34 157 ]070669 016156 072152 007020
sin34157deg cos34157092825 - 030210 097615 000694
038926 091599 007962 099208
032320 093608 001060 099025
Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)
Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix
Faktor 1 2
1 94868 31622
2 -31622 94868
Il
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung
Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig
von a=1843deg
526 Bestimmung der Faktorwerte
(1) Variablenauswanl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitaumlten
Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte
Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt
(3c)Z=PmiddotA
Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY
(12)Z AT1p AAT
Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt
(13)ZArl=pE
Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten
(3c) wird von rechts mit A multipliziert
ZmiddotA=PmiddotAmiddotA (15)
Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar
ZAmiddot(A At1=P(A A) (A Atl (16)
Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt
P=ZA(AAt l (17)
In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren
In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term
AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte
Abbildung 540 Koeffizientenmatrix der Faktorwerte
Faktor 1 2
Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression
Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die
xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf
SjDa p E=P ist ergibt sich
Seite 271 zu (14)
P=ZAT
304 Faktorenanalyse
Abbildung 541 Standardisierte Ausgangsdatenmatrix Z
45ampt6R4LJL4
Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542
Abbildung 542 Faktorwerte im 6-Produkte-Beispiel
Vorgehensweise 305
Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel
Du darfst
VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG
E 11 BecelS
U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T
Sanella IIII Holl Butter
-1
bull Rama
-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18
WIRTSCHAFTLICHKEIT
Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen
527 Zusammenfassende Darstellung der Faktorenanalyse
Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy
e Vorgehensweise 307 306 Faktorenanalyse
Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen
sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-
schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy
tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig
wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy
nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy
chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy
analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte
Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht
Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der
Verwendung des Verfahrens offenzulegen
I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _
CQ)l2CQgtQ ~ i
-Q)C t l5~11
0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C
CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O
~ ~ 11 t 3
uj~fi
t Imiddot~ J1 ~SHaa
It c~
c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~
-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi
o~ ~ -gEG)
I ~l c c ~l~ampi
2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E
U~a ]i E
J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy
~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--
----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt
Fallbeispiel 309308 Faktorenanalyse
Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert
531 Problemstellung
In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften
Variable und Objekte des BeispielsAbbildung 545
EigenschaftenMarken M k (k=I Il) xj(j=I IO)
A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado
5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H
I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama
Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist
Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)
Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern
Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse
---
310Faktorenanalyse
532 Ergebnisse
1 Variablenauswahl und Errechnung der Korrelationsmatrix
Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung
548 wiedergegeben
Abbildung 548 Die Korrelationskoeffizienten -_ -
-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy
In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der
Fallbeispiel 311
Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet
Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie
-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -
06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170
-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260
62444 -97126 66229 -83532 -62589
-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545
-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno
Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)
Abbildung 550 Dialogfeld Deskriptive Statistik
312 Faktorenanalyse
2 Bestimmung der Kommunalitilten
Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt
wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend
bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich
von den Startwerten abweichen
Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten
Hauptkomponentenanalyse Hauptachsenanalyse
Variable Korrunuriali- Kommunali- Korrununali- Kommunali-
Ut (Startwerte)
tlt (Endwerte)
tlIl (Startwerte )
tlIl (End werte)
STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR
100000 100000 100000 100000 100000 100000 100000 100000 100000 100000
88619
76855
89167 85324 76043 84012 80223 92668 63297 88786
97414
89018
79497
85847
96501
98810
97132
99166
78019
96445
85325
55717
85754
91075
55819
82330
73903
94796
40402
87851
Fallbeispiel 313
Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy
I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren
Abbildung 552 Dialogfeld Extraktion
Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist
3 Wabl der Extraktionsmetbode
Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen
4 Zabl der Faktoren
Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen
Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet
Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch
17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f
1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden
Erklaumlrte Gesamtvarianz
Anfaumlngliche Eigenwerte
314 Faktorenanalyse
Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy
den sich fUnfFaktoren ergeben
Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien
95) der Varianz erklaumlrt sind
2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)
3 Extrahiere n (zB 3) Faktoren
4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy
renzahl
5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein
6 Extrahiere alle Faktoren die nach der
Vom Computer automatisch verwandt wenn keine andere Spezifikation
Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden
Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden
Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist
Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt
Fallbeispiel 315
Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil
Faktor 1
2 3
4
5
6
7
8
9
10
Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden
Abbildung 555 Scree-Test und Kaiser-Kriterium
Eigen- -=gtcreeplot wert
5
4
3
2
10
o Kaisershy
~ 3 i i 7 i Q
Faktornummer
Gesamt 505188
177106
142700
81935
42961
24709
15928
06190
02943
00340
der Varianz 5051883
1771061
1427002
819349 429611
247085
159275
61902
29434
03398
Kumulierte 5051883
6822944
8249946
9069295
9498905
9745991
9905266
9967168
9996602
10000000
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
264 Faktorenanalyse
um zuruumlckzugreifen das die Quantifizierung von Beziehungen zwischen Variablen erlaubt Ein solches statistisches Kriterium stellt der Korrelationskoeffizient dar Durch die Berechnung von Korrelationen zwischen allen Variablen laumlszligt sich die Staumlrke der Beziehungszusammenhaumlnge zwischen allen Variablen berechnen
Abbildung 54 Mittelwertmatrix fuumlr das 6-Produkte-Beispiel
Eigenschaften
Marken Xl X2 x3 x4 Xs Rama I I 2 I 2 Sanella 2 6 334 Becel 4 5 445 Du darfst 5 6 623 Hollaumlndische Butter 2 3 3 5 7 Weihnachtsbutter 3 4 4 6 7
wobei x I = Anteil ungesaumlttigter Fettsaumluren x2 = Kaloriengehalt x3 = Vitamingehalt x4 = Haltbarkeit Xs = Preis
Dabei ist jedoch zu beachtlaquon daszlig Korrelationen grundsaumltzlich auf drei verschieshydene Arten kausal interpretiert werden koumlnnen Wir wollen dies an dem Beispiel der Variablen Fettsaumluren und Vitamingehalt verdeutlichen
1 Die Korrelation zwischen Fettsaumluren und Vitamingehalt resultiert daraus daszlig sich durch die Erhoumlhung des Anteils ungesaumlttigter Fettsaumluren auch der Vitamingehalt erhoumlht
2 Die Korrelation zwischen Fettsaumluren und Vitamingehalt resultiert daraus daszlig durch eine Erhoumlhung des Vitamingehalts auch der Anteil ungesaumlttigter Fettsaumluren gesteigert wird
3 Fuumlr die Korrelation zwischen Fettsaumluren und Vitamingehalt ist eine hinshyter diesen beiden Variablen stehende Groumlszlige kausal verantwortlich d h diese hypothetische Groumlszlige stellt die Ursache fuumlr das Zustandekommen der Korrelashytion dar
An dieser Stelle wird bereits deutlich daszlig aus inhaltlichen Uumlberlegungen heraus entschieden werden muszlig welche der obigen drei Interpretationsmoumlglichkeiten in einer bestimmten Anwendungssituation Guumlltigkeit besitzt Die Faktorenanalyse unterstellt daszlig immer die dritte Interpretationsvariante zutrifft Nur wenn dem aufshygrund sachlogischer Uumlberlegungen zugestimmt werden kann darf eine Faktoshyrenanalyse angewendet werden
Problemstellung 26S
Verzichtet man zunaumlchst auf die Berechnung von Korrelationen und unterstellt die Guumlltigkeit der o g dritten Interpretationsart so koumlnnen wir in obigem Beispiel von der plausiblen Vermutung ausgehen daszlig Xl bis x3 sowie x4 und x5 lediglich Beshyschreibungen von zwei eigentlich hinter diesen Variablen stehenden Groumlszligen (Faktoren) darstellen
Diese Vermutung laumlszligt sich graphisch wie in Abbildung 55 dargestellt vershydeutlichen
Abbildung 55 Grundgedanke der Faktorenanalyse im Beispiel
VARIABLEN FAKTOREN
x Anteil ungesaumltshy tigter Fettsaumluren I~---___-
x Kaloriengehalt rmiddot------=~31 F 1 GESUNDHEIT
~
x Vitamingehalt
I Hba ~___= F WIRTSCHAFTshy
LICHKEITI x bull Preis ~ _ _shy
Ausgehend von den flinf Eigenschaften die in der Befragung verwendet wurden wird aufgrund der sich in den Daten manifestierenden Beziehungen zwischen xl bis x3 bzw x4 und Xs vermutet daszlig eigentlich nur zwei unabhaumlngige Beschreishybungsdimensionen fuumlr die Aufstrichfette existieren (die die Variationen in den Vashyriablen bedingen) Xl bis x3 koumlnnten ZB Ausdruck eines Faktors sein den man etwa mit Gesundheit bezeichnen koumlnnte denn sowohl der Anteil ungesaumlttigter Fettsaumluren als auch Kaloriengehalt und Vitamingehalt haben etwas mit der Geshysundheit zu tun Ebenso koumlnnen die Variablen x4 und Xs (Haltbarkeit und Preis) Ausdruck fuumlr Wirtschaftlichkeitsuumlberlegungen sein Man koumlnnte also vermuten daszlig sich die Variablen Xl bis Xs in diesem konkreten Fall auf zwei komplexere Vashyriablenbuumlndel verdichten lassen Diese Variablenbuumlndel bezeichnen wir im folshygenden als Faktoren
266 Faktorenanalyse
Werden die im Ausgang betrachteten Eigenschaften zu Faktoren zusammengefaszligt so ist unmittelbar einsichtig daszlig gegenuumlber der Mittelwertmatrix in Abbildung 54 ein weiterer Informationsverlust entsteht da idR weniger Faktoren alsursprilngshyliehe Eigenschaften betrachtet werden Dieser Informationsverlust ist darin zu seshyhen daszlig zum einen die Faktoren in der Summe nur weniger Varianz erklaumlren koumlnshynen als die fuumlnf Ausgangsvariablen und zum anderen die Varianz einer jeden Ausshygangs groumlszlige in der Erhebungsgesamtheit ebenfalls durch die Faktoren idR nicht vollstaumlndig erklaumlrt werden kann Der Verlust an erklaumlrter Varianz wird im Rahmen der Faktorenanalyse zugunsten der Variablenverdichtung bewuszligt in Kauf genomshymen Allerdings muszlig sich der Anwender vorab uumlberlegen in welchem Ausmaszlig dieser Erklaumlrungsverlust (im Sinne eines Varianzverlustes) bei den einzelnen Ausshygangsvariablen toleriert bzw wieviel Varianz durch die Faktoren bei einer beshystimmten Variablen erklaumlrt werden soll Den Umfang an Varianzerklaumlrung den die Faktoren gemeinsam fllr eine Ausgangsvariable liefern wird als Komm~nalitaumlt beshyzeichnet Die Art und Weise mit der die Kommunalitaumlten bestimmt werden ist unmittelbar an die Methode der Faktorenermittlung (Faktorextraktionsmethode) gekoppelt Je nachdem welche Uumlberlegungen der Kommunalitaumltenbestimmung zugrunde liegen werden unterschiedliche Faktorenanalyseverfahren relevant
Ist eine Entscheidung uumlber die HOumlhe der Kommunalitaumlten der einzelnen Ausshygangsvariablen getroffen so muszlig weiterhin uumlber die Anzahl der zu extrahierenden Faktoren entschieden werden da das Ziel der Faktorenanalyse gerade darin zu seshyhen ist weniger Faktoren als urspruumlngliche Variable zu erhalten Hier steht der Anwender vor dem Zielkonflikt daszlig mit einer geringen Faktorenzahl tendenziell ein groszliger Informationsverlust (im Sfnne von nicht erklaumlrter Varianz) verbunden ist und umgekehrt In unserem Beispiel hatten wir uns aufgrund einer Plaushysibilitaumltsbetrachtung fllr zwei Faktoren entschieden
Ist schlieszliglich die Anzahl der Faktoren bestimmt so ist es von besonderem Inshyteresse die Beziehungen zwischen den Ausgangsvariablen und den Faktoren zu kennen Zu diesem Zweck werden Korrelationen berechnet die ein Maszlig tuumlr die Staumlrke und die Richtung der Zusammenhaumlnge zwischen Faktoren und urshyspruumlnglichen Variablen angeben Diese Korrelationen werden als Faktorladungen bezeichnet und in der sog Faktorladungsmatrix zusarnmengefaBt Abschlieszligend ist es dann von Interesse wie die befragten Personen die Marken Rama SaneUa Becel Du darfst Hollaumlndische Markenbutter und Weihnachtsbutter im Hinblick auf die beiden kuumlnstlichen Faktoren Gesundheit und Wirtschaftlichkeit beshyurteilen wuumlrden Gesucht ist also die entsprechende Matrix zu Abbildung 54 die die Einschaumltzung der Marken bezuumlglich der beiden Faktoren Gesundheit und Wirtschaftlichkeit enthaumllt Diese Einschaumltzungen werden als Faktorwerte beshyzeichnet Abbildung 56 zeigt die entsprechende Faktorwerte-Matrix fuumlr unser kleines Ausgangsbeispiel Die Darstellung enthaumllt standardisierte Werte wobei die Auspraumlgungen als Abweichungen vom Mittelwert dargestellt sind
Problemstellung 267
Abbildung 56 Faktorwerte-Matrix r-shy
Faktor 1 Faktor 2
Rama -121136 -125027 Sanella -048288 -026891 Becel 057050 019027 Du darfst 156374 -088742 Hall Butter -063529 094719 Weihnachtsbutter 019530 126914
Die Faktorwerte liefern nicht nur einen Anhaltspunkt fuumlr die Einschaumltzung der Margarinesorten bezuumlglich der gefundenen Faktoren sondern erlauben daruumlber hinaus (im Fall einer 2- oder 3-Faktorloumlsung) eine graphische Darstellung der Faktorenergebnisse Durch solche Mappings lassen sich besonders gut die Poshysitionen von Objekten (hier Margarinemarken) im Hinblick auf die gefundenen Faktoren visualisieren (vgl Abbildung 57)
Abbildung 57 Mapping der Faktorwerte
F 20 a k 15 t 0 r 10
05
00
-05
-10
-15
Du darfstbull f-
Becelbull Weihnachtsbutter
bull Sanellabull Holl Butterbull
Rama
bull I
-15 -10 -05 00 05 10 15
Faktor 2
268 Faktorenanalyse
Dabei wird deutlich daszlig es sich bei diesem mapping um eine relative Darstelshylung handelt Die Faktorwerte werden als Abweichung vom auf Null nonnierten Mittelwert dargestellt so daszlig hohe positive Faktorwerte stark uumlberdurchschnittlishyche hohe negative Faktorwerte stark unterdurchschnittliche Auspraumlgungen kennshy
zeichnen Der in Abbildung 58 dargestellte knappe Aufriszlig der Faktorenanalyse enthaumllt die
wesentlichen Teilschritte bei der Durchfiihrung einer Faktorenanalyse und ist unshyten als Ablaufdiagramm dargestellt Entsprechend diesem Ablaufdiagramm sind die nachfolgenden Betrachtungen aufgebaut Allerdings ist zu beachten daszlig sich bei konkreten Anwendungen der Faktorenanalyse insbesondere die Schritte (2) und (3) gegenseitig bedingen und nur schwer voneinander trennen lassen Aus dishydaktischen Gruumlnden wurde hier aber eine Trennung vorgenommen
bull Abbildung 58 Ablauf einer Faktorenanalyse
(1) Variablenauswahl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitaumlten
(4) Zahl der Faktoren
(5) Faktorinterpretation
(6) Bestimmung der Faktorwerte
Vorgehensweise 269
52 Vorgehensweise
5 Variablenauswahl und Errechnung der Korrelationsmatrix
Die Guumlte der Ergebnisse einer Faktorenanalyse ist von der Zuverlaumlssigkeit der Ausgangsdaten abhaumlngig Es muszlig deshalb besondere Sorgfalt auf die Wahl der Unshytersuchungsmerkmale verwendet werden Insbesondere
~ (2) Extraktion der Faktoren I
(3) Bestimmung der Kommunalitaumlten
u
(6) Bestimmung der Faktorwerte
ist darauf zu achten daszlig die erhobenen Merkmale auch fuumlr den Untersuchungsgegenstand relevant sind Irreleshyvante Merkmale sind vorab auszusortieren sowie als aumlhnlich erachtete Kriterien muumlssen zusammengefaszligt werden Insbesondere bei der Formulierung von Befragungsitems ist darauf zu achten daszlig bereits die Wortwahl der Fragestellungen das Antwortverhalten der Befragten und damit die Streuung der Daten beeinfluszligt Weiterhin sollten die Befragten einer rnoumlgshylichst homogenen Stichprobe entstammen da die Houmlhej bull
der KorrelatIOnen ZWischen den Untersuchungsmerk- malen (Variablen) durch den Homogenitaumltsgrad der Befragungsstichprobe beeinshyfluszligt wird
Die oben aufgezeigten Sachverhalte schlagen sich insgesamt in den Korrelashytionen nieder die als Maszlig fuumlr den Zusammenhang zwischen Variablen errechnet werden Es wurden deshalb Pruumlfkriterien entwickelt die es erlauben Variablenshyzusammenhaumlnge auf ihre Eignung fuumlr eine Faktorenanalyse zu uumlberpruumlfen Wir werden deshalb im folgenden zunaumlchst auf die Ermittlung von Korrelationen naumlher eingehen und sodann ausgewaumlhlte (statistische) Pruumlfkriterien erlaumlutern
5211 Korrelationsanalyse zur Aufdeckung der Variablenzusammenhaumlnge
Faktoren die als hinter den Variablen stehende Groumlszligen angesehen werden reshypraumlsentieren den Zusammenhang zwischen verschiedenen Ausgangsvariablen Beshyvor solche Faktoren ennittelt werden koumlnnen ist es zunaumlchst erforderlich die Zushysammenhaumlnge zwischen den Ausgangsvariablen meszligbar zu machen Als meshythodisches Hilfsmittel wird hierzu die Korrelationsrechnung herangezogen
Bereits anhand der Korrelationen laumlszligt sich erkennen ob Zusammenhaumlnge zwishyschen Paaren von Variablen bestehen so daszlig Variablen als voneinander abhaumlngig und damit als buumlndelungsfaumlhig angesehen werden koumlnnen
Fuumlr die Mittelwertmatrix (Abbildung 54) in obigem Beispiel laumlszligt sich zB die Korrelation zwischen x 1 (Anteil ungesaumlttigter Fettsaumluren) und x2 (Kaloriengehalt) wie folgt berechnen
~ IV taAtvJuAtJ(U)0
Korrelationskoeffizient
K 2(Xkl-XI)(XkZ -X2)
k = I (1)r = -===========XX2 I K K
2 (Xkl _X))2 2(XkZ -X2Y k = I k = I
mit
Auspraumlgung der Variablen I bei Objekt k (in unserem BeispielXkl laumluft k von 1 bis 6 (6 Markenraquo Mittelwert der Auspraumlgung von Variable 1 uumlber alle Objekte k Xl Auspraumlgung der Variablen 2 bei Objekt k xkZ Mittelwert der Auspraumlgung von Variable 2 uumlber alle Objekte k X2
Setzt man in Formel (1) die entsprechenden Werte der Ausgangsdatenmatrix ein so ergibt sich ein Korrelationskoeffizient von rbullbull =071176 Um die im einshy
1 2
zeInen notwendigen Rechenschritte zu erleichtern bedient man sich zurErmittlung der Korrelationskoeffizienten am besten der Hilfstabelle (Abbildung 59) Dabei stellt Xl den Mittelwert uumlber alle Marken rur die Eigenschaft Ungesaumlttigte Fettshy
saumluren ((1+2+4+5+2+36=283) und X2 ftlr die Eigenschaft Kaloriengeshy
halt ((1+6+5+6+3+46=417) dar
Abbildung 59 Hilfstabelle zur Berechnung eines Korrelationskoeffizienten
(x-l() (x-llt) (x-x)(x-J()(x -x) (x-llt)
336110 1002780 580555183333 -316667Rama 336110 middot152777-083333 183333 069444Sanella 069444 097222116667 063333 136112Becel 336110 397222216667 183333 469446Du darfst 097222middot083333 -116667 069444 136111Holt Butter 002778 -002778016667 -016667 002778Weihnechtsbutter
1083334 1883333 1016666 ----__----~--------__~-~~------_
(xx) I6 (xx) I6
(x-i)(xx) k=1 k=1
1016664r =VOuml8333011883333 =071176
Berechnet man die Korrelationskoeffizienten uumlber alle Eigenschaften ergibt sich rur die Mittelwertmatrix die in Abbildung 510 abgebildete Korrelationsmatrix
vorgenenswelse L 1
Abbildung 510 Korrelationsmatrix rur das 6-Produkte-Beispiel
UNGEFETI KALORlEN VITAMIN HALTBARK PREIS
-------------------- ---_--- ----------UNGEFETT 100000 KALORlEN 071176 100000
VITAMIN Q~~Pplusmn _QJQ~~__ 19PPQQ __ HALTBARK 010894 013771 007825 ri~oumloumloumloumloumlmiddot-------------------
PREIS 004385 006652 002362 098334 100000
In der Regel empfiehlt es sich die Ausgangsdatenmatrix vorab zu standardisieren da dadurch
- die Korrelationsrechnung und die im Rahmen der Faktorenanalyse erforderlishychen Rechenschritte erleichtert werden
- Interpretationserleichterungen erzielt werden - eine Vergleichbarkeit der Variablen ermoumlglicht wird die in unterschiedlichen
Maszligeinheiten erhoben wurden (zB Einkommen gemessen in Euro und Verkauf von Guumltern in Stck)
Eine Standardisierung der Datenmatrix erfolgt durch die Bildung der Differenz zwischen dem Mittelwert und dem jeweiligen Beobachtungswert einer Variablen sowie der anschlieszligenden Division durch die Standardabweichung Dadurch wird sichergestellt daszlig der neue Mittelwert gleich Null und die Standardabweichung einer Variablen gleich Eins ist Die Werte einer standardisierten Datenmatrix beshyzeichnen wir im folgenden nicht mehr mit x sondern mit z
Standardisierte Variable
Xk -x Zkj = J j
Sj
mit
Xkj BeobachtungSlVert der Variablenj bei Objekt k
Xj Durchschnitt aller Beobachtungswerte der Variablenj uumlber alle Objekte
s j Standardabweichung der Variablen j
Zkj Standardisierter Beobachtungswert der Variablen j bei Objekt k
Aus der standardisierten Datenmatrix ergibt sich auch eine einfachere Berechnung der Korrelationsmatrix R nach folgender Formel
R=_I_ZmiddotZ (2)K-I
272 Faktorenanalyse Vorgehensweise 273
wobei Z die transponierte Matrix der standardisierten Ausgangsdatenmatrix Z darstellt
Der Leser moumlge selbst anhand des Beispiels die Guumlltigkeit der Formel uumlberpruumlshyfen Dabei wird klar werden daszlig die Korrelationsmatrix auf Basis der Ausshygangsdaten identisch ist mit der Korrelationsmatrix auf Basis der standardisierten Daten Wird die Korrelationsmatrix aus standardisierten Daten errechnet so sind in diesem Falle Varianz-Kovarianzmatrix und Korrelationsmatrix identisch Fuumlr den Korrelationskoeffizienten laumlszligt sich auch schreiben
S 1middot2 SI ( - )( - )rx =-- mit x x =--t xkl-x Xk2-x 2
1 2 S S Imiddot 2 K -1 k XI X2
Da wegen der Standardisierung die beiden Varia~zen im Nenner 1 sind folgt daszlig Korrelationskoeffizient und Kovarianz SIX2) identisch sind
Die Korrelationsmatrix zeigt dem Anwender auf welche Variablen der Ausgangsshybefragung offenbar mit welchen anderen Variablen dieser Befragung irgendwie zusammenhaumlngen Sie zeigt ihm jedoch nicht ob
I die Variablen sich gegenseitig bedingen
oder
2 das Zustandekommen der Korrelationswerte durch einen oder mehrere hinter den zusammenhaumlngenden Variablen stehenden Faktoren bestimmt wird
Angesichts der beiden klar trennbaren Bloumlcke der Korrelationsmatrix (vgL die abshygegrenzten Vierecke) laumlszligt sich vermuten daszlig die Variablen XI bis x3 und x4xS durch zwei Faktoren erklaumlrt werden koumlnnten
Ausgehend von dieser Hypothese stellt sich unmittelbar die Frage mit welchem Gewicht denn die beiden Faktoren an der Beschreibung der beobachteten Zusamshymenhaumlnge beteiligt sind Es ist ja denkbar daszlig der Faktor Gesundheit als alleinishyger Beschreibungsfaktor filr die Variablen Xl bis x3 fast filr die gesamten Untershyschiede in der Ausgangsbefragung verantwortlich ist Es kann aber auch sein daszlig er nur einen Teil der unterschiedlichen Beurteilungen in der Ausgangsbefragung erklaumlrt Die groumlszligere oder geringere Bedeutung beider Faktoren laumlszligt sich in einer Gewichtszahl ausdrucken die im Rahmen einer Faktorenanalyse auch als Eigenshywert bezeichnet wird
5Ul Eignung der Korrelationsmatrix
Zu Beginn des Abschnittes 521 hatten wir bereits darauf hingewiesen daszlig sich die Eignung der Ausgangsdaten filr faktoranalytische Zwecke in der Korrelatishyonsmatrix widerspiegelt Dabei liefern bereits die Ausgangsdaten selbst einen Anshyhaltspunkt zur Eignungsbeurteilung der Daten zum Zwecke der Faktorenanalyse da die Houmlhe der Korrelationskoeffizienten durch die Verteilung der Variablen in der Erhebungsgesamtheit (Symmetrie Schiefe und Woumllbung der Verteilung) beeinfluszligt wird Liegt einer Erhebung eine heterogene Datenstruktur zugrunde so
macht sich dies durch viele kleine Werte in der Korrelationsmatrix bemerkbar II womit eine sinnvolle Anwendung der Faktorenanalyse in Frage gestellt ist Es ist
deshalb vorab eine Prufung der Variablen auf Normalverteilung ZUmindest aber auf Gleichartigkeit der Verteilungen empfehlenswert obwohl die Faktorenanalyseselbst keine Verteilungsannahmen setzt
Bezogen auf unser 6-Produkte-Beispiel treten neben sehr hohen Werten (gt 07) insbesondere im unteren Teil der Matrix kleine Korrelationen auf (vgl Abbildung 510) so daszlig die Korrelationsmatrix selbst kein eindeutiges Urteil uumlber die Eigshynung der Daten zur Faktorenanalyse zulaumlszligt
Es ist deshalb zweckmaumlszligig weitere Kriterien zur Pruumlfung heranzuziehen Hierzu bieten sich insbesondere statistische Prufkriterien an die eine Uumlberpruumlfung der Korrelationskoeffizienten auf Eignung zur Faktorenanalyse ermoumlglichen Es ist durchaus empfehlenswert mehr als ein Kriterium zur faktoranalytischen Eignung der Datenmatrix anzuwenden da die verschiedenen Kriterien unterschiedliche Vor- und Nachteile haben Im einzelnen werden durch SPSS folgende Kriterien bereitgestellt
Signifikanzniveaus der Korrelationen
Ein Signifikanzniveau uumlberpruumlft die Wahrscheinlichkeit mit der eine ZUvor formushylierte Hypothese zutrifft oder nicht Fuumlr alle Korrelationskoeffizienten lassen sich die Signifikanzniveaus anfilhren Zuvor wird eine sogenannte Ho-Hypothese forshymuliert die aussagt daszlig kein Zusammenhang zwischen den Variablen besteht Das Signifikanzniveau des Korrelationskoeffizienten berechnet anschlieszligend mit welshycher Irrtums wahrscheinlichkeit eben diese Ho-Hypothese abgelehnt werden kann Ein beispielhaftes Signifikanzniveau von 000 bedeutet daszlig mit dieser Irrtumsshywahrscheinlichkeit die Ho-Hypothese abgelehnt werden kann sprich zu 00 wird sich der Anwender taumluschen wenn er von einem Zusammenhang ungleich Null zwischen den Variablen ausgeht Anders ausgedruckt Mit einer Wahrscheinlichshykeit von 100 wird sich die Korrelation von Null unterscheiden
Abbildung 511 Signifikanzniveaus der Korrelationskoeffizienten im 6-ProdukteshyBeispiel
KOrrelatlonmatrix
UNGEFETT KALORIEN VITAMIN HALTBARKISignIfikanz (l-seitlg) UNGEFETT PREIS05632 00111 411lSZ 46713KAlORIEN 05632 05924 39737 45018VITAMIN 00111 05924 44144 49229HALTBARK 41862 39737 44144 00021PREIS 46713 45018 48229 00021
Fuumlr unser Beispiel zeigt Abbildung 511 daszlig sich genau diejenigen Korrelationsshykoeffizienten signifikant von Null unterscheiden (niedrige Werte in Abbildung 511) die in Abbildung 510 hbhe Werte (gt 07) aufweisen waumlhrend die Korrelashy
f
274 Faktorenanalyse
tionskoeffizienten mit geringen Werten auch ein hohes Signifikanzniveau (Wertegt 04) besitzen Das bedeutet daszlig sich ZB die Korrelation zwischen den Variablen Vitamingehalt und Haltbarkeit nur mit einer Wahrscheinlichkeit von (1- 044 =) 56 von Null unterscheidet
Inverse der Korrelationsmatrix
Die Eignung einer Korrelationsmatrix fuumlr die Faktorenanalyse laumlszligt sich weiterhin an der Struktur der Inversen der Korrelationsmatrix erkennen Dabei wird davon ausgegangen daszlig eine Eignung dann gegeben ist wenn die Inverse eine Diagoshynamatrix darstellt d h die Nicht-diagonal-Elemente der inversen Korrelatishyonsmatrix moumlglichst nahe bei Null liegen Fuumlr das 6-Produkte-Beispiel zeigt Abbildung 512 daszlig insbesondere fuumlr die Werte der Variablen Ungesaumlttigte Fettshysaumluren und Vitamingehalt sowie Haltbarkeit und Preis hohe Werte auftreshyten waumlhrend alle anderen Werte relativ nahe bei Null liegen Es existiert allerdings kein allgemeinguumlltiges Kriterium dafuumlr wie stark und wie haumlufig die Nicht-diashygonal-Elemente von Null abweichen duumlrfen
Abbildung 512 Inverse der Korrelationsmatrix im 6-Produkte-Beispie1
Inverse KorrelationsmatrIx
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS UNIiIIt
KALORIEN VITAMIN
HALTBARK
PREIS
1449910 -60678
-1319772 -558018 520353
-60678 217944 -82863
-218066 204555
-1319772 -82863
1400000 479257
-440959
-558018 -218066 479257
3817871 -3126624
520353 204555
-440959 -3726624 3738542
Bartlett-Test (test of spherlcity)
Der Bartlett-Test uumlberpruumlft die Hypothese ob die Stichprobe aus einer Grundgeshysamtheit entstammt in der die Variablen unkorreliert sinds
Gleichbedeutend mit dieser Aussage ist die Frage ob die Korrelationsmatrix nur zuflillig von einer Einheitsmatrix abweicht da im Falle der Einheitsmatrix alle Nicht-diagonal-Elemente Null sind d h keine Korrelationen zwischen den Varishyablen vorliegen Es werden folgende Hypothesen formuliert
HO Die Variablen in der Erhebungsgesamtheit sind unkorreliert
H1 Die Variablen in der Erhebungsgesamtheit sind korreliert
Der Bartlett-Test setzt voraus daszlig die Variablen in der Erhebungsgesamtheit einer Normaverteiung folgen und die entsprechende Pruumlf groumlszlige annaumlhernd ChishyQuadrat-verteilt ist Letzteres aber bedeutet daszlig der Wert der Pruumlfgroumlszlige in hohem
5 Vgl Dziuban C DlShirkey E C 1974 S 358 ff bull
Vorgehensweise 275
Maszlige durch die Groumlszlige der Stichprobe beeinfluszligt wird Fuumlr unser Beispiel erbrachshyte der Bartlett-Test eine Pruumlfgroumlszlige von 17371 bei einem Signifikanzniveau von 00665 Das bedeutet daszlig mit einer Wahrscheinlichkeit von (1- 00655=)9345
davon auszugehen ist daszlig die Variablen der Erhebungsgesamtheit korreliert sind Setzt man als kritische Irrtumswahrscheinlichkeit einen Wert von 005 fest so waumlshyre fuumlr unser Beispiel die Nullhypothese anzunehmen und folglich die Korrelatishyonsmatrix nur zufaumlllig von der Einheitsmatrix verschieden Das laumlszligt dann den Schluszlig zu daszlig die Ausgangsvariablen in unserem Fall unkorreliert sind
Allerdings sei an dieser Stelle nochmals darauf hingewiesen daszlig die Anwenshydung des Bartlett-Tests eine Pruumlfung der Ausgangsdaten auf Normalverteilung voraussetzt die in unserem Fall noch erfolgen muumlszligte
Anti-Image-Kovarianz-Matrix
Der Begriff Anti-Image stammt aus der Image-Analyse von Guttmann6 Guttrnann geht davon aus daszlig sich die Varianz einer Variablen in zwei Teile zerlegen laumlszligt das Image und das Anti-Image
Das Image beschreibt dabei den Anteil der Varianz der durch die verbleibenden Variablen mit Hilfe einer multiplen Regressionsanalyse (vgl Kapitel 1) erklaumlrt werden kann waumlhrend das Anti-Image denjenigen Teil darstellt der von den uumlbrishygen Variablen unabhaumlngig istlDa die Faktorenanalyse unterstellt daszlig den Variabshylen gemeinsame Faktoren zugrunde liegen ist es unmittelbar einsichtig daszlig Varishyablen nur dann fuumlr eine Faktorenanalyse geeriiet sind wenn das Anti-Image der Variablen moumlglichst gering ausflilltDas ab bedJJltet daszlig die Nicht-diagonalshyElemente der Anti-Image-Kovarianz-Matrix m glichst nahe bei Null liegen muumlsshysen bzw diese Matrix eine Diagonamatrix darstellen sollte Fuumlr das 6-ProdukteshyBeispiel zeigt Abbildung 513 daszlig die Forderung nach einer Diagonalmatrix ershyfiiHt ist
Abbildung 513 Anti-Image-Kovarianz-Matrix im 6-Produkte-Beispiel
AnIlJmIU_atrIzen
UNGEFETT KALORIEN VITAMIN HALTBARKi Arililinage-lltovananz PREISUNuumll1 06897 -01920 -06502 -01008 00960KAlORIEN -01920 45883 -02716 -02621 02511VITAMIN -06502 02716 07143 00897 -00842HALTBARK -01008 02621 00697 02619 -02611PREIS 00960 02511 -00842 middot02611 02675
Als Kriterium dafilr wann die Forderung nach einer Diagonalmatrix erfuumlllt ist schlagen Dziuban und Shirkey vor die Korrelationsmatrix dann als fuumlr die Fakshytorenanalyse ungeeignet anzusehen wenn der Anteil der Nicht-diagonal-Elemente die ungleich Null sind (gt 009) in der Anti-Image-Kovarianzmatrix (AIC) 25
Vgl Guttmann L 1953 S 277 ff
LIO r aKlOrenanalyse
oder mehr betraumlgt7 Das trifft in unserem Fall filr keines der Nicht-diagonalshyElemente der Ale-Matrix zu womit nach diesem Kriterium die Korrelationsmatrix filr faktoranalytische Auswertungen geeignet ist
Kaiser-Meyer-Olkin-Kriterium
Waumlhrend die Uumlberlegungen von Dziuban und Shirkey auf Plausibilitaumlt beruhen haben Kaiser Meyer und Olkin versucht eine geeignete Pruumlfgroumlszlige zu entwickeln und diese zur Entscheidungsfindung heranzuziehen Sie berechnen ihre PTUumlfgroumlszlige die als measure 0sampling adequacy (MSA) bezeichnet wird auf Basis der Anshyti-Image-KorrelationsmatrixbullDas MSA-Kriterium zeigt an in welchem Umfang die Ausgangsvariablen zusammengehoumlren und dient somit als Indikator dafilr ob eine Faktorenanalyse sinnvoll erscheint oder nichtDas MSA-Kriterium erlaubt sowohl eine Beurteilung der Korrelationsmatrix insgesamt als auch einzelner Varishyablen sein Wertebereich liegt zwischen degund 1 Kaiser und Rice schlagen folgenshy
8de Beurteilungen vor
MSA 2 09 marvelous (erstaunlich) MSA 2 08 meritorious (verdienstvoll) MSA 2 07 middling (ziemlich gut) MSA 2 06 mediocre (mittelmaumlszligig) MSA 2 05 miserable (klaumlglich) MSA lt05 unacceptable (untragbar)
Sie vertreten die Meinung daszlig sich eine Korrelationsmatrix mit MSA lt 05 nicht rur eine Faktorenanalyse eignet9 Als wuumlnschenswert sehen sie einen Wert von MSA 2 08 an lO In der Literatur wird das MSA-Kriterium das auch als KaisershyMeyer-Olkin-Kriterium (KMK) bezeichnet wird als das beste zur Verrugung steshyhende Verfahren zur Pruumlfung der Korrelationsmatrix angesehen weshalb seine Anwendunrvor der Durchfuhrung einer Faktorenanalyse auf jeden Fall zu empshyfehlen ist 1
Bezogen auf unser 6-Produkte-Beispiel ergab sich rur die Korrelationsmatrix insgesamt ein MSA-Wert von 0576 womit sich rur unser Beispiel ein riur klaumlglishyches Ergebnis ergibt Daruumlber hinaus gibt SPSS in der Diagonalen der AntishyImage-Korrelationsmatrix aber auch das MSA-Kriterium rur die einzelnen Variabshylen an
7 Vgl Dziuban C DlShirkey E C 1974 S 359
8 Vgl Kaiser H FRice J 1974 S 111 ff
9 Vgl Cureton E EDAgostino R B 1983 S 389 f
10 Vgl Kaiser H F 1970 S 405
II Vgl Stewart D W 1981 S 57 f Dziuban C DlShirkey E C 1974 S 360 f
Vorgehensweise 277
Abbildung 514 Anti-Image-Korrelations-Matrix im 6-Produkte-Beispiel
Antllmlge-Matrlun
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS AntI-lmageMrrelilllOn UNGEFETT 59680middot 10794 -92633 -23717 22350
KALORIEN -10794 87789 -15001 -23906 22661 VITAMIN -92633 -15001 59755 20730 -19274 HALTSARK -23717 -23906 20730 47060 -98640 PREIS 22350 22561 -19274 -95640 45701
8 Maszlig der StlchplObenelgnung
Abbildung 514 macht deutlich daszlig lediglich die Variable Kaloriengehalt mit einem MSA-Wert von 087789 als verdienstvoll anzusehen ist waumlhrend alle uumlbshyrigen Variablen eher klaumlgliche oder untragbare Ergebnisse aufweisen Die vashyriablenspezifischen MSA-Werte liefern damit rur den Anwender einen Anshyhaltspunkt dafuumlr welche Variablen aus der Analyse auszuschlieszligen waumlren wobei sich ein sukzessiver Ausschluszlig von Variablen mit jeweiliger Pruumlfung der vorgeshystellten Kriterien empfiehlt
522 Extraktion der Faktoren
(4) Zahl der Faktoren
(5) Faktorinterp~etat~ (6) Bestimmung der
Faktorwerte
Die bisherigen Ausruhrungen haben verdeutlicht daszlig bei Faktorenanalysen groszlige Sorgfalt auf die Wahl der Untersuchungsmerkmale und -einheiten zu verwenden ist da durch die Guumlte der Korrelationsmatrix die den Startpunkt der Faktorenanalyse darstellt alle Ershygebnisse der Faktorenanalyse beeinfluszligt werden Im folgenden ist nun zu fragen wie denn nun die Faktoren rein rechnerisch aus den Variablen ermittelt werden koumlnnen Wir werden im folgenden zunaumlchst das Funshydamentaltheorem der Faktorenanalyse darstellen und anschlieszligend die Extraktion auf graphischem Wege plausibel machen Auf die Unterschiede zwischen konkreten (rechnerischen) Faktorextraktionsverfahren gehen wir dann im Zusammenhang mit der Bestimshymung der Kommunalitaumlten (Abs~hnitt 523) ein
278 Faktorenanalyse
5221 Das FundamentaItheorem
Waumlhrend die bisherigen Uumlberlegungen die Ausgangsdaten und ihre Eignung fuumlr faktoranalytische Zwecke betrafen stellt sich nun die Frage wie sich die Faktoren rechnerisch aus den Variablen ennitteln lassen Zu diesem Zweck geht die Faktoshyrenanalyse von folgender grundlegenden Annahme aus
Jeder Beobachtungswert einer Ausgangsvariablen Xj oder der stanshydardisierten Variablen Zj laumlszligt sich als eine Linearkombination mehshyrerer (hypothetischer) Faktoren beschreiben
Mathematisch laumlszligt sich dieser Zusammenhang wie folgt fonnulieren
(3a)Xkj =ajl Pkl +ap PIa + +ajQ PkQ
bzw fuumlr standardisierte x-Werte
(3b)Zkj=ajIPkl+a j2middotPIa+middot+a jQmiddotPkQ=iajqPkq
q~l
Die obige Fonnel (3b) besagt fuumlr das 2-Faktorenbeispiel nichts anderes als daszlig zB die standardisierten Beobachtungswerte fuumlr Anteil ungesaumlttigter Fettsaumluren und Vitamingehalt beschrieben werden durch die Faktoren P 1 und P2 so wie sie im Hinblick auf Marke k gesehen wurden ltPIel bzw Pk2) jeweils multipliziert mit ihren Gewichten bzw Faktorenladungen beim Merkmal j also fuumlr Faktor 1 ajl und
fuumlr Faktor 2 a2 Oie Faktorradung gibt dabei an wieviel ein Faktor mit einer Ausgangsvariablen
zu tun hat Im mathematisch-statistischen Sinne sind Faktorladungen nichts andeshyres als eine Maszliggroumlszlige fuumlr den Zusammenhang zwischen Variablen und Faktor und das ist wiederum nichts anderes als ein Korrelationskoeffizient zwischen Fakshytor und Variablen
Um die Notation zu verkuumlrzen schreibt man haumlufig den Ausdruck (3b) auch in Matrixschreibweise Identisch mit Fonnel (3b) ist daher auch folgende Mashytrixschreibweise die die Grundgleichung der Faktorenanalyse darstellt
(3c)Z=pmiddotA
Aufbauend auf diesem Grundzusammenhang laumlszligt sich dann auch eine Rechenshyvorschrift ableiten die aufzeigt wie aus den erhobenen Daten die vennuteten Fakshytoren mathematisch ennittelt werden koumlnnen
Wir hatten gezeigt daszlig die Korrelationsmatrix R sich bei standardisierten Daten wie folgt aus der Datenmatrix Z ennitteln laumlszligt
R=_I_ZZ (2) K-l
Vorgehensweise 279
Da Z aber im Rahmen der Faktorenanalyse durch P A beschrieben wird (Z =PA) ist in (2) Z durch Fonnel (3c) zu ersetzen so daszlig sich folgende Fonnet
ergibt
R=_I_PA)PA) (4)K I
Nach Aufloumlsung der Klammem ergibt sich nach den Regeln der Matrixmultiplishykation
r------- R=_I_APPA=A-I_pPA (5)
K-I ~
~
Da alle Daten standardisiert sind laumlszligt sich der _1_ ptP Ausdruck in Formel (5)K-l ----y---J
auch als K(Jrrelationsmatrix der Faktoren (C) bezeichnen (vgl Fonnel (2raquo so daszlig sich schreiben laumlszligt
R = AmiddotCmiddotA (6)
Da die Faktoren als unkorreliert angenommen werden entspricht C einer Einheitsshymatrix (einer Matrix die auf der Hauptdiagonalen nur Einsen und sonst Nullen enthaumllt) Da die Multiplikation einer Matrix mit einer Einheitsmatrix aber wieder die Ausgangsmatrix ergibt vereinfacht sich die Fonnel (6) zu
R = AmiddotA (7)
Die Beziehungen (6) und (7) werden von Thurstone als das Fundamentaltheorem der Faktorenanalyse bezeichnet da sie den Zusammenhang zwischen Korrelatishyonsmatrix und Faktorladungsmatrix beschreiben
Das Fundarnentaltheorem der Faktorenanalyse besagt nicht anderes als daszlig sich die Korrelationsmatrix durch die Faktorladungen (Matrix A) und die Korrelationen zwischen den Faktoren (Matrix C) reproduzieren laumlszligt Fuumlr den Fall daszlig man von unabhaumlngigen (orthogonalen) Faktoren ausgeht reduziert sich das Funshydamentaltheorem auf Fonnel (7) Dabei muszlig sich der Anwender allerdings bewuszligt sein daszlig das Fundamentaltheorem der Faktorenanalyse nach Fonnel (7) stets nur unter der Praumlmisse einer Linearverknuumlpfung und Unabhaumlngigkeit der Faktoren Guumlltigkeit besitzt
5222 Graphische Interpretation von Faktoren
Der Infonnationsgehalt einer Korrelationsmatrix laumlszligt sich auch graphisch in einem Vektor-Diagramm darstellen in dem die jeweiligen Korrelationskoeffizienten als Winkel zwischen zwei Vektoren dargestellt werden Zwei Vektoren werden dann
280 Faktorenanalyse
als linear unabhaumlngig bezeichnet wenn sie senkrecht (orthogonal) aufeinander steshyhen Sind die beiden betrachteten Vektoren (Variablen) jedoch korreliert ist der Korrelationskoeffizient also C 0 zB 05 dann wird dies graphisch durch einen Winkel von 60deg zwischen den beiden Vektoren dargestellt
Es stellt sich die Frage Warum entspricht ein Korrelationskoeffizient von 05 genau einem Winkel von 60deg Die Verbindung wird uumlber den Cosinus des jeshy
weiligen Winkels hergestellt Verdeutlichen wir uns dies anhand des Ausgangsbeispiels (Abbildung 515)
In Abbildung 515 repraumlsentieren die Vektoren AC und AB zB die beiden Vashyriablen Kaloriengehalt und Vitamingehalt Zwischen den beid~_yariablen moumlge eine Korrelation von 05 gemessen worden sein Der Vektor AC der den Kaloriengehalt repraumlsentiert und der genau wie AB aufgrund der Standardisierung eine Laumlnge von 1 hat weist zu AB einen Winkel von 60deg auf Der Cosinus des Winkels 60deg der die Stellung der beiden Variablen zueinander (ihre Richtung) anmiddot gibt ist definiert als Quotient aus Ankathete und Hypothenuse also als AD AC Da AC aber gleich 1 ist ist der Korrelationskoeffizient identisch mit der Strecke
AD Wie Abbildung 516 ausschnitthaft zeigt ist zB der Cosinus eines 60deg-Winkels
gleich 05 Entsprechend laumlszligt sich jeder beliebige Korrelationskoeffizient zwischen zwei Variablen auch durch zwei Vektoren mit einem genau definierten Winkel zushyeinander darstellen Verdeutlichen wir uns dies noch einmal anband einer Korrelamiddot tionsmatrix mit drei Variablen (Abbildung 517)
Abbildung 515 Vektordarstellung einer Korrelation zwischen zwei Variablen
c
A 0 B
)V
Standardisierte LOnge von 1
Vorgehensweise 281
Abbildung 516 Werte rur den Cosinus (entnommen aus Geliert W JKuumlstnerHlHellwich MfKaumlstner H Kleine Enzyshyklopaumldie Mathematik Leipzig 1969 S 799)
Grad CO Grad cO
45 07071 90 00000 44 7193 89 0175 43 7314 88 0349 42 7431 87 0523 41 7547 86 0698 40 07660 85 0872 39 7771 84 1045 38 7880 83 1219 37 7986 82 1392 36 8090 81 1564 35 8192 80 01736 34 8290 79 1908 33 8387 78 2079 32 8480 77 2250 31 8572 76 2419 30 08660 75 2588 29 8746 74 2756 28 8829 73 2924 27 8910 72 3090 26 8988 71 3256 25 9063 70 03420 24 9135 69 3584 23 9205 68 3746 22 9272 67 3907 21 9336 middot66 4067 ZO 09397 65 4226 19 9455 64 4384 18 9511 63 4540 17 9563 62 4695 16 9613 61 4848 15 9659 60 05000 14 9703 59 5150 13 9744 58 5299 12 9781 57 5446 11 9816 56 5592 10 09848 55 5736 9 9877 54 5878 8 9903 53 6018 7 9925 52 6157 6 9945 51 6293 5 9962 50 06428 4 9976 49 6561 3 9986 48 6691 2 9994 47 6820 1 9998 46 6947 0 10000 45 7071
282 Faktorenanalyse
Abbildung 517 Korrelationsmatrix
R =r68660 1 06428lO1736 ~
R laumlszligt sich auch anders schreiben (vgl Abbildung 518)
Abbildung 518 Korrelationsmatrix mit Winkelausdrucken
l0deg R = 30deg 0deg
80deg 50deg 0deg
Der Leser moumlge die entsprechenden Werte selbst in einer Cosinus-Tabelle uumlbershy
pruumlfenDie der oben gezeigten Korrelationsmatrix zugrundeliegenden drei Variablen
und ihre Beziehungen zueinander lassen sich relativ leicht in einem zweidimen sionalen Raum darstellen (Abbildung 519)
Abbildung 519 Graphische Darstellung des 3-Variablen-Beispiels
Vektor X2
Vektorx3Vektor Xl
Vorgehensweise 283
Je mehr Variable jedoch zu beruumlcksichtigen sind desto mehr Dimensionen werden benoumltigt um die Vektoren in ihren entsprechenden Winkeln zueinander zu positioshy
nieren Die Faktorenanalyse trachtet nun danach das sich uumlber die Korrelationsshykoeffizienten gemessene Verhaumlltnis der Variablen zueinander in einem moumlglichst gering dimensionierten Raum zu reproduzieren Die Zahl der benoumltigten Achsen gibt dann die entsprechende Zahl der Faktoren an
Wenn man die Achsen als Faktoren ansieht dann stellt sich unmittelbar die Frashyge Wie werden diese Achsen (Faktoren) in ihrer Lage zu den jeweiligen Vektoren (Variablen) bestimmt
Dazu vergegenwaumlrtigt man sich am besten das Bild eines halboffenen Schirmes Die Zacken des Schirmgestaumlnges die alle in eine bestimmte Richtung weisend die Variablen repraumlsentieren lassen sich naumlherungsweise auch durch den Schirmstock darstellen Vereinfacht man diese Uumlberlegung aus DarstellungsgrQnden noch weishyter auf den 2-Variablen-Fall wie in AbbiIdu8520 die einen Korrelationskoshyeffizienten von 05 fuumlr die durch die Vektoren OA und OB dargestellten Variablen repraumlsentiert dann gibt der Vektor OC eine zusammenfassende (faktorielle) Beshyschreibung wieder Die beiden Winkel von 30deg zwischen Vektor I bzw Vektor II und Faktor-Vektor geben wiederum an inwieweit der gefundene Faktor mit Vekshytor (Variable) I bzw II zusammenhaumlngt Sie repraumlsentieren ebenfalls Korrelationsshykoeffizienten und zwar die zwischen den jeweiligen Variablen und dem Faktor Diese Korrelationskoeffizienten hatten wir oben als Faktorladungen bezeichnet Die Faktorladungen des 1 Faktors betragen also in bezug auf Variable I und Varishyable II cos 30deg = 08660
Abbildung 520 FaktorlOsung bei 2 Variablen
j
A
Vektor x
~---------__------~---- C
Resultante
e Vektor X
284 Faktorenanalyse
5223 Das Problem der Faktorextraktion
Nachdem wir nun wissen was eine Faktorladung inhaltlich bedeutet ist zu fragen Wie findet man einen solchen Vektor (Faktor) der stellvertretend ftir mehrere zushysammenhaumlngende Variable fungieren kann Erinnern wir uns noch einmal des Ausgangsbeispiels Aufstrichfette waren nach den ftinfMerkmalen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt - Haltbarkeit - Preis bewertet worden l2
Aus dieser Bewertung sei die Korrelationsmatrix in Abbildung 521 berechnet worden
Abbildung 521 Spiegelbildlich identische KOlTelationsmatrix
x X x x x
x 70 100 09848 90middotX 03420 30x 00000 10middotx
X -01736
Diese Korrelationsmatrix enthaumllt in der unteren Dreiecks-Matrix die Korrelationsshywerte in der oberen (spiegelbildlich identischen) Dreiecks-Matrix die entshysprechenden Winkel Graphisch ist der Inhalt dieser Matrix in Abbildung 522 darshygestellt
Das Beispiel wurde so gewaumlhlt daszlig die Winkel zwischen den Faktoren in einer zweidimensionalen Darstellung abgebildet werden koumlnnen - ein Fall der in der Realitaumlt allerdings kaum relevant ist
Wie findet man nun den 1 Faktor in dieser Vektordarstellung Bleiben wir zunaumlchst bei der graphischen Darstellung dann sucht man den
Schwerpunkt aus den ftinf Vektoren Der Leser moumlge sich dazu folgendes verdeutlichen
In Abbildung 522 ist der Faktor nichts anderes als die Resultante der funfVektoshyren Wuumlrden die ftinfVektoren funf Seile darstellen mit einem Gewicht in 0 und jeweils ein Mann wuumlrde mit gleicher Staumlrke an den Enden der Seile ziehen dann wuumlrde sich das Gewicht in eine bestimmte Richtung bewegen (vgl die gestrichelte
12 Es werden hier andere Werte als im Ausgangsbeispiel verwendet um zunaumlchst eine einshydeutige graphische Loumlsung zu ermoumlglichen
Vorgehensweise 285
Linie in Abbildung 523) Diesen Vektor bezeichnen wir als Resultante Er ist die graphische Repraumlsentation des 1 Faktors
Abbildung 522 Graphische Darstellung des 5-Variablen-Beispiels
~
XsXl
bull
Abbildung 523 Graphische Darstellung des Schwerpunktes
X2
XIX
Faktorshyvektor2
Betrachtet man nun die jetzt gebildeten Winkel zwischen dem 1 Faktor und den Ausgangsvektoren dann hat man auch die gesuchten Faktorladungen gefunden
(Erste Reshysultante)
4512
-------o
- -
286 Faktorenanalyse
Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen
Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben
Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge
die Werte selbst uumlberpruumlfen)
Abbildung 524 Einfaktorielle Ladungsmatrix
Faktor
05707Xl 07046x2 bull 09668x3
08211x4
07096
Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)
Abbildung 525 ZweifaktorieHe Ladungsmatrix
Faktor 1 Faktor 2
Xl 05707 -08211
x2 07046 -07096
x3 09668 02554
x4 08211 05707
Xs 07096 07046
Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa
Vorgehensweise 287
In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum
I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1
~~ 00
2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation
Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist
Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt
Sf = 1 = Ijj (9)J
3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt
Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)
Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung
Resutlanie 2 (Faktor 2)
A Vektor x o
120lt= fH bull C Resultante 1 (Faktor 1)
B Vektor x
288 Faktorenanalyse
Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB
Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel
Wenn obige Behauptung stimmt muumlszligte gelten
(lOa)[~J +[~~J =1
Uumlberpruumlfung 2 2 uumlc2
OC 00 +002 (lOb)--+-shy 2
OA OA OA2 2
In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)
Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)
(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)
2 2 OC +00
4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten
sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)
wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-
q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1
(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix
(2) Extraktion der
(5) Faktorinterpretatiln
(6) Bestimmung der Faktorwerte
Vorgehensweise 289
523 Bestimmung der Kommunalitaumlten
In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem
Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy
fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig
mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da
J
i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins
Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung
erklaumlrte Variant
standardisierte Gesamtvariant = 1
290 Faktorenanalyse
Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung
2 a j1 =07
2 2 8 j2 = 01 siRest= 02
Kommunalitat H =08 (erllt1arte Varianz)
Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)
R AmiddotA+U (7a)
Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet
Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion
Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer
Vorgehensweise 291
100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY
In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy
weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen
Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen
1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen
2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit
2 2I ~ ~ R j ~ mx rjk
Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse
- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy
13 Vgl Loehlin J C 1998 S 154 14
Vgl Uberla K 1972 S 155 ff
292 Faktorenanalyse
nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird
- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit
Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy
15formationsverlust deklariert wird
Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen
Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy
15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt
Vorgehensweise 293
tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder
Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren
Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen
Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren
Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist
Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf
Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden
Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel
Kommunalltlten
Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325
Extraktionsmelhode Hauptachsen-Faktorenanalyse
bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix
294 Faktorenanalyse
Abbildung 530 Faktorladungen im 6-Produkte-Beispiel
Faktoranmatrixmiddot
Faktor
1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608
Extraktionsmethode Hauptachsen-Faktorenanalyse
a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt
Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert
Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel
Reproduzierte Korrelationen
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT
KALORIEN
VITAMIN
HALTBARK
PREIS
96845 71193 96034 11035 04241
71193 52552b
70480
12709
07717
96034 70480 95292b
08461 01722
11035
12709 08461 99056b
8325
04241 07717 01722 98325 98070b
Residuun1 UNGEFETi
KALORIEN
VITAMIN
HALTBARK
PREIS
-00017 00101
-00141 00144
-00017
-00083 01001
- 01005
00101 -00083
-00036 00640
-00141 01061
-00636
00010
00144 -01005 00640 00010
ExtrakHonsmethode Hauptllchsenfaktorenanalyse
a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005
b Reproduzierte Kommunalltaumlten
Vorgehensweise 295
Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen
Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R
524 Zahl der Faktoren
(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix
(2) Extraktion der Faktoren
(6) Bestimmung der Faktorwerte
Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff
Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-
q N
trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N
Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden
Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy
296 Faktorenanalyse
Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre
Abbildung 532 Bestimmung der Eigenwerte
Faktorenmatrix
Faktor
1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)
Eigenwerte 25068 19112
Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil
Kom munalltaumlten
Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807
- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren
V orgehensweise 297
Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung
Abbildung 534 Scree-Test im 6-Produkte-Beispiel
Eigen- Screeplot wert 30
25
20
15
Kaiser-Kriterium
10 1 Elbow5
00 2 3 4 5
Faktomummer
298 Faktorenanalyse
525 Faktorinterpretation
Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)
Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt
(1) Variablenauswalll und Errechnung der Korrelationsmalrix
(2) Extraktion der Faktoran
(3) Bestimmung der Kommunalltaumllen
(6) Bestimmung derFaktorwerte _______---11
middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull
geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht
Abbildung 535 Faktorladungen im 6-Produkte-Beispiel
Preis Haltbarkeit
Extraktionsmethode Hauptachsen-Faktorenanalyse
Vorgehensweise 299
Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist
Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig
Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16
Abbildung 536 Unrotierte Faktorladungen
F
F
Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung
Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f
300 Faktorenanalyse
536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy
tert
Abbildung 537 Rotierte Faktorladungen
F (Ausgangssituation)2
11 F2 (rotiert)
F1
-- shy
(Ausgangssituation)
11
F1 (rotiert)
SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen
1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen
(rechtwinkligen) Rotation
2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren
Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die
vorgenenswelse j U 1
Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind
Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel
Faktor
1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt
Haltbarkeit
72152 bull 07020
07962 I 99208 Preis 01060 99025
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung
Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen
A bull =A T mit TC~SI7 - sina ] sma cosa
Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links
A T A 094331 - 028039 098357 003229
[C0s341570 - sin34 157 ]070669 016156 072152 007020
sin34157deg cos34157092825 - 030210 097615 000694
038926 091599 007962 099208
032320 093608 001060 099025
Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)
Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix
Faktor 1 2
1 94868 31622
2 -31622 94868
Il
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung
Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig
von a=1843deg
526 Bestimmung der Faktorwerte
(1) Variablenauswanl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitaumlten
Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte
Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt
(3c)Z=PmiddotA
Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY
(12)Z AT1p AAT
Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt
(13)ZArl=pE
Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten
(3c) wird von rechts mit A multipliziert
ZmiddotA=PmiddotAmiddotA (15)
Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar
ZAmiddot(A At1=P(A A) (A Atl (16)
Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt
P=ZA(AAt l (17)
In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren
In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term
AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte
Abbildung 540 Koeffizientenmatrix der Faktorwerte
Faktor 1 2
Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression
Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die
xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf
SjDa p E=P ist ergibt sich
Seite 271 zu (14)
P=ZAT
304 Faktorenanalyse
Abbildung 541 Standardisierte Ausgangsdatenmatrix Z
45ampt6R4LJL4
Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542
Abbildung 542 Faktorwerte im 6-Produkte-Beispiel
Vorgehensweise 305
Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel
Du darfst
VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG
E 11 BecelS
U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T
Sanella IIII Holl Butter
-1
bull Rama
-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18
WIRTSCHAFTLICHKEIT
Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen
527 Zusammenfassende Darstellung der Faktorenanalyse
Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy
e Vorgehensweise 307 306 Faktorenanalyse
Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen
sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-
schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy
tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig
wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy
nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy
chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy
analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte
Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht
Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der
Verwendung des Verfahrens offenzulegen
I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _
CQ)l2CQgtQ ~ i
-Q)C t l5~11
0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C
CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O
~ ~ 11 t 3
uj~fi
t Imiddot~ J1 ~SHaa
It c~
c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~
-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi
o~ ~ -gEG)
I ~l c c ~l~ampi
2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E
U~a ]i E
J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy
~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--
----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt
Fallbeispiel 309308 Faktorenanalyse
Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert
531 Problemstellung
In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften
Variable und Objekte des BeispielsAbbildung 545
EigenschaftenMarken M k (k=I Il) xj(j=I IO)
A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado
5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H
I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama
Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist
Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)
Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern
Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse
---
310Faktorenanalyse
532 Ergebnisse
1 Variablenauswahl und Errechnung der Korrelationsmatrix
Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung
548 wiedergegeben
Abbildung 548 Die Korrelationskoeffizienten -_ -
-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy
In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der
Fallbeispiel 311
Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet
Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie
-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -
06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170
-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260
62444 -97126 66229 -83532 -62589
-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545
-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno
Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)
Abbildung 550 Dialogfeld Deskriptive Statistik
312 Faktorenanalyse
2 Bestimmung der Kommunalitilten
Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt
wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend
bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich
von den Startwerten abweichen
Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten
Hauptkomponentenanalyse Hauptachsenanalyse
Variable Korrunuriali- Kommunali- Korrununali- Kommunali-
Ut (Startwerte)
tlt (Endwerte)
tlIl (Startwerte )
tlIl (End werte)
STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR
100000 100000 100000 100000 100000 100000 100000 100000 100000 100000
88619
76855
89167 85324 76043 84012 80223 92668 63297 88786
97414
89018
79497
85847
96501
98810
97132
99166
78019
96445
85325
55717
85754
91075
55819
82330
73903
94796
40402
87851
Fallbeispiel 313
Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy
I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren
Abbildung 552 Dialogfeld Extraktion
Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist
3 Wabl der Extraktionsmetbode
Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen
4 Zabl der Faktoren
Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen
Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet
Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch
17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f
1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden
Erklaumlrte Gesamtvarianz
Anfaumlngliche Eigenwerte
314 Faktorenanalyse
Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy
den sich fUnfFaktoren ergeben
Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien
95) der Varianz erklaumlrt sind
2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)
3 Extrahiere n (zB 3) Faktoren
4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy
renzahl
5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein
6 Extrahiere alle Faktoren die nach der
Vom Computer automatisch verwandt wenn keine andere Spezifikation
Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden
Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden
Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist
Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt
Fallbeispiel 315
Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil
Faktor 1
2 3
4
5
6
7
8
9
10
Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden
Abbildung 555 Scree-Test und Kaiser-Kriterium
Eigen- -=gtcreeplot wert
5
4
3
2
10
o Kaisershy
~ 3 i i 7 i Q
Faktornummer
Gesamt 505188
177106
142700
81935
42961
24709
15928
06190
02943
00340
der Varianz 5051883
1771061
1427002
819349 429611
247085
159275
61902
29434
03398
Kumulierte 5051883
6822944
8249946
9069295
9498905
9745991
9905266
9967168
9996602
10000000
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
266 Faktorenanalyse
Werden die im Ausgang betrachteten Eigenschaften zu Faktoren zusammengefaszligt so ist unmittelbar einsichtig daszlig gegenuumlber der Mittelwertmatrix in Abbildung 54 ein weiterer Informationsverlust entsteht da idR weniger Faktoren alsursprilngshyliehe Eigenschaften betrachtet werden Dieser Informationsverlust ist darin zu seshyhen daszlig zum einen die Faktoren in der Summe nur weniger Varianz erklaumlren koumlnshynen als die fuumlnf Ausgangsvariablen und zum anderen die Varianz einer jeden Ausshygangs groumlszlige in der Erhebungsgesamtheit ebenfalls durch die Faktoren idR nicht vollstaumlndig erklaumlrt werden kann Der Verlust an erklaumlrter Varianz wird im Rahmen der Faktorenanalyse zugunsten der Variablenverdichtung bewuszligt in Kauf genomshymen Allerdings muszlig sich der Anwender vorab uumlberlegen in welchem Ausmaszlig dieser Erklaumlrungsverlust (im Sinne eines Varianzverlustes) bei den einzelnen Ausshygangsvariablen toleriert bzw wieviel Varianz durch die Faktoren bei einer beshystimmten Variablen erklaumlrt werden soll Den Umfang an Varianzerklaumlrung den die Faktoren gemeinsam fllr eine Ausgangsvariable liefern wird als Komm~nalitaumlt beshyzeichnet Die Art und Weise mit der die Kommunalitaumlten bestimmt werden ist unmittelbar an die Methode der Faktorenermittlung (Faktorextraktionsmethode) gekoppelt Je nachdem welche Uumlberlegungen der Kommunalitaumltenbestimmung zugrunde liegen werden unterschiedliche Faktorenanalyseverfahren relevant
Ist eine Entscheidung uumlber die HOumlhe der Kommunalitaumlten der einzelnen Ausshygangsvariablen getroffen so muszlig weiterhin uumlber die Anzahl der zu extrahierenden Faktoren entschieden werden da das Ziel der Faktorenanalyse gerade darin zu seshyhen ist weniger Faktoren als urspruumlngliche Variable zu erhalten Hier steht der Anwender vor dem Zielkonflikt daszlig mit einer geringen Faktorenzahl tendenziell ein groszliger Informationsverlust (im Sfnne von nicht erklaumlrter Varianz) verbunden ist und umgekehrt In unserem Beispiel hatten wir uns aufgrund einer Plaushysibilitaumltsbetrachtung fllr zwei Faktoren entschieden
Ist schlieszliglich die Anzahl der Faktoren bestimmt so ist es von besonderem Inshyteresse die Beziehungen zwischen den Ausgangsvariablen und den Faktoren zu kennen Zu diesem Zweck werden Korrelationen berechnet die ein Maszlig tuumlr die Staumlrke und die Richtung der Zusammenhaumlnge zwischen Faktoren und urshyspruumlnglichen Variablen angeben Diese Korrelationen werden als Faktorladungen bezeichnet und in der sog Faktorladungsmatrix zusarnmengefaBt Abschlieszligend ist es dann von Interesse wie die befragten Personen die Marken Rama SaneUa Becel Du darfst Hollaumlndische Markenbutter und Weihnachtsbutter im Hinblick auf die beiden kuumlnstlichen Faktoren Gesundheit und Wirtschaftlichkeit beshyurteilen wuumlrden Gesucht ist also die entsprechende Matrix zu Abbildung 54 die die Einschaumltzung der Marken bezuumlglich der beiden Faktoren Gesundheit und Wirtschaftlichkeit enthaumllt Diese Einschaumltzungen werden als Faktorwerte beshyzeichnet Abbildung 56 zeigt die entsprechende Faktorwerte-Matrix fuumlr unser kleines Ausgangsbeispiel Die Darstellung enthaumllt standardisierte Werte wobei die Auspraumlgungen als Abweichungen vom Mittelwert dargestellt sind
Problemstellung 267
Abbildung 56 Faktorwerte-Matrix r-shy
Faktor 1 Faktor 2
Rama -121136 -125027 Sanella -048288 -026891 Becel 057050 019027 Du darfst 156374 -088742 Hall Butter -063529 094719 Weihnachtsbutter 019530 126914
Die Faktorwerte liefern nicht nur einen Anhaltspunkt fuumlr die Einschaumltzung der Margarinesorten bezuumlglich der gefundenen Faktoren sondern erlauben daruumlber hinaus (im Fall einer 2- oder 3-Faktorloumlsung) eine graphische Darstellung der Faktorenergebnisse Durch solche Mappings lassen sich besonders gut die Poshysitionen von Objekten (hier Margarinemarken) im Hinblick auf die gefundenen Faktoren visualisieren (vgl Abbildung 57)
Abbildung 57 Mapping der Faktorwerte
F 20 a k 15 t 0 r 10
05
00
-05
-10
-15
Du darfstbull f-
Becelbull Weihnachtsbutter
bull Sanellabull Holl Butterbull
Rama
bull I
-15 -10 -05 00 05 10 15
Faktor 2
268 Faktorenanalyse
Dabei wird deutlich daszlig es sich bei diesem mapping um eine relative Darstelshylung handelt Die Faktorwerte werden als Abweichung vom auf Null nonnierten Mittelwert dargestellt so daszlig hohe positive Faktorwerte stark uumlberdurchschnittlishyche hohe negative Faktorwerte stark unterdurchschnittliche Auspraumlgungen kennshy
zeichnen Der in Abbildung 58 dargestellte knappe Aufriszlig der Faktorenanalyse enthaumllt die
wesentlichen Teilschritte bei der Durchfiihrung einer Faktorenanalyse und ist unshyten als Ablaufdiagramm dargestellt Entsprechend diesem Ablaufdiagramm sind die nachfolgenden Betrachtungen aufgebaut Allerdings ist zu beachten daszlig sich bei konkreten Anwendungen der Faktorenanalyse insbesondere die Schritte (2) und (3) gegenseitig bedingen und nur schwer voneinander trennen lassen Aus dishydaktischen Gruumlnden wurde hier aber eine Trennung vorgenommen
bull Abbildung 58 Ablauf einer Faktorenanalyse
(1) Variablenauswahl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitaumlten
(4) Zahl der Faktoren
(5) Faktorinterpretation
(6) Bestimmung der Faktorwerte
Vorgehensweise 269
52 Vorgehensweise
5 Variablenauswahl und Errechnung der Korrelationsmatrix
Die Guumlte der Ergebnisse einer Faktorenanalyse ist von der Zuverlaumlssigkeit der Ausgangsdaten abhaumlngig Es muszlig deshalb besondere Sorgfalt auf die Wahl der Unshytersuchungsmerkmale verwendet werden Insbesondere
~ (2) Extraktion der Faktoren I
(3) Bestimmung der Kommunalitaumlten
u
(6) Bestimmung der Faktorwerte
ist darauf zu achten daszlig die erhobenen Merkmale auch fuumlr den Untersuchungsgegenstand relevant sind Irreleshyvante Merkmale sind vorab auszusortieren sowie als aumlhnlich erachtete Kriterien muumlssen zusammengefaszligt werden Insbesondere bei der Formulierung von Befragungsitems ist darauf zu achten daszlig bereits die Wortwahl der Fragestellungen das Antwortverhalten der Befragten und damit die Streuung der Daten beeinfluszligt Weiterhin sollten die Befragten einer rnoumlgshylichst homogenen Stichprobe entstammen da die Houmlhej bull
der KorrelatIOnen ZWischen den Untersuchungsmerk- malen (Variablen) durch den Homogenitaumltsgrad der Befragungsstichprobe beeinshyfluszligt wird
Die oben aufgezeigten Sachverhalte schlagen sich insgesamt in den Korrelashytionen nieder die als Maszlig fuumlr den Zusammenhang zwischen Variablen errechnet werden Es wurden deshalb Pruumlfkriterien entwickelt die es erlauben Variablenshyzusammenhaumlnge auf ihre Eignung fuumlr eine Faktorenanalyse zu uumlberpruumlfen Wir werden deshalb im folgenden zunaumlchst auf die Ermittlung von Korrelationen naumlher eingehen und sodann ausgewaumlhlte (statistische) Pruumlfkriterien erlaumlutern
5211 Korrelationsanalyse zur Aufdeckung der Variablenzusammenhaumlnge
Faktoren die als hinter den Variablen stehende Groumlszligen angesehen werden reshypraumlsentieren den Zusammenhang zwischen verschiedenen Ausgangsvariablen Beshyvor solche Faktoren ennittelt werden koumlnnen ist es zunaumlchst erforderlich die Zushysammenhaumlnge zwischen den Ausgangsvariablen meszligbar zu machen Als meshythodisches Hilfsmittel wird hierzu die Korrelationsrechnung herangezogen
Bereits anhand der Korrelationen laumlszligt sich erkennen ob Zusammenhaumlnge zwishyschen Paaren von Variablen bestehen so daszlig Variablen als voneinander abhaumlngig und damit als buumlndelungsfaumlhig angesehen werden koumlnnen
Fuumlr die Mittelwertmatrix (Abbildung 54) in obigem Beispiel laumlszligt sich zB die Korrelation zwischen x 1 (Anteil ungesaumlttigter Fettsaumluren) und x2 (Kaloriengehalt) wie folgt berechnen
~ IV taAtvJuAtJ(U)0
Korrelationskoeffizient
K 2(Xkl-XI)(XkZ -X2)
k = I (1)r = -===========XX2 I K K
2 (Xkl _X))2 2(XkZ -X2Y k = I k = I
mit
Auspraumlgung der Variablen I bei Objekt k (in unserem BeispielXkl laumluft k von 1 bis 6 (6 Markenraquo Mittelwert der Auspraumlgung von Variable 1 uumlber alle Objekte k Xl Auspraumlgung der Variablen 2 bei Objekt k xkZ Mittelwert der Auspraumlgung von Variable 2 uumlber alle Objekte k X2
Setzt man in Formel (1) die entsprechenden Werte der Ausgangsdatenmatrix ein so ergibt sich ein Korrelationskoeffizient von rbullbull =071176 Um die im einshy
1 2
zeInen notwendigen Rechenschritte zu erleichtern bedient man sich zurErmittlung der Korrelationskoeffizienten am besten der Hilfstabelle (Abbildung 59) Dabei stellt Xl den Mittelwert uumlber alle Marken rur die Eigenschaft Ungesaumlttigte Fettshy
saumluren ((1+2+4+5+2+36=283) und X2 ftlr die Eigenschaft Kaloriengeshy
halt ((1+6+5+6+3+46=417) dar
Abbildung 59 Hilfstabelle zur Berechnung eines Korrelationskoeffizienten
(x-l() (x-llt) (x-x)(x-J()(x -x) (x-llt)
336110 1002780 580555183333 -316667Rama 336110 middot152777-083333 183333 069444Sanella 069444 097222116667 063333 136112Becel 336110 397222216667 183333 469446Du darfst 097222middot083333 -116667 069444 136111Holt Butter 002778 -002778016667 -016667 002778Weihnechtsbutter
1083334 1883333 1016666 ----__----~--------__~-~~------_
(xx) I6 (xx) I6
(x-i)(xx) k=1 k=1
1016664r =VOuml8333011883333 =071176
Berechnet man die Korrelationskoeffizienten uumlber alle Eigenschaften ergibt sich rur die Mittelwertmatrix die in Abbildung 510 abgebildete Korrelationsmatrix
vorgenenswelse L 1
Abbildung 510 Korrelationsmatrix rur das 6-Produkte-Beispiel
UNGEFETI KALORlEN VITAMIN HALTBARK PREIS
-------------------- ---_--- ----------UNGEFETT 100000 KALORlEN 071176 100000
VITAMIN Q~~Pplusmn _QJQ~~__ 19PPQQ __ HALTBARK 010894 013771 007825 ri~oumloumloumloumloumlmiddot-------------------
PREIS 004385 006652 002362 098334 100000
In der Regel empfiehlt es sich die Ausgangsdatenmatrix vorab zu standardisieren da dadurch
- die Korrelationsrechnung und die im Rahmen der Faktorenanalyse erforderlishychen Rechenschritte erleichtert werden
- Interpretationserleichterungen erzielt werden - eine Vergleichbarkeit der Variablen ermoumlglicht wird die in unterschiedlichen
Maszligeinheiten erhoben wurden (zB Einkommen gemessen in Euro und Verkauf von Guumltern in Stck)
Eine Standardisierung der Datenmatrix erfolgt durch die Bildung der Differenz zwischen dem Mittelwert und dem jeweiligen Beobachtungswert einer Variablen sowie der anschlieszligenden Division durch die Standardabweichung Dadurch wird sichergestellt daszlig der neue Mittelwert gleich Null und die Standardabweichung einer Variablen gleich Eins ist Die Werte einer standardisierten Datenmatrix beshyzeichnen wir im folgenden nicht mehr mit x sondern mit z
Standardisierte Variable
Xk -x Zkj = J j
Sj
mit
Xkj BeobachtungSlVert der Variablenj bei Objekt k
Xj Durchschnitt aller Beobachtungswerte der Variablenj uumlber alle Objekte
s j Standardabweichung der Variablen j
Zkj Standardisierter Beobachtungswert der Variablen j bei Objekt k
Aus der standardisierten Datenmatrix ergibt sich auch eine einfachere Berechnung der Korrelationsmatrix R nach folgender Formel
R=_I_ZmiddotZ (2)K-I
272 Faktorenanalyse Vorgehensweise 273
wobei Z die transponierte Matrix der standardisierten Ausgangsdatenmatrix Z darstellt
Der Leser moumlge selbst anhand des Beispiels die Guumlltigkeit der Formel uumlberpruumlshyfen Dabei wird klar werden daszlig die Korrelationsmatrix auf Basis der Ausshygangsdaten identisch ist mit der Korrelationsmatrix auf Basis der standardisierten Daten Wird die Korrelationsmatrix aus standardisierten Daten errechnet so sind in diesem Falle Varianz-Kovarianzmatrix und Korrelationsmatrix identisch Fuumlr den Korrelationskoeffizienten laumlszligt sich auch schreiben
S 1middot2 SI ( - )( - )rx =-- mit x x =--t xkl-x Xk2-x 2
1 2 S S Imiddot 2 K -1 k XI X2
Da wegen der Standardisierung die beiden Varia~zen im Nenner 1 sind folgt daszlig Korrelationskoeffizient und Kovarianz SIX2) identisch sind
Die Korrelationsmatrix zeigt dem Anwender auf welche Variablen der Ausgangsshybefragung offenbar mit welchen anderen Variablen dieser Befragung irgendwie zusammenhaumlngen Sie zeigt ihm jedoch nicht ob
I die Variablen sich gegenseitig bedingen
oder
2 das Zustandekommen der Korrelationswerte durch einen oder mehrere hinter den zusammenhaumlngenden Variablen stehenden Faktoren bestimmt wird
Angesichts der beiden klar trennbaren Bloumlcke der Korrelationsmatrix (vgL die abshygegrenzten Vierecke) laumlszligt sich vermuten daszlig die Variablen XI bis x3 und x4xS durch zwei Faktoren erklaumlrt werden koumlnnten
Ausgehend von dieser Hypothese stellt sich unmittelbar die Frage mit welchem Gewicht denn die beiden Faktoren an der Beschreibung der beobachteten Zusamshymenhaumlnge beteiligt sind Es ist ja denkbar daszlig der Faktor Gesundheit als alleinishyger Beschreibungsfaktor filr die Variablen Xl bis x3 fast filr die gesamten Untershyschiede in der Ausgangsbefragung verantwortlich ist Es kann aber auch sein daszlig er nur einen Teil der unterschiedlichen Beurteilungen in der Ausgangsbefragung erklaumlrt Die groumlszligere oder geringere Bedeutung beider Faktoren laumlszligt sich in einer Gewichtszahl ausdrucken die im Rahmen einer Faktorenanalyse auch als Eigenshywert bezeichnet wird
5Ul Eignung der Korrelationsmatrix
Zu Beginn des Abschnittes 521 hatten wir bereits darauf hingewiesen daszlig sich die Eignung der Ausgangsdaten filr faktoranalytische Zwecke in der Korrelatishyonsmatrix widerspiegelt Dabei liefern bereits die Ausgangsdaten selbst einen Anshyhaltspunkt zur Eignungsbeurteilung der Daten zum Zwecke der Faktorenanalyse da die Houmlhe der Korrelationskoeffizienten durch die Verteilung der Variablen in der Erhebungsgesamtheit (Symmetrie Schiefe und Woumllbung der Verteilung) beeinfluszligt wird Liegt einer Erhebung eine heterogene Datenstruktur zugrunde so
macht sich dies durch viele kleine Werte in der Korrelationsmatrix bemerkbar II womit eine sinnvolle Anwendung der Faktorenanalyse in Frage gestellt ist Es ist
deshalb vorab eine Prufung der Variablen auf Normalverteilung ZUmindest aber auf Gleichartigkeit der Verteilungen empfehlenswert obwohl die Faktorenanalyseselbst keine Verteilungsannahmen setzt
Bezogen auf unser 6-Produkte-Beispiel treten neben sehr hohen Werten (gt 07) insbesondere im unteren Teil der Matrix kleine Korrelationen auf (vgl Abbildung 510) so daszlig die Korrelationsmatrix selbst kein eindeutiges Urteil uumlber die Eigshynung der Daten zur Faktorenanalyse zulaumlszligt
Es ist deshalb zweckmaumlszligig weitere Kriterien zur Pruumlfung heranzuziehen Hierzu bieten sich insbesondere statistische Prufkriterien an die eine Uumlberpruumlfung der Korrelationskoeffizienten auf Eignung zur Faktorenanalyse ermoumlglichen Es ist durchaus empfehlenswert mehr als ein Kriterium zur faktoranalytischen Eignung der Datenmatrix anzuwenden da die verschiedenen Kriterien unterschiedliche Vor- und Nachteile haben Im einzelnen werden durch SPSS folgende Kriterien bereitgestellt
Signifikanzniveaus der Korrelationen
Ein Signifikanzniveau uumlberpruumlft die Wahrscheinlichkeit mit der eine ZUvor formushylierte Hypothese zutrifft oder nicht Fuumlr alle Korrelationskoeffizienten lassen sich die Signifikanzniveaus anfilhren Zuvor wird eine sogenannte Ho-Hypothese forshymuliert die aussagt daszlig kein Zusammenhang zwischen den Variablen besteht Das Signifikanzniveau des Korrelationskoeffizienten berechnet anschlieszligend mit welshycher Irrtums wahrscheinlichkeit eben diese Ho-Hypothese abgelehnt werden kann Ein beispielhaftes Signifikanzniveau von 000 bedeutet daszlig mit dieser Irrtumsshywahrscheinlichkeit die Ho-Hypothese abgelehnt werden kann sprich zu 00 wird sich der Anwender taumluschen wenn er von einem Zusammenhang ungleich Null zwischen den Variablen ausgeht Anders ausgedruckt Mit einer Wahrscheinlichshykeit von 100 wird sich die Korrelation von Null unterscheiden
Abbildung 511 Signifikanzniveaus der Korrelationskoeffizienten im 6-ProdukteshyBeispiel
KOrrelatlonmatrix
UNGEFETT KALORIEN VITAMIN HALTBARKISignIfikanz (l-seitlg) UNGEFETT PREIS05632 00111 411lSZ 46713KAlORIEN 05632 05924 39737 45018VITAMIN 00111 05924 44144 49229HALTBARK 41862 39737 44144 00021PREIS 46713 45018 48229 00021
Fuumlr unser Beispiel zeigt Abbildung 511 daszlig sich genau diejenigen Korrelationsshykoeffizienten signifikant von Null unterscheiden (niedrige Werte in Abbildung 511) die in Abbildung 510 hbhe Werte (gt 07) aufweisen waumlhrend die Korrelashy
f
274 Faktorenanalyse
tionskoeffizienten mit geringen Werten auch ein hohes Signifikanzniveau (Wertegt 04) besitzen Das bedeutet daszlig sich ZB die Korrelation zwischen den Variablen Vitamingehalt und Haltbarkeit nur mit einer Wahrscheinlichkeit von (1- 044 =) 56 von Null unterscheidet
Inverse der Korrelationsmatrix
Die Eignung einer Korrelationsmatrix fuumlr die Faktorenanalyse laumlszligt sich weiterhin an der Struktur der Inversen der Korrelationsmatrix erkennen Dabei wird davon ausgegangen daszlig eine Eignung dann gegeben ist wenn die Inverse eine Diagoshynamatrix darstellt d h die Nicht-diagonal-Elemente der inversen Korrelatishyonsmatrix moumlglichst nahe bei Null liegen Fuumlr das 6-Produkte-Beispiel zeigt Abbildung 512 daszlig insbesondere fuumlr die Werte der Variablen Ungesaumlttigte Fettshysaumluren und Vitamingehalt sowie Haltbarkeit und Preis hohe Werte auftreshyten waumlhrend alle anderen Werte relativ nahe bei Null liegen Es existiert allerdings kein allgemeinguumlltiges Kriterium dafuumlr wie stark und wie haumlufig die Nicht-diashygonal-Elemente von Null abweichen duumlrfen
Abbildung 512 Inverse der Korrelationsmatrix im 6-Produkte-Beispie1
Inverse KorrelationsmatrIx
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS UNIiIIt
KALORIEN VITAMIN
HALTBARK
PREIS
1449910 -60678
-1319772 -558018 520353
-60678 217944 -82863
-218066 204555
-1319772 -82863
1400000 479257
-440959
-558018 -218066 479257
3817871 -3126624
520353 204555
-440959 -3726624 3738542
Bartlett-Test (test of spherlcity)
Der Bartlett-Test uumlberpruumlft die Hypothese ob die Stichprobe aus einer Grundgeshysamtheit entstammt in der die Variablen unkorreliert sinds
Gleichbedeutend mit dieser Aussage ist die Frage ob die Korrelationsmatrix nur zuflillig von einer Einheitsmatrix abweicht da im Falle der Einheitsmatrix alle Nicht-diagonal-Elemente Null sind d h keine Korrelationen zwischen den Varishyablen vorliegen Es werden folgende Hypothesen formuliert
HO Die Variablen in der Erhebungsgesamtheit sind unkorreliert
H1 Die Variablen in der Erhebungsgesamtheit sind korreliert
Der Bartlett-Test setzt voraus daszlig die Variablen in der Erhebungsgesamtheit einer Normaverteiung folgen und die entsprechende Pruumlf groumlszlige annaumlhernd ChishyQuadrat-verteilt ist Letzteres aber bedeutet daszlig der Wert der Pruumlfgroumlszlige in hohem
5 Vgl Dziuban C DlShirkey E C 1974 S 358 ff bull
Vorgehensweise 275
Maszlige durch die Groumlszlige der Stichprobe beeinfluszligt wird Fuumlr unser Beispiel erbrachshyte der Bartlett-Test eine Pruumlfgroumlszlige von 17371 bei einem Signifikanzniveau von 00665 Das bedeutet daszlig mit einer Wahrscheinlichkeit von (1- 00655=)9345
davon auszugehen ist daszlig die Variablen der Erhebungsgesamtheit korreliert sind Setzt man als kritische Irrtumswahrscheinlichkeit einen Wert von 005 fest so waumlshyre fuumlr unser Beispiel die Nullhypothese anzunehmen und folglich die Korrelatishyonsmatrix nur zufaumlllig von der Einheitsmatrix verschieden Das laumlszligt dann den Schluszlig zu daszlig die Ausgangsvariablen in unserem Fall unkorreliert sind
Allerdings sei an dieser Stelle nochmals darauf hingewiesen daszlig die Anwenshydung des Bartlett-Tests eine Pruumlfung der Ausgangsdaten auf Normalverteilung voraussetzt die in unserem Fall noch erfolgen muumlszligte
Anti-Image-Kovarianz-Matrix
Der Begriff Anti-Image stammt aus der Image-Analyse von Guttmann6 Guttrnann geht davon aus daszlig sich die Varianz einer Variablen in zwei Teile zerlegen laumlszligt das Image und das Anti-Image
Das Image beschreibt dabei den Anteil der Varianz der durch die verbleibenden Variablen mit Hilfe einer multiplen Regressionsanalyse (vgl Kapitel 1) erklaumlrt werden kann waumlhrend das Anti-Image denjenigen Teil darstellt der von den uumlbrishygen Variablen unabhaumlngig istlDa die Faktorenanalyse unterstellt daszlig den Variabshylen gemeinsame Faktoren zugrunde liegen ist es unmittelbar einsichtig daszlig Varishyablen nur dann fuumlr eine Faktorenanalyse geeriiet sind wenn das Anti-Image der Variablen moumlglichst gering ausflilltDas ab bedJJltet daszlig die Nicht-diagonalshyElemente der Anti-Image-Kovarianz-Matrix m glichst nahe bei Null liegen muumlsshysen bzw diese Matrix eine Diagonamatrix darstellen sollte Fuumlr das 6-ProdukteshyBeispiel zeigt Abbildung 513 daszlig die Forderung nach einer Diagonalmatrix ershyfiiHt ist
Abbildung 513 Anti-Image-Kovarianz-Matrix im 6-Produkte-Beispiel
AnIlJmIU_atrIzen
UNGEFETT KALORIEN VITAMIN HALTBARKi Arililinage-lltovananz PREISUNuumll1 06897 -01920 -06502 -01008 00960KAlORIEN -01920 45883 -02716 -02621 02511VITAMIN -06502 02716 07143 00897 -00842HALTBARK -01008 02621 00697 02619 -02611PREIS 00960 02511 -00842 middot02611 02675
Als Kriterium dafilr wann die Forderung nach einer Diagonalmatrix erfuumlllt ist schlagen Dziuban und Shirkey vor die Korrelationsmatrix dann als fuumlr die Fakshytorenanalyse ungeeignet anzusehen wenn der Anteil der Nicht-diagonal-Elemente die ungleich Null sind (gt 009) in der Anti-Image-Kovarianzmatrix (AIC) 25
Vgl Guttmann L 1953 S 277 ff
LIO r aKlOrenanalyse
oder mehr betraumlgt7 Das trifft in unserem Fall filr keines der Nicht-diagonalshyElemente der Ale-Matrix zu womit nach diesem Kriterium die Korrelationsmatrix filr faktoranalytische Auswertungen geeignet ist
Kaiser-Meyer-Olkin-Kriterium
Waumlhrend die Uumlberlegungen von Dziuban und Shirkey auf Plausibilitaumlt beruhen haben Kaiser Meyer und Olkin versucht eine geeignete Pruumlfgroumlszlige zu entwickeln und diese zur Entscheidungsfindung heranzuziehen Sie berechnen ihre PTUumlfgroumlszlige die als measure 0sampling adequacy (MSA) bezeichnet wird auf Basis der Anshyti-Image-KorrelationsmatrixbullDas MSA-Kriterium zeigt an in welchem Umfang die Ausgangsvariablen zusammengehoumlren und dient somit als Indikator dafilr ob eine Faktorenanalyse sinnvoll erscheint oder nichtDas MSA-Kriterium erlaubt sowohl eine Beurteilung der Korrelationsmatrix insgesamt als auch einzelner Varishyablen sein Wertebereich liegt zwischen degund 1 Kaiser und Rice schlagen folgenshy
8de Beurteilungen vor
MSA 2 09 marvelous (erstaunlich) MSA 2 08 meritorious (verdienstvoll) MSA 2 07 middling (ziemlich gut) MSA 2 06 mediocre (mittelmaumlszligig) MSA 2 05 miserable (klaumlglich) MSA lt05 unacceptable (untragbar)
Sie vertreten die Meinung daszlig sich eine Korrelationsmatrix mit MSA lt 05 nicht rur eine Faktorenanalyse eignet9 Als wuumlnschenswert sehen sie einen Wert von MSA 2 08 an lO In der Literatur wird das MSA-Kriterium das auch als KaisershyMeyer-Olkin-Kriterium (KMK) bezeichnet wird als das beste zur Verrugung steshyhende Verfahren zur Pruumlfung der Korrelationsmatrix angesehen weshalb seine Anwendunrvor der Durchfuhrung einer Faktorenanalyse auf jeden Fall zu empshyfehlen ist 1
Bezogen auf unser 6-Produkte-Beispiel ergab sich rur die Korrelationsmatrix insgesamt ein MSA-Wert von 0576 womit sich rur unser Beispiel ein riur klaumlglishyches Ergebnis ergibt Daruumlber hinaus gibt SPSS in der Diagonalen der AntishyImage-Korrelationsmatrix aber auch das MSA-Kriterium rur die einzelnen Variabshylen an
7 Vgl Dziuban C DlShirkey E C 1974 S 359
8 Vgl Kaiser H FRice J 1974 S 111 ff
9 Vgl Cureton E EDAgostino R B 1983 S 389 f
10 Vgl Kaiser H F 1970 S 405
II Vgl Stewart D W 1981 S 57 f Dziuban C DlShirkey E C 1974 S 360 f
Vorgehensweise 277
Abbildung 514 Anti-Image-Korrelations-Matrix im 6-Produkte-Beispiel
Antllmlge-Matrlun
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS AntI-lmageMrrelilllOn UNGEFETT 59680middot 10794 -92633 -23717 22350
KALORIEN -10794 87789 -15001 -23906 22661 VITAMIN -92633 -15001 59755 20730 -19274 HALTSARK -23717 -23906 20730 47060 -98640 PREIS 22350 22561 -19274 -95640 45701
8 Maszlig der StlchplObenelgnung
Abbildung 514 macht deutlich daszlig lediglich die Variable Kaloriengehalt mit einem MSA-Wert von 087789 als verdienstvoll anzusehen ist waumlhrend alle uumlbshyrigen Variablen eher klaumlgliche oder untragbare Ergebnisse aufweisen Die vashyriablenspezifischen MSA-Werte liefern damit rur den Anwender einen Anshyhaltspunkt dafuumlr welche Variablen aus der Analyse auszuschlieszligen waumlren wobei sich ein sukzessiver Ausschluszlig von Variablen mit jeweiliger Pruumlfung der vorgeshystellten Kriterien empfiehlt
522 Extraktion der Faktoren
(4) Zahl der Faktoren
(5) Faktorinterp~etat~ (6) Bestimmung der
Faktorwerte
Die bisherigen Ausruhrungen haben verdeutlicht daszlig bei Faktorenanalysen groszlige Sorgfalt auf die Wahl der Untersuchungsmerkmale und -einheiten zu verwenden ist da durch die Guumlte der Korrelationsmatrix die den Startpunkt der Faktorenanalyse darstellt alle Ershygebnisse der Faktorenanalyse beeinfluszligt werden Im folgenden ist nun zu fragen wie denn nun die Faktoren rein rechnerisch aus den Variablen ermittelt werden koumlnnen Wir werden im folgenden zunaumlchst das Funshydamentaltheorem der Faktorenanalyse darstellen und anschlieszligend die Extraktion auf graphischem Wege plausibel machen Auf die Unterschiede zwischen konkreten (rechnerischen) Faktorextraktionsverfahren gehen wir dann im Zusammenhang mit der Bestimshymung der Kommunalitaumlten (Abs~hnitt 523) ein
278 Faktorenanalyse
5221 Das FundamentaItheorem
Waumlhrend die bisherigen Uumlberlegungen die Ausgangsdaten und ihre Eignung fuumlr faktoranalytische Zwecke betrafen stellt sich nun die Frage wie sich die Faktoren rechnerisch aus den Variablen ennitteln lassen Zu diesem Zweck geht die Faktoshyrenanalyse von folgender grundlegenden Annahme aus
Jeder Beobachtungswert einer Ausgangsvariablen Xj oder der stanshydardisierten Variablen Zj laumlszligt sich als eine Linearkombination mehshyrerer (hypothetischer) Faktoren beschreiben
Mathematisch laumlszligt sich dieser Zusammenhang wie folgt fonnulieren
(3a)Xkj =ajl Pkl +ap PIa + +ajQ PkQ
bzw fuumlr standardisierte x-Werte
(3b)Zkj=ajIPkl+a j2middotPIa+middot+a jQmiddotPkQ=iajqPkq
q~l
Die obige Fonnel (3b) besagt fuumlr das 2-Faktorenbeispiel nichts anderes als daszlig zB die standardisierten Beobachtungswerte fuumlr Anteil ungesaumlttigter Fettsaumluren und Vitamingehalt beschrieben werden durch die Faktoren P 1 und P2 so wie sie im Hinblick auf Marke k gesehen wurden ltPIel bzw Pk2) jeweils multipliziert mit ihren Gewichten bzw Faktorenladungen beim Merkmal j also fuumlr Faktor 1 ajl und
fuumlr Faktor 2 a2 Oie Faktorradung gibt dabei an wieviel ein Faktor mit einer Ausgangsvariablen
zu tun hat Im mathematisch-statistischen Sinne sind Faktorladungen nichts andeshyres als eine Maszliggroumlszlige fuumlr den Zusammenhang zwischen Variablen und Faktor und das ist wiederum nichts anderes als ein Korrelationskoeffizient zwischen Fakshytor und Variablen
Um die Notation zu verkuumlrzen schreibt man haumlufig den Ausdruck (3b) auch in Matrixschreibweise Identisch mit Fonnel (3b) ist daher auch folgende Mashytrixschreibweise die die Grundgleichung der Faktorenanalyse darstellt
(3c)Z=pmiddotA
Aufbauend auf diesem Grundzusammenhang laumlszligt sich dann auch eine Rechenshyvorschrift ableiten die aufzeigt wie aus den erhobenen Daten die vennuteten Fakshytoren mathematisch ennittelt werden koumlnnen
Wir hatten gezeigt daszlig die Korrelationsmatrix R sich bei standardisierten Daten wie folgt aus der Datenmatrix Z ennitteln laumlszligt
R=_I_ZZ (2) K-l
Vorgehensweise 279
Da Z aber im Rahmen der Faktorenanalyse durch P A beschrieben wird (Z =PA) ist in (2) Z durch Fonnel (3c) zu ersetzen so daszlig sich folgende Fonnet
ergibt
R=_I_PA)PA) (4)K I
Nach Aufloumlsung der Klammem ergibt sich nach den Regeln der Matrixmultiplishykation
r------- R=_I_APPA=A-I_pPA (5)
K-I ~
~
Da alle Daten standardisiert sind laumlszligt sich der _1_ ptP Ausdruck in Formel (5)K-l ----y---J
auch als K(Jrrelationsmatrix der Faktoren (C) bezeichnen (vgl Fonnel (2raquo so daszlig sich schreiben laumlszligt
R = AmiddotCmiddotA (6)
Da die Faktoren als unkorreliert angenommen werden entspricht C einer Einheitsshymatrix (einer Matrix die auf der Hauptdiagonalen nur Einsen und sonst Nullen enthaumllt) Da die Multiplikation einer Matrix mit einer Einheitsmatrix aber wieder die Ausgangsmatrix ergibt vereinfacht sich die Fonnel (6) zu
R = AmiddotA (7)
Die Beziehungen (6) und (7) werden von Thurstone als das Fundamentaltheorem der Faktorenanalyse bezeichnet da sie den Zusammenhang zwischen Korrelatishyonsmatrix und Faktorladungsmatrix beschreiben
Das Fundarnentaltheorem der Faktorenanalyse besagt nicht anderes als daszlig sich die Korrelationsmatrix durch die Faktorladungen (Matrix A) und die Korrelationen zwischen den Faktoren (Matrix C) reproduzieren laumlszligt Fuumlr den Fall daszlig man von unabhaumlngigen (orthogonalen) Faktoren ausgeht reduziert sich das Funshydamentaltheorem auf Fonnel (7) Dabei muszlig sich der Anwender allerdings bewuszligt sein daszlig das Fundamentaltheorem der Faktorenanalyse nach Fonnel (7) stets nur unter der Praumlmisse einer Linearverknuumlpfung und Unabhaumlngigkeit der Faktoren Guumlltigkeit besitzt
5222 Graphische Interpretation von Faktoren
Der Infonnationsgehalt einer Korrelationsmatrix laumlszligt sich auch graphisch in einem Vektor-Diagramm darstellen in dem die jeweiligen Korrelationskoeffizienten als Winkel zwischen zwei Vektoren dargestellt werden Zwei Vektoren werden dann
280 Faktorenanalyse
als linear unabhaumlngig bezeichnet wenn sie senkrecht (orthogonal) aufeinander steshyhen Sind die beiden betrachteten Vektoren (Variablen) jedoch korreliert ist der Korrelationskoeffizient also C 0 zB 05 dann wird dies graphisch durch einen Winkel von 60deg zwischen den beiden Vektoren dargestellt
Es stellt sich die Frage Warum entspricht ein Korrelationskoeffizient von 05 genau einem Winkel von 60deg Die Verbindung wird uumlber den Cosinus des jeshy
weiligen Winkels hergestellt Verdeutlichen wir uns dies anhand des Ausgangsbeispiels (Abbildung 515)
In Abbildung 515 repraumlsentieren die Vektoren AC und AB zB die beiden Vashyriablen Kaloriengehalt und Vitamingehalt Zwischen den beid~_yariablen moumlge eine Korrelation von 05 gemessen worden sein Der Vektor AC der den Kaloriengehalt repraumlsentiert und der genau wie AB aufgrund der Standardisierung eine Laumlnge von 1 hat weist zu AB einen Winkel von 60deg auf Der Cosinus des Winkels 60deg der die Stellung der beiden Variablen zueinander (ihre Richtung) anmiddot gibt ist definiert als Quotient aus Ankathete und Hypothenuse also als AD AC Da AC aber gleich 1 ist ist der Korrelationskoeffizient identisch mit der Strecke
AD Wie Abbildung 516 ausschnitthaft zeigt ist zB der Cosinus eines 60deg-Winkels
gleich 05 Entsprechend laumlszligt sich jeder beliebige Korrelationskoeffizient zwischen zwei Variablen auch durch zwei Vektoren mit einem genau definierten Winkel zushyeinander darstellen Verdeutlichen wir uns dies noch einmal anband einer Korrelamiddot tionsmatrix mit drei Variablen (Abbildung 517)
Abbildung 515 Vektordarstellung einer Korrelation zwischen zwei Variablen
c
A 0 B
)V
Standardisierte LOnge von 1
Vorgehensweise 281
Abbildung 516 Werte rur den Cosinus (entnommen aus Geliert W JKuumlstnerHlHellwich MfKaumlstner H Kleine Enzyshyklopaumldie Mathematik Leipzig 1969 S 799)
Grad CO Grad cO
45 07071 90 00000 44 7193 89 0175 43 7314 88 0349 42 7431 87 0523 41 7547 86 0698 40 07660 85 0872 39 7771 84 1045 38 7880 83 1219 37 7986 82 1392 36 8090 81 1564 35 8192 80 01736 34 8290 79 1908 33 8387 78 2079 32 8480 77 2250 31 8572 76 2419 30 08660 75 2588 29 8746 74 2756 28 8829 73 2924 27 8910 72 3090 26 8988 71 3256 25 9063 70 03420 24 9135 69 3584 23 9205 68 3746 22 9272 67 3907 21 9336 middot66 4067 ZO 09397 65 4226 19 9455 64 4384 18 9511 63 4540 17 9563 62 4695 16 9613 61 4848 15 9659 60 05000 14 9703 59 5150 13 9744 58 5299 12 9781 57 5446 11 9816 56 5592 10 09848 55 5736 9 9877 54 5878 8 9903 53 6018 7 9925 52 6157 6 9945 51 6293 5 9962 50 06428 4 9976 49 6561 3 9986 48 6691 2 9994 47 6820 1 9998 46 6947 0 10000 45 7071
282 Faktorenanalyse
Abbildung 517 Korrelationsmatrix
R =r68660 1 06428lO1736 ~
R laumlszligt sich auch anders schreiben (vgl Abbildung 518)
Abbildung 518 Korrelationsmatrix mit Winkelausdrucken
l0deg R = 30deg 0deg
80deg 50deg 0deg
Der Leser moumlge die entsprechenden Werte selbst in einer Cosinus-Tabelle uumlbershy
pruumlfenDie der oben gezeigten Korrelationsmatrix zugrundeliegenden drei Variablen
und ihre Beziehungen zueinander lassen sich relativ leicht in einem zweidimen sionalen Raum darstellen (Abbildung 519)
Abbildung 519 Graphische Darstellung des 3-Variablen-Beispiels
Vektor X2
Vektorx3Vektor Xl
Vorgehensweise 283
Je mehr Variable jedoch zu beruumlcksichtigen sind desto mehr Dimensionen werden benoumltigt um die Vektoren in ihren entsprechenden Winkeln zueinander zu positioshy
nieren Die Faktorenanalyse trachtet nun danach das sich uumlber die Korrelationsshykoeffizienten gemessene Verhaumlltnis der Variablen zueinander in einem moumlglichst gering dimensionierten Raum zu reproduzieren Die Zahl der benoumltigten Achsen gibt dann die entsprechende Zahl der Faktoren an
Wenn man die Achsen als Faktoren ansieht dann stellt sich unmittelbar die Frashyge Wie werden diese Achsen (Faktoren) in ihrer Lage zu den jeweiligen Vektoren (Variablen) bestimmt
Dazu vergegenwaumlrtigt man sich am besten das Bild eines halboffenen Schirmes Die Zacken des Schirmgestaumlnges die alle in eine bestimmte Richtung weisend die Variablen repraumlsentieren lassen sich naumlherungsweise auch durch den Schirmstock darstellen Vereinfacht man diese Uumlberlegung aus DarstellungsgrQnden noch weishyter auf den 2-Variablen-Fall wie in AbbiIdu8520 die einen Korrelationskoshyeffizienten von 05 fuumlr die durch die Vektoren OA und OB dargestellten Variablen repraumlsentiert dann gibt der Vektor OC eine zusammenfassende (faktorielle) Beshyschreibung wieder Die beiden Winkel von 30deg zwischen Vektor I bzw Vektor II und Faktor-Vektor geben wiederum an inwieweit der gefundene Faktor mit Vekshytor (Variable) I bzw II zusammenhaumlngt Sie repraumlsentieren ebenfalls Korrelationsshykoeffizienten und zwar die zwischen den jeweiligen Variablen und dem Faktor Diese Korrelationskoeffizienten hatten wir oben als Faktorladungen bezeichnet Die Faktorladungen des 1 Faktors betragen also in bezug auf Variable I und Varishyable II cos 30deg = 08660
Abbildung 520 FaktorlOsung bei 2 Variablen
j
A
Vektor x
~---------__------~---- C
Resultante
e Vektor X
284 Faktorenanalyse
5223 Das Problem der Faktorextraktion
Nachdem wir nun wissen was eine Faktorladung inhaltlich bedeutet ist zu fragen Wie findet man einen solchen Vektor (Faktor) der stellvertretend ftir mehrere zushysammenhaumlngende Variable fungieren kann Erinnern wir uns noch einmal des Ausgangsbeispiels Aufstrichfette waren nach den ftinfMerkmalen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt - Haltbarkeit - Preis bewertet worden l2
Aus dieser Bewertung sei die Korrelationsmatrix in Abbildung 521 berechnet worden
Abbildung 521 Spiegelbildlich identische KOlTelationsmatrix
x X x x x
x 70 100 09848 90middotX 03420 30x 00000 10middotx
X -01736
Diese Korrelationsmatrix enthaumllt in der unteren Dreiecks-Matrix die Korrelationsshywerte in der oberen (spiegelbildlich identischen) Dreiecks-Matrix die entshysprechenden Winkel Graphisch ist der Inhalt dieser Matrix in Abbildung 522 darshygestellt
Das Beispiel wurde so gewaumlhlt daszlig die Winkel zwischen den Faktoren in einer zweidimensionalen Darstellung abgebildet werden koumlnnen - ein Fall der in der Realitaumlt allerdings kaum relevant ist
Wie findet man nun den 1 Faktor in dieser Vektordarstellung Bleiben wir zunaumlchst bei der graphischen Darstellung dann sucht man den
Schwerpunkt aus den ftinf Vektoren Der Leser moumlge sich dazu folgendes verdeutlichen
In Abbildung 522 ist der Faktor nichts anderes als die Resultante der funfVektoshyren Wuumlrden die ftinfVektoren funf Seile darstellen mit einem Gewicht in 0 und jeweils ein Mann wuumlrde mit gleicher Staumlrke an den Enden der Seile ziehen dann wuumlrde sich das Gewicht in eine bestimmte Richtung bewegen (vgl die gestrichelte
12 Es werden hier andere Werte als im Ausgangsbeispiel verwendet um zunaumlchst eine einshydeutige graphische Loumlsung zu ermoumlglichen
Vorgehensweise 285
Linie in Abbildung 523) Diesen Vektor bezeichnen wir als Resultante Er ist die graphische Repraumlsentation des 1 Faktors
Abbildung 522 Graphische Darstellung des 5-Variablen-Beispiels
~
XsXl
bull
Abbildung 523 Graphische Darstellung des Schwerpunktes
X2
XIX
Faktorshyvektor2
Betrachtet man nun die jetzt gebildeten Winkel zwischen dem 1 Faktor und den Ausgangsvektoren dann hat man auch die gesuchten Faktorladungen gefunden
(Erste Reshysultante)
4512
-------o
- -
286 Faktorenanalyse
Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen
Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben
Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge
die Werte selbst uumlberpruumlfen)
Abbildung 524 Einfaktorielle Ladungsmatrix
Faktor
05707Xl 07046x2 bull 09668x3
08211x4
07096
Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)
Abbildung 525 ZweifaktorieHe Ladungsmatrix
Faktor 1 Faktor 2
Xl 05707 -08211
x2 07046 -07096
x3 09668 02554
x4 08211 05707
Xs 07096 07046
Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa
Vorgehensweise 287
In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum
I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1
~~ 00
2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation
Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist
Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt
Sf = 1 = Ijj (9)J
3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt
Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)
Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung
Resutlanie 2 (Faktor 2)
A Vektor x o
120lt= fH bull C Resultante 1 (Faktor 1)
B Vektor x
288 Faktorenanalyse
Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB
Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel
Wenn obige Behauptung stimmt muumlszligte gelten
(lOa)[~J +[~~J =1
Uumlberpruumlfung 2 2 uumlc2
OC 00 +002 (lOb)--+-shy 2
OA OA OA2 2
In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)
Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)
(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)
2 2 OC +00
4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten
sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)
wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-
q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1
(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix
(2) Extraktion der
(5) Faktorinterpretatiln
(6) Bestimmung der Faktorwerte
Vorgehensweise 289
523 Bestimmung der Kommunalitaumlten
In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem
Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy
fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig
mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da
J
i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins
Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung
erklaumlrte Variant
standardisierte Gesamtvariant = 1
290 Faktorenanalyse
Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung
2 a j1 =07
2 2 8 j2 = 01 siRest= 02
Kommunalitat H =08 (erllt1arte Varianz)
Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)
R AmiddotA+U (7a)
Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet
Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion
Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer
Vorgehensweise 291
100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY
In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy
weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen
Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen
1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen
2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit
2 2I ~ ~ R j ~ mx rjk
Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse
- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy
13 Vgl Loehlin J C 1998 S 154 14
Vgl Uberla K 1972 S 155 ff
292 Faktorenanalyse
nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird
- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit
Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy
15formationsverlust deklariert wird
Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen
Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy
15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt
Vorgehensweise 293
tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder
Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren
Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen
Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren
Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist
Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf
Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden
Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel
Kommunalltlten
Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325
Extraktionsmelhode Hauptachsen-Faktorenanalyse
bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix
294 Faktorenanalyse
Abbildung 530 Faktorladungen im 6-Produkte-Beispiel
Faktoranmatrixmiddot
Faktor
1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608
Extraktionsmethode Hauptachsen-Faktorenanalyse
a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt
Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert
Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel
Reproduzierte Korrelationen
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT
KALORIEN
VITAMIN
HALTBARK
PREIS
96845 71193 96034 11035 04241
71193 52552b
70480
12709
07717
96034 70480 95292b
08461 01722
11035
12709 08461 99056b
8325
04241 07717 01722 98325 98070b
Residuun1 UNGEFETi
KALORIEN
VITAMIN
HALTBARK
PREIS
-00017 00101
-00141 00144
-00017
-00083 01001
- 01005
00101 -00083
-00036 00640
-00141 01061
-00636
00010
00144 -01005 00640 00010
ExtrakHonsmethode Hauptllchsenfaktorenanalyse
a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005
b Reproduzierte Kommunalltaumlten
Vorgehensweise 295
Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen
Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R
524 Zahl der Faktoren
(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix
(2) Extraktion der Faktoren
(6) Bestimmung der Faktorwerte
Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff
Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-
q N
trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N
Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden
Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy
296 Faktorenanalyse
Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre
Abbildung 532 Bestimmung der Eigenwerte
Faktorenmatrix
Faktor
1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)
Eigenwerte 25068 19112
Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil
Kom munalltaumlten
Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807
- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren
V orgehensweise 297
Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung
Abbildung 534 Scree-Test im 6-Produkte-Beispiel
Eigen- Screeplot wert 30
25
20
15
Kaiser-Kriterium
10 1 Elbow5
00 2 3 4 5
Faktomummer
298 Faktorenanalyse
525 Faktorinterpretation
Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)
Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt
(1) Variablenauswalll und Errechnung der Korrelationsmalrix
(2) Extraktion der Faktoran
(3) Bestimmung der Kommunalltaumllen
(6) Bestimmung derFaktorwerte _______---11
middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull
geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht
Abbildung 535 Faktorladungen im 6-Produkte-Beispiel
Preis Haltbarkeit
Extraktionsmethode Hauptachsen-Faktorenanalyse
Vorgehensweise 299
Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist
Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig
Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16
Abbildung 536 Unrotierte Faktorladungen
F
F
Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung
Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f
300 Faktorenanalyse
536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy
tert
Abbildung 537 Rotierte Faktorladungen
F (Ausgangssituation)2
11 F2 (rotiert)
F1
-- shy
(Ausgangssituation)
11
F1 (rotiert)
SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen
1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen
(rechtwinkligen) Rotation
2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren
Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die
vorgenenswelse j U 1
Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind
Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel
Faktor
1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt
Haltbarkeit
72152 bull 07020
07962 I 99208 Preis 01060 99025
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung
Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen
A bull =A T mit TC~SI7 - sina ] sma cosa
Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links
A T A 094331 - 028039 098357 003229
[C0s341570 - sin34 157 ]070669 016156 072152 007020
sin34157deg cos34157092825 - 030210 097615 000694
038926 091599 007962 099208
032320 093608 001060 099025
Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)
Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix
Faktor 1 2
1 94868 31622
2 -31622 94868
Il
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung
Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig
von a=1843deg
526 Bestimmung der Faktorwerte
(1) Variablenauswanl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitaumlten
Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte
Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt
(3c)Z=PmiddotA
Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY
(12)Z AT1p AAT
Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt
(13)ZArl=pE
Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten
(3c) wird von rechts mit A multipliziert
ZmiddotA=PmiddotAmiddotA (15)
Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar
ZAmiddot(A At1=P(A A) (A Atl (16)
Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt
P=ZA(AAt l (17)
In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren
In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term
AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte
Abbildung 540 Koeffizientenmatrix der Faktorwerte
Faktor 1 2
Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression
Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die
xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf
SjDa p E=P ist ergibt sich
Seite 271 zu (14)
P=ZAT
304 Faktorenanalyse
Abbildung 541 Standardisierte Ausgangsdatenmatrix Z
45ampt6R4LJL4
Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542
Abbildung 542 Faktorwerte im 6-Produkte-Beispiel
Vorgehensweise 305
Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel
Du darfst
VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG
E 11 BecelS
U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T
Sanella IIII Holl Butter
-1
bull Rama
-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18
WIRTSCHAFTLICHKEIT
Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen
527 Zusammenfassende Darstellung der Faktorenanalyse
Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy
e Vorgehensweise 307 306 Faktorenanalyse
Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen
sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-
schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy
tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig
wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy
nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy
chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy
analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte
Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht
Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der
Verwendung des Verfahrens offenzulegen
I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _
CQ)l2CQgtQ ~ i
-Q)C t l5~11
0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C
CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O
~ ~ 11 t 3
uj~fi
t Imiddot~ J1 ~SHaa
It c~
c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~
-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi
o~ ~ -gEG)
I ~l c c ~l~ampi
2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E
U~a ]i E
J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy
~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--
----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt
Fallbeispiel 309308 Faktorenanalyse
Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert
531 Problemstellung
In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften
Variable und Objekte des BeispielsAbbildung 545
EigenschaftenMarken M k (k=I Il) xj(j=I IO)
A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado
5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H
I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama
Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist
Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)
Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern
Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse
---
310Faktorenanalyse
532 Ergebnisse
1 Variablenauswahl und Errechnung der Korrelationsmatrix
Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung
548 wiedergegeben
Abbildung 548 Die Korrelationskoeffizienten -_ -
-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy
In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der
Fallbeispiel 311
Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet
Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie
-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -
06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170
-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260
62444 -97126 66229 -83532 -62589
-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545
-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno
Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)
Abbildung 550 Dialogfeld Deskriptive Statistik
312 Faktorenanalyse
2 Bestimmung der Kommunalitilten
Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt
wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend
bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich
von den Startwerten abweichen
Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten
Hauptkomponentenanalyse Hauptachsenanalyse
Variable Korrunuriali- Kommunali- Korrununali- Kommunali-
Ut (Startwerte)
tlt (Endwerte)
tlIl (Startwerte )
tlIl (End werte)
STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR
100000 100000 100000 100000 100000 100000 100000 100000 100000 100000
88619
76855
89167 85324 76043 84012 80223 92668 63297 88786
97414
89018
79497
85847
96501
98810
97132
99166
78019
96445
85325
55717
85754
91075
55819
82330
73903
94796
40402
87851
Fallbeispiel 313
Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy
I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren
Abbildung 552 Dialogfeld Extraktion
Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist
3 Wabl der Extraktionsmetbode
Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen
4 Zabl der Faktoren
Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen
Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet
Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch
17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f
1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden
Erklaumlrte Gesamtvarianz
Anfaumlngliche Eigenwerte
314 Faktorenanalyse
Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy
den sich fUnfFaktoren ergeben
Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien
95) der Varianz erklaumlrt sind
2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)
3 Extrahiere n (zB 3) Faktoren
4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy
renzahl
5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein
6 Extrahiere alle Faktoren die nach der
Vom Computer automatisch verwandt wenn keine andere Spezifikation
Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden
Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden
Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist
Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt
Fallbeispiel 315
Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil
Faktor 1
2 3
4
5
6
7
8
9
10
Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden
Abbildung 555 Scree-Test und Kaiser-Kriterium
Eigen- -=gtcreeplot wert
5
4
3
2
10
o Kaisershy
~ 3 i i 7 i Q
Faktornummer
Gesamt 505188
177106
142700
81935
42961
24709
15928
06190
02943
00340
der Varianz 5051883
1771061
1427002
819349 429611
247085
159275
61902
29434
03398
Kumulierte 5051883
6822944
8249946
9069295
9498905
9745991
9905266
9967168
9996602
10000000
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
268 Faktorenanalyse
Dabei wird deutlich daszlig es sich bei diesem mapping um eine relative Darstelshylung handelt Die Faktorwerte werden als Abweichung vom auf Null nonnierten Mittelwert dargestellt so daszlig hohe positive Faktorwerte stark uumlberdurchschnittlishyche hohe negative Faktorwerte stark unterdurchschnittliche Auspraumlgungen kennshy
zeichnen Der in Abbildung 58 dargestellte knappe Aufriszlig der Faktorenanalyse enthaumllt die
wesentlichen Teilschritte bei der Durchfiihrung einer Faktorenanalyse und ist unshyten als Ablaufdiagramm dargestellt Entsprechend diesem Ablaufdiagramm sind die nachfolgenden Betrachtungen aufgebaut Allerdings ist zu beachten daszlig sich bei konkreten Anwendungen der Faktorenanalyse insbesondere die Schritte (2) und (3) gegenseitig bedingen und nur schwer voneinander trennen lassen Aus dishydaktischen Gruumlnden wurde hier aber eine Trennung vorgenommen
bull Abbildung 58 Ablauf einer Faktorenanalyse
(1) Variablenauswahl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitaumlten
(4) Zahl der Faktoren
(5) Faktorinterpretation
(6) Bestimmung der Faktorwerte
Vorgehensweise 269
52 Vorgehensweise
5 Variablenauswahl und Errechnung der Korrelationsmatrix
Die Guumlte der Ergebnisse einer Faktorenanalyse ist von der Zuverlaumlssigkeit der Ausgangsdaten abhaumlngig Es muszlig deshalb besondere Sorgfalt auf die Wahl der Unshytersuchungsmerkmale verwendet werden Insbesondere
~ (2) Extraktion der Faktoren I
(3) Bestimmung der Kommunalitaumlten
u
(6) Bestimmung der Faktorwerte
ist darauf zu achten daszlig die erhobenen Merkmale auch fuumlr den Untersuchungsgegenstand relevant sind Irreleshyvante Merkmale sind vorab auszusortieren sowie als aumlhnlich erachtete Kriterien muumlssen zusammengefaszligt werden Insbesondere bei der Formulierung von Befragungsitems ist darauf zu achten daszlig bereits die Wortwahl der Fragestellungen das Antwortverhalten der Befragten und damit die Streuung der Daten beeinfluszligt Weiterhin sollten die Befragten einer rnoumlgshylichst homogenen Stichprobe entstammen da die Houmlhej bull
der KorrelatIOnen ZWischen den Untersuchungsmerk- malen (Variablen) durch den Homogenitaumltsgrad der Befragungsstichprobe beeinshyfluszligt wird
Die oben aufgezeigten Sachverhalte schlagen sich insgesamt in den Korrelashytionen nieder die als Maszlig fuumlr den Zusammenhang zwischen Variablen errechnet werden Es wurden deshalb Pruumlfkriterien entwickelt die es erlauben Variablenshyzusammenhaumlnge auf ihre Eignung fuumlr eine Faktorenanalyse zu uumlberpruumlfen Wir werden deshalb im folgenden zunaumlchst auf die Ermittlung von Korrelationen naumlher eingehen und sodann ausgewaumlhlte (statistische) Pruumlfkriterien erlaumlutern
5211 Korrelationsanalyse zur Aufdeckung der Variablenzusammenhaumlnge
Faktoren die als hinter den Variablen stehende Groumlszligen angesehen werden reshypraumlsentieren den Zusammenhang zwischen verschiedenen Ausgangsvariablen Beshyvor solche Faktoren ennittelt werden koumlnnen ist es zunaumlchst erforderlich die Zushysammenhaumlnge zwischen den Ausgangsvariablen meszligbar zu machen Als meshythodisches Hilfsmittel wird hierzu die Korrelationsrechnung herangezogen
Bereits anhand der Korrelationen laumlszligt sich erkennen ob Zusammenhaumlnge zwishyschen Paaren von Variablen bestehen so daszlig Variablen als voneinander abhaumlngig und damit als buumlndelungsfaumlhig angesehen werden koumlnnen
Fuumlr die Mittelwertmatrix (Abbildung 54) in obigem Beispiel laumlszligt sich zB die Korrelation zwischen x 1 (Anteil ungesaumlttigter Fettsaumluren) und x2 (Kaloriengehalt) wie folgt berechnen
~ IV taAtvJuAtJ(U)0
Korrelationskoeffizient
K 2(Xkl-XI)(XkZ -X2)
k = I (1)r = -===========XX2 I K K
2 (Xkl _X))2 2(XkZ -X2Y k = I k = I
mit
Auspraumlgung der Variablen I bei Objekt k (in unserem BeispielXkl laumluft k von 1 bis 6 (6 Markenraquo Mittelwert der Auspraumlgung von Variable 1 uumlber alle Objekte k Xl Auspraumlgung der Variablen 2 bei Objekt k xkZ Mittelwert der Auspraumlgung von Variable 2 uumlber alle Objekte k X2
Setzt man in Formel (1) die entsprechenden Werte der Ausgangsdatenmatrix ein so ergibt sich ein Korrelationskoeffizient von rbullbull =071176 Um die im einshy
1 2
zeInen notwendigen Rechenschritte zu erleichtern bedient man sich zurErmittlung der Korrelationskoeffizienten am besten der Hilfstabelle (Abbildung 59) Dabei stellt Xl den Mittelwert uumlber alle Marken rur die Eigenschaft Ungesaumlttigte Fettshy
saumluren ((1+2+4+5+2+36=283) und X2 ftlr die Eigenschaft Kaloriengeshy
halt ((1+6+5+6+3+46=417) dar
Abbildung 59 Hilfstabelle zur Berechnung eines Korrelationskoeffizienten
(x-l() (x-llt) (x-x)(x-J()(x -x) (x-llt)
336110 1002780 580555183333 -316667Rama 336110 middot152777-083333 183333 069444Sanella 069444 097222116667 063333 136112Becel 336110 397222216667 183333 469446Du darfst 097222middot083333 -116667 069444 136111Holt Butter 002778 -002778016667 -016667 002778Weihnechtsbutter
1083334 1883333 1016666 ----__----~--------__~-~~------_
(xx) I6 (xx) I6
(x-i)(xx) k=1 k=1
1016664r =VOuml8333011883333 =071176
Berechnet man die Korrelationskoeffizienten uumlber alle Eigenschaften ergibt sich rur die Mittelwertmatrix die in Abbildung 510 abgebildete Korrelationsmatrix
vorgenenswelse L 1
Abbildung 510 Korrelationsmatrix rur das 6-Produkte-Beispiel
UNGEFETI KALORlEN VITAMIN HALTBARK PREIS
-------------------- ---_--- ----------UNGEFETT 100000 KALORlEN 071176 100000
VITAMIN Q~~Pplusmn _QJQ~~__ 19PPQQ __ HALTBARK 010894 013771 007825 ri~oumloumloumloumloumlmiddot-------------------
PREIS 004385 006652 002362 098334 100000
In der Regel empfiehlt es sich die Ausgangsdatenmatrix vorab zu standardisieren da dadurch
- die Korrelationsrechnung und die im Rahmen der Faktorenanalyse erforderlishychen Rechenschritte erleichtert werden
- Interpretationserleichterungen erzielt werden - eine Vergleichbarkeit der Variablen ermoumlglicht wird die in unterschiedlichen
Maszligeinheiten erhoben wurden (zB Einkommen gemessen in Euro und Verkauf von Guumltern in Stck)
Eine Standardisierung der Datenmatrix erfolgt durch die Bildung der Differenz zwischen dem Mittelwert und dem jeweiligen Beobachtungswert einer Variablen sowie der anschlieszligenden Division durch die Standardabweichung Dadurch wird sichergestellt daszlig der neue Mittelwert gleich Null und die Standardabweichung einer Variablen gleich Eins ist Die Werte einer standardisierten Datenmatrix beshyzeichnen wir im folgenden nicht mehr mit x sondern mit z
Standardisierte Variable
Xk -x Zkj = J j
Sj
mit
Xkj BeobachtungSlVert der Variablenj bei Objekt k
Xj Durchschnitt aller Beobachtungswerte der Variablenj uumlber alle Objekte
s j Standardabweichung der Variablen j
Zkj Standardisierter Beobachtungswert der Variablen j bei Objekt k
Aus der standardisierten Datenmatrix ergibt sich auch eine einfachere Berechnung der Korrelationsmatrix R nach folgender Formel
R=_I_ZmiddotZ (2)K-I
272 Faktorenanalyse Vorgehensweise 273
wobei Z die transponierte Matrix der standardisierten Ausgangsdatenmatrix Z darstellt
Der Leser moumlge selbst anhand des Beispiels die Guumlltigkeit der Formel uumlberpruumlshyfen Dabei wird klar werden daszlig die Korrelationsmatrix auf Basis der Ausshygangsdaten identisch ist mit der Korrelationsmatrix auf Basis der standardisierten Daten Wird die Korrelationsmatrix aus standardisierten Daten errechnet so sind in diesem Falle Varianz-Kovarianzmatrix und Korrelationsmatrix identisch Fuumlr den Korrelationskoeffizienten laumlszligt sich auch schreiben
S 1middot2 SI ( - )( - )rx =-- mit x x =--t xkl-x Xk2-x 2
1 2 S S Imiddot 2 K -1 k XI X2
Da wegen der Standardisierung die beiden Varia~zen im Nenner 1 sind folgt daszlig Korrelationskoeffizient und Kovarianz SIX2) identisch sind
Die Korrelationsmatrix zeigt dem Anwender auf welche Variablen der Ausgangsshybefragung offenbar mit welchen anderen Variablen dieser Befragung irgendwie zusammenhaumlngen Sie zeigt ihm jedoch nicht ob
I die Variablen sich gegenseitig bedingen
oder
2 das Zustandekommen der Korrelationswerte durch einen oder mehrere hinter den zusammenhaumlngenden Variablen stehenden Faktoren bestimmt wird
Angesichts der beiden klar trennbaren Bloumlcke der Korrelationsmatrix (vgL die abshygegrenzten Vierecke) laumlszligt sich vermuten daszlig die Variablen XI bis x3 und x4xS durch zwei Faktoren erklaumlrt werden koumlnnten
Ausgehend von dieser Hypothese stellt sich unmittelbar die Frage mit welchem Gewicht denn die beiden Faktoren an der Beschreibung der beobachteten Zusamshymenhaumlnge beteiligt sind Es ist ja denkbar daszlig der Faktor Gesundheit als alleinishyger Beschreibungsfaktor filr die Variablen Xl bis x3 fast filr die gesamten Untershyschiede in der Ausgangsbefragung verantwortlich ist Es kann aber auch sein daszlig er nur einen Teil der unterschiedlichen Beurteilungen in der Ausgangsbefragung erklaumlrt Die groumlszligere oder geringere Bedeutung beider Faktoren laumlszligt sich in einer Gewichtszahl ausdrucken die im Rahmen einer Faktorenanalyse auch als Eigenshywert bezeichnet wird
5Ul Eignung der Korrelationsmatrix
Zu Beginn des Abschnittes 521 hatten wir bereits darauf hingewiesen daszlig sich die Eignung der Ausgangsdaten filr faktoranalytische Zwecke in der Korrelatishyonsmatrix widerspiegelt Dabei liefern bereits die Ausgangsdaten selbst einen Anshyhaltspunkt zur Eignungsbeurteilung der Daten zum Zwecke der Faktorenanalyse da die Houmlhe der Korrelationskoeffizienten durch die Verteilung der Variablen in der Erhebungsgesamtheit (Symmetrie Schiefe und Woumllbung der Verteilung) beeinfluszligt wird Liegt einer Erhebung eine heterogene Datenstruktur zugrunde so
macht sich dies durch viele kleine Werte in der Korrelationsmatrix bemerkbar II womit eine sinnvolle Anwendung der Faktorenanalyse in Frage gestellt ist Es ist
deshalb vorab eine Prufung der Variablen auf Normalverteilung ZUmindest aber auf Gleichartigkeit der Verteilungen empfehlenswert obwohl die Faktorenanalyseselbst keine Verteilungsannahmen setzt
Bezogen auf unser 6-Produkte-Beispiel treten neben sehr hohen Werten (gt 07) insbesondere im unteren Teil der Matrix kleine Korrelationen auf (vgl Abbildung 510) so daszlig die Korrelationsmatrix selbst kein eindeutiges Urteil uumlber die Eigshynung der Daten zur Faktorenanalyse zulaumlszligt
Es ist deshalb zweckmaumlszligig weitere Kriterien zur Pruumlfung heranzuziehen Hierzu bieten sich insbesondere statistische Prufkriterien an die eine Uumlberpruumlfung der Korrelationskoeffizienten auf Eignung zur Faktorenanalyse ermoumlglichen Es ist durchaus empfehlenswert mehr als ein Kriterium zur faktoranalytischen Eignung der Datenmatrix anzuwenden da die verschiedenen Kriterien unterschiedliche Vor- und Nachteile haben Im einzelnen werden durch SPSS folgende Kriterien bereitgestellt
Signifikanzniveaus der Korrelationen
Ein Signifikanzniveau uumlberpruumlft die Wahrscheinlichkeit mit der eine ZUvor formushylierte Hypothese zutrifft oder nicht Fuumlr alle Korrelationskoeffizienten lassen sich die Signifikanzniveaus anfilhren Zuvor wird eine sogenannte Ho-Hypothese forshymuliert die aussagt daszlig kein Zusammenhang zwischen den Variablen besteht Das Signifikanzniveau des Korrelationskoeffizienten berechnet anschlieszligend mit welshycher Irrtums wahrscheinlichkeit eben diese Ho-Hypothese abgelehnt werden kann Ein beispielhaftes Signifikanzniveau von 000 bedeutet daszlig mit dieser Irrtumsshywahrscheinlichkeit die Ho-Hypothese abgelehnt werden kann sprich zu 00 wird sich der Anwender taumluschen wenn er von einem Zusammenhang ungleich Null zwischen den Variablen ausgeht Anders ausgedruckt Mit einer Wahrscheinlichshykeit von 100 wird sich die Korrelation von Null unterscheiden
Abbildung 511 Signifikanzniveaus der Korrelationskoeffizienten im 6-ProdukteshyBeispiel
KOrrelatlonmatrix
UNGEFETT KALORIEN VITAMIN HALTBARKISignIfikanz (l-seitlg) UNGEFETT PREIS05632 00111 411lSZ 46713KAlORIEN 05632 05924 39737 45018VITAMIN 00111 05924 44144 49229HALTBARK 41862 39737 44144 00021PREIS 46713 45018 48229 00021
Fuumlr unser Beispiel zeigt Abbildung 511 daszlig sich genau diejenigen Korrelationsshykoeffizienten signifikant von Null unterscheiden (niedrige Werte in Abbildung 511) die in Abbildung 510 hbhe Werte (gt 07) aufweisen waumlhrend die Korrelashy
f
274 Faktorenanalyse
tionskoeffizienten mit geringen Werten auch ein hohes Signifikanzniveau (Wertegt 04) besitzen Das bedeutet daszlig sich ZB die Korrelation zwischen den Variablen Vitamingehalt und Haltbarkeit nur mit einer Wahrscheinlichkeit von (1- 044 =) 56 von Null unterscheidet
Inverse der Korrelationsmatrix
Die Eignung einer Korrelationsmatrix fuumlr die Faktorenanalyse laumlszligt sich weiterhin an der Struktur der Inversen der Korrelationsmatrix erkennen Dabei wird davon ausgegangen daszlig eine Eignung dann gegeben ist wenn die Inverse eine Diagoshynamatrix darstellt d h die Nicht-diagonal-Elemente der inversen Korrelatishyonsmatrix moumlglichst nahe bei Null liegen Fuumlr das 6-Produkte-Beispiel zeigt Abbildung 512 daszlig insbesondere fuumlr die Werte der Variablen Ungesaumlttigte Fettshysaumluren und Vitamingehalt sowie Haltbarkeit und Preis hohe Werte auftreshyten waumlhrend alle anderen Werte relativ nahe bei Null liegen Es existiert allerdings kein allgemeinguumlltiges Kriterium dafuumlr wie stark und wie haumlufig die Nicht-diashygonal-Elemente von Null abweichen duumlrfen
Abbildung 512 Inverse der Korrelationsmatrix im 6-Produkte-Beispie1
Inverse KorrelationsmatrIx
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS UNIiIIt
KALORIEN VITAMIN
HALTBARK
PREIS
1449910 -60678
-1319772 -558018 520353
-60678 217944 -82863
-218066 204555
-1319772 -82863
1400000 479257
-440959
-558018 -218066 479257
3817871 -3126624
520353 204555
-440959 -3726624 3738542
Bartlett-Test (test of spherlcity)
Der Bartlett-Test uumlberpruumlft die Hypothese ob die Stichprobe aus einer Grundgeshysamtheit entstammt in der die Variablen unkorreliert sinds
Gleichbedeutend mit dieser Aussage ist die Frage ob die Korrelationsmatrix nur zuflillig von einer Einheitsmatrix abweicht da im Falle der Einheitsmatrix alle Nicht-diagonal-Elemente Null sind d h keine Korrelationen zwischen den Varishyablen vorliegen Es werden folgende Hypothesen formuliert
HO Die Variablen in der Erhebungsgesamtheit sind unkorreliert
H1 Die Variablen in der Erhebungsgesamtheit sind korreliert
Der Bartlett-Test setzt voraus daszlig die Variablen in der Erhebungsgesamtheit einer Normaverteiung folgen und die entsprechende Pruumlf groumlszlige annaumlhernd ChishyQuadrat-verteilt ist Letzteres aber bedeutet daszlig der Wert der Pruumlfgroumlszlige in hohem
5 Vgl Dziuban C DlShirkey E C 1974 S 358 ff bull
Vorgehensweise 275
Maszlige durch die Groumlszlige der Stichprobe beeinfluszligt wird Fuumlr unser Beispiel erbrachshyte der Bartlett-Test eine Pruumlfgroumlszlige von 17371 bei einem Signifikanzniveau von 00665 Das bedeutet daszlig mit einer Wahrscheinlichkeit von (1- 00655=)9345
davon auszugehen ist daszlig die Variablen der Erhebungsgesamtheit korreliert sind Setzt man als kritische Irrtumswahrscheinlichkeit einen Wert von 005 fest so waumlshyre fuumlr unser Beispiel die Nullhypothese anzunehmen und folglich die Korrelatishyonsmatrix nur zufaumlllig von der Einheitsmatrix verschieden Das laumlszligt dann den Schluszlig zu daszlig die Ausgangsvariablen in unserem Fall unkorreliert sind
Allerdings sei an dieser Stelle nochmals darauf hingewiesen daszlig die Anwenshydung des Bartlett-Tests eine Pruumlfung der Ausgangsdaten auf Normalverteilung voraussetzt die in unserem Fall noch erfolgen muumlszligte
Anti-Image-Kovarianz-Matrix
Der Begriff Anti-Image stammt aus der Image-Analyse von Guttmann6 Guttrnann geht davon aus daszlig sich die Varianz einer Variablen in zwei Teile zerlegen laumlszligt das Image und das Anti-Image
Das Image beschreibt dabei den Anteil der Varianz der durch die verbleibenden Variablen mit Hilfe einer multiplen Regressionsanalyse (vgl Kapitel 1) erklaumlrt werden kann waumlhrend das Anti-Image denjenigen Teil darstellt der von den uumlbrishygen Variablen unabhaumlngig istlDa die Faktorenanalyse unterstellt daszlig den Variabshylen gemeinsame Faktoren zugrunde liegen ist es unmittelbar einsichtig daszlig Varishyablen nur dann fuumlr eine Faktorenanalyse geeriiet sind wenn das Anti-Image der Variablen moumlglichst gering ausflilltDas ab bedJJltet daszlig die Nicht-diagonalshyElemente der Anti-Image-Kovarianz-Matrix m glichst nahe bei Null liegen muumlsshysen bzw diese Matrix eine Diagonamatrix darstellen sollte Fuumlr das 6-ProdukteshyBeispiel zeigt Abbildung 513 daszlig die Forderung nach einer Diagonalmatrix ershyfiiHt ist
Abbildung 513 Anti-Image-Kovarianz-Matrix im 6-Produkte-Beispiel
AnIlJmIU_atrIzen
UNGEFETT KALORIEN VITAMIN HALTBARKi Arililinage-lltovananz PREISUNuumll1 06897 -01920 -06502 -01008 00960KAlORIEN -01920 45883 -02716 -02621 02511VITAMIN -06502 02716 07143 00897 -00842HALTBARK -01008 02621 00697 02619 -02611PREIS 00960 02511 -00842 middot02611 02675
Als Kriterium dafilr wann die Forderung nach einer Diagonalmatrix erfuumlllt ist schlagen Dziuban und Shirkey vor die Korrelationsmatrix dann als fuumlr die Fakshytorenanalyse ungeeignet anzusehen wenn der Anteil der Nicht-diagonal-Elemente die ungleich Null sind (gt 009) in der Anti-Image-Kovarianzmatrix (AIC) 25
Vgl Guttmann L 1953 S 277 ff
LIO r aKlOrenanalyse
oder mehr betraumlgt7 Das trifft in unserem Fall filr keines der Nicht-diagonalshyElemente der Ale-Matrix zu womit nach diesem Kriterium die Korrelationsmatrix filr faktoranalytische Auswertungen geeignet ist
Kaiser-Meyer-Olkin-Kriterium
Waumlhrend die Uumlberlegungen von Dziuban und Shirkey auf Plausibilitaumlt beruhen haben Kaiser Meyer und Olkin versucht eine geeignete Pruumlfgroumlszlige zu entwickeln und diese zur Entscheidungsfindung heranzuziehen Sie berechnen ihre PTUumlfgroumlszlige die als measure 0sampling adequacy (MSA) bezeichnet wird auf Basis der Anshyti-Image-KorrelationsmatrixbullDas MSA-Kriterium zeigt an in welchem Umfang die Ausgangsvariablen zusammengehoumlren und dient somit als Indikator dafilr ob eine Faktorenanalyse sinnvoll erscheint oder nichtDas MSA-Kriterium erlaubt sowohl eine Beurteilung der Korrelationsmatrix insgesamt als auch einzelner Varishyablen sein Wertebereich liegt zwischen degund 1 Kaiser und Rice schlagen folgenshy
8de Beurteilungen vor
MSA 2 09 marvelous (erstaunlich) MSA 2 08 meritorious (verdienstvoll) MSA 2 07 middling (ziemlich gut) MSA 2 06 mediocre (mittelmaumlszligig) MSA 2 05 miserable (klaumlglich) MSA lt05 unacceptable (untragbar)
Sie vertreten die Meinung daszlig sich eine Korrelationsmatrix mit MSA lt 05 nicht rur eine Faktorenanalyse eignet9 Als wuumlnschenswert sehen sie einen Wert von MSA 2 08 an lO In der Literatur wird das MSA-Kriterium das auch als KaisershyMeyer-Olkin-Kriterium (KMK) bezeichnet wird als das beste zur Verrugung steshyhende Verfahren zur Pruumlfung der Korrelationsmatrix angesehen weshalb seine Anwendunrvor der Durchfuhrung einer Faktorenanalyse auf jeden Fall zu empshyfehlen ist 1
Bezogen auf unser 6-Produkte-Beispiel ergab sich rur die Korrelationsmatrix insgesamt ein MSA-Wert von 0576 womit sich rur unser Beispiel ein riur klaumlglishyches Ergebnis ergibt Daruumlber hinaus gibt SPSS in der Diagonalen der AntishyImage-Korrelationsmatrix aber auch das MSA-Kriterium rur die einzelnen Variabshylen an
7 Vgl Dziuban C DlShirkey E C 1974 S 359
8 Vgl Kaiser H FRice J 1974 S 111 ff
9 Vgl Cureton E EDAgostino R B 1983 S 389 f
10 Vgl Kaiser H F 1970 S 405
II Vgl Stewart D W 1981 S 57 f Dziuban C DlShirkey E C 1974 S 360 f
Vorgehensweise 277
Abbildung 514 Anti-Image-Korrelations-Matrix im 6-Produkte-Beispiel
Antllmlge-Matrlun
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS AntI-lmageMrrelilllOn UNGEFETT 59680middot 10794 -92633 -23717 22350
KALORIEN -10794 87789 -15001 -23906 22661 VITAMIN -92633 -15001 59755 20730 -19274 HALTSARK -23717 -23906 20730 47060 -98640 PREIS 22350 22561 -19274 -95640 45701
8 Maszlig der StlchplObenelgnung
Abbildung 514 macht deutlich daszlig lediglich die Variable Kaloriengehalt mit einem MSA-Wert von 087789 als verdienstvoll anzusehen ist waumlhrend alle uumlbshyrigen Variablen eher klaumlgliche oder untragbare Ergebnisse aufweisen Die vashyriablenspezifischen MSA-Werte liefern damit rur den Anwender einen Anshyhaltspunkt dafuumlr welche Variablen aus der Analyse auszuschlieszligen waumlren wobei sich ein sukzessiver Ausschluszlig von Variablen mit jeweiliger Pruumlfung der vorgeshystellten Kriterien empfiehlt
522 Extraktion der Faktoren
(4) Zahl der Faktoren
(5) Faktorinterp~etat~ (6) Bestimmung der
Faktorwerte
Die bisherigen Ausruhrungen haben verdeutlicht daszlig bei Faktorenanalysen groszlige Sorgfalt auf die Wahl der Untersuchungsmerkmale und -einheiten zu verwenden ist da durch die Guumlte der Korrelationsmatrix die den Startpunkt der Faktorenanalyse darstellt alle Ershygebnisse der Faktorenanalyse beeinfluszligt werden Im folgenden ist nun zu fragen wie denn nun die Faktoren rein rechnerisch aus den Variablen ermittelt werden koumlnnen Wir werden im folgenden zunaumlchst das Funshydamentaltheorem der Faktorenanalyse darstellen und anschlieszligend die Extraktion auf graphischem Wege plausibel machen Auf die Unterschiede zwischen konkreten (rechnerischen) Faktorextraktionsverfahren gehen wir dann im Zusammenhang mit der Bestimshymung der Kommunalitaumlten (Abs~hnitt 523) ein
278 Faktorenanalyse
5221 Das FundamentaItheorem
Waumlhrend die bisherigen Uumlberlegungen die Ausgangsdaten und ihre Eignung fuumlr faktoranalytische Zwecke betrafen stellt sich nun die Frage wie sich die Faktoren rechnerisch aus den Variablen ennitteln lassen Zu diesem Zweck geht die Faktoshyrenanalyse von folgender grundlegenden Annahme aus
Jeder Beobachtungswert einer Ausgangsvariablen Xj oder der stanshydardisierten Variablen Zj laumlszligt sich als eine Linearkombination mehshyrerer (hypothetischer) Faktoren beschreiben
Mathematisch laumlszligt sich dieser Zusammenhang wie folgt fonnulieren
(3a)Xkj =ajl Pkl +ap PIa + +ajQ PkQ
bzw fuumlr standardisierte x-Werte
(3b)Zkj=ajIPkl+a j2middotPIa+middot+a jQmiddotPkQ=iajqPkq
q~l
Die obige Fonnel (3b) besagt fuumlr das 2-Faktorenbeispiel nichts anderes als daszlig zB die standardisierten Beobachtungswerte fuumlr Anteil ungesaumlttigter Fettsaumluren und Vitamingehalt beschrieben werden durch die Faktoren P 1 und P2 so wie sie im Hinblick auf Marke k gesehen wurden ltPIel bzw Pk2) jeweils multipliziert mit ihren Gewichten bzw Faktorenladungen beim Merkmal j also fuumlr Faktor 1 ajl und
fuumlr Faktor 2 a2 Oie Faktorradung gibt dabei an wieviel ein Faktor mit einer Ausgangsvariablen
zu tun hat Im mathematisch-statistischen Sinne sind Faktorladungen nichts andeshyres als eine Maszliggroumlszlige fuumlr den Zusammenhang zwischen Variablen und Faktor und das ist wiederum nichts anderes als ein Korrelationskoeffizient zwischen Fakshytor und Variablen
Um die Notation zu verkuumlrzen schreibt man haumlufig den Ausdruck (3b) auch in Matrixschreibweise Identisch mit Fonnel (3b) ist daher auch folgende Mashytrixschreibweise die die Grundgleichung der Faktorenanalyse darstellt
(3c)Z=pmiddotA
Aufbauend auf diesem Grundzusammenhang laumlszligt sich dann auch eine Rechenshyvorschrift ableiten die aufzeigt wie aus den erhobenen Daten die vennuteten Fakshytoren mathematisch ennittelt werden koumlnnen
Wir hatten gezeigt daszlig die Korrelationsmatrix R sich bei standardisierten Daten wie folgt aus der Datenmatrix Z ennitteln laumlszligt
R=_I_ZZ (2) K-l
Vorgehensweise 279
Da Z aber im Rahmen der Faktorenanalyse durch P A beschrieben wird (Z =PA) ist in (2) Z durch Fonnel (3c) zu ersetzen so daszlig sich folgende Fonnet
ergibt
R=_I_PA)PA) (4)K I
Nach Aufloumlsung der Klammem ergibt sich nach den Regeln der Matrixmultiplishykation
r------- R=_I_APPA=A-I_pPA (5)
K-I ~
~
Da alle Daten standardisiert sind laumlszligt sich der _1_ ptP Ausdruck in Formel (5)K-l ----y---J
auch als K(Jrrelationsmatrix der Faktoren (C) bezeichnen (vgl Fonnel (2raquo so daszlig sich schreiben laumlszligt
R = AmiddotCmiddotA (6)
Da die Faktoren als unkorreliert angenommen werden entspricht C einer Einheitsshymatrix (einer Matrix die auf der Hauptdiagonalen nur Einsen und sonst Nullen enthaumllt) Da die Multiplikation einer Matrix mit einer Einheitsmatrix aber wieder die Ausgangsmatrix ergibt vereinfacht sich die Fonnel (6) zu
R = AmiddotA (7)
Die Beziehungen (6) und (7) werden von Thurstone als das Fundamentaltheorem der Faktorenanalyse bezeichnet da sie den Zusammenhang zwischen Korrelatishyonsmatrix und Faktorladungsmatrix beschreiben
Das Fundarnentaltheorem der Faktorenanalyse besagt nicht anderes als daszlig sich die Korrelationsmatrix durch die Faktorladungen (Matrix A) und die Korrelationen zwischen den Faktoren (Matrix C) reproduzieren laumlszligt Fuumlr den Fall daszlig man von unabhaumlngigen (orthogonalen) Faktoren ausgeht reduziert sich das Funshydamentaltheorem auf Fonnel (7) Dabei muszlig sich der Anwender allerdings bewuszligt sein daszlig das Fundamentaltheorem der Faktorenanalyse nach Fonnel (7) stets nur unter der Praumlmisse einer Linearverknuumlpfung und Unabhaumlngigkeit der Faktoren Guumlltigkeit besitzt
5222 Graphische Interpretation von Faktoren
Der Infonnationsgehalt einer Korrelationsmatrix laumlszligt sich auch graphisch in einem Vektor-Diagramm darstellen in dem die jeweiligen Korrelationskoeffizienten als Winkel zwischen zwei Vektoren dargestellt werden Zwei Vektoren werden dann
280 Faktorenanalyse
als linear unabhaumlngig bezeichnet wenn sie senkrecht (orthogonal) aufeinander steshyhen Sind die beiden betrachteten Vektoren (Variablen) jedoch korreliert ist der Korrelationskoeffizient also C 0 zB 05 dann wird dies graphisch durch einen Winkel von 60deg zwischen den beiden Vektoren dargestellt
Es stellt sich die Frage Warum entspricht ein Korrelationskoeffizient von 05 genau einem Winkel von 60deg Die Verbindung wird uumlber den Cosinus des jeshy
weiligen Winkels hergestellt Verdeutlichen wir uns dies anhand des Ausgangsbeispiels (Abbildung 515)
In Abbildung 515 repraumlsentieren die Vektoren AC und AB zB die beiden Vashyriablen Kaloriengehalt und Vitamingehalt Zwischen den beid~_yariablen moumlge eine Korrelation von 05 gemessen worden sein Der Vektor AC der den Kaloriengehalt repraumlsentiert und der genau wie AB aufgrund der Standardisierung eine Laumlnge von 1 hat weist zu AB einen Winkel von 60deg auf Der Cosinus des Winkels 60deg der die Stellung der beiden Variablen zueinander (ihre Richtung) anmiddot gibt ist definiert als Quotient aus Ankathete und Hypothenuse also als AD AC Da AC aber gleich 1 ist ist der Korrelationskoeffizient identisch mit der Strecke
AD Wie Abbildung 516 ausschnitthaft zeigt ist zB der Cosinus eines 60deg-Winkels
gleich 05 Entsprechend laumlszligt sich jeder beliebige Korrelationskoeffizient zwischen zwei Variablen auch durch zwei Vektoren mit einem genau definierten Winkel zushyeinander darstellen Verdeutlichen wir uns dies noch einmal anband einer Korrelamiddot tionsmatrix mit drei Variablen (Abbildung 517)
Abbildung 515 Vektordarstellung einer Korrelation zwischen zwei Variablen
c
A 0 B
)V
Standardisierte LOnge von 1
Vorgehensweise 281
Abbildung 516 Werte rur den Cosinus (entnommen aus Geliert W JKuumlstnerHlHellwich MfKaumlstner H Kleine Enzyshyklopaumldie Mathematik Leipzig 1969 S 799)
Grad CO Grad cO
45 07071 90 00000 44 7193 89 0175 43 7314 88 0349 42 7431 87 0523 41 7547 86 0698 40 07660 85 0872 39 7771 84 1045 38 7880 83 1219 37 7986 82 1392 36 8090 81 1564 35 8192 80 01736 34 8290 79 1908 33 8387 78 2079 32 8480 77 2250 31 8572 76 2419 30 08660 75 2588 29 8746 74 2756 28 8829 73 2924 27 8910 72 3090 26 8988 71 3256 25 9063 70 03420 24 9135 69 3584 23 9205 68 3746 22 9272 67 3907 21 9336 middot66 4067 ZO 09397 65 4226 19 9455 64 4384 18 9511 63 4540 17 9563 62 4695 16 9613 61 4848 15 9659 60 05000 14 9703 59 5150 13 9744 58 5299 12 9781 57 5446 11 9816 56 5592 10 09848 55 5736 9 9877 54 5878 8 9903 53 6018 7 9925 52 6157 6 9945 51 6293 5 9962 50 06428 4 9976 49 6561 3 9986 48 6691 2 9994 47 6820 1 9998 46 6947 0 10000 45 7071
282 Faktorenanalyse
Abbildung 517 Korrelationsmatrix
R =r68660 1 06428lO1736 ~
R laumlszligt sich auch anders schreiben (vgl Abbildung 518)
Abbildung 518 Korrelationsmatrix mit Winkelausdrucken
l0deg R = 30deg 0deg
80deg 50deg 0deg
Der Leser moumlge die entsprechenden Werte selbst in einer Cosinus-Tabelle uumlbershy
pruumlfenDie der oben gezeigten Korrelationsmatrix zugrundeliegenden drei Variablen
und ihre Beziehungen zueinander lassen sich relativ leicht in einem zweidimen sionalen Raum darstellen (Abbildung 519)
Abbildung 519 Graphische Darstellung des 3-Variablen-Beispiels
Vektor X2
Vektorx3Vektor Xl
Vorgehensweise 283
Je mehr Variable jedoch zu beruumlcksichtigen sind desto mehr Dimensionen werden benoumltigt um die Vektoren in ihren entsprechenden Winkeln zueinander zu positioshy
nieren Die Faktorenanalyse trachtet nun danach das sich uumlber die Korrelationsshykoeffizienten gemessene Verhaumlltnis der Variablen zueinander in einem moumlglichst gering dimensionierten Raum zu reproduzieren Die Zahl der benoumltigten Achsen gibt dann die entsprechende Zahl der Faktoren an
Wenn man die Achsen als Faktoren ansieht dann stellt sich unmittelbar die Frashyge Wie werden diese Achsen (Faktoren) in ihrer Lage zu den jeweiligen Vektoren (Variablen) bestimmt
Dazu vergegenwaumlrtigt man sich am besten das Bild eines halboffenen Schirmes Die Zacken des Schirmgestaumlnges die alle in eine bestimmte Richtung weisend die Variablen repraumlsentieren lassen sich naumlherungsweise auch durch den Schirmstock darstellen Vereinfacht man diese Uumlberlegung aus DarstellungsgrQnden noch weishyter auf den 2-Variablen-Fall wie in AbbiIdu8520 die einen Korrelationskoshyeffizienten von 05 fuumlr die durch die Vektoren OA und OB dargestellten Variablen repraumlsentiert dann gibt der Vektor OC eine zusammenfassende (faktorielle) Beshyschreibung wieder Die beiden Winkel von 30deg zwischen Vektor I bzw Vektor II und Faktor-Vektor geben wiederum an inwieweit der gefundene Faktor mit Vekshytor (Variable) I bzw II zusammenhaumlngt Sie repraumlsentieren ebenfalls Korrelationsshykoeffizienten und zwar die zwischen den jeweiligen Variablen und dem Faktor Diese Korrelationskoeffizienten hatten wir oben als Faktorladungen bezeichnet Die Faktorladungen des 1 Faktors betragen also in bezug auf Variable I und Varishyable II cos 30deg = 08660
Abbildung 520 FaktorlOsung bei 2 Variablen
j
A
Vektor x
~---------__------~---- C
Resultante
e Vektor X
284 Faktorenanalyse
5223 Das Problem der Faktorextraktion
Nachdem wir nun wissen was eine Faktorladung inhaltlich bedeutet ist zu fragen Wie findet man einen solchen Vektor (Faktor) der stellvertretend ftir mehrere zushysammenhaumlngende Variable fungieren kann Erinnern wir uns noch einmal des Ausgangsbeispiels Aufstrichfette waren nach den ftinfMerkmalen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt - Haltbarkeit - Preis bewertet worden l2
Aus dieser Bewertung sei die Korrelationsmatrix in Abbildung 521 berechnet worden
Abbildung 521 Spiegelbildlich identische KOlTelationsmatrix
x X x x x
x 70 100 09848 90middotX 03420 30x 00000 10middotx
X -01736
Diese Korrelationsmatrix enthaumllt in der unteren Dreiecks-Matrix die Korrelationsshywerte in der oberen (spiegelbildlich identischen) Dreiecks-Matrix die entshysprechenden Winkel Graphisch ist der Inhalt dieser Matrix in Abbildung 522 darshygestellt
Das Beispiel wurde so gewaumlhlt daszlig die Winkel zwischen den Faktoren in einer zweidimensionalen Darstellung abgebildet werden koumlnnen - ein Fall der in der Realitaumlt allerdings kaum relevant ist
Wie findet man nun den 1 Faktor in dieser Vektordarstellung Bleiben wir zunaumlchst bei der graphischen Darstellung dann sucht man den
Schwerpunkt aus den ftinf Vektoren Der Leser moumlge sich dazu folgendes verdeutlichen
In Abbildung 522 ist der Faktor nichts anderes als die Resultante der funfVektoshyren Wuumlrden die ftinfVektoren funf Seile darstellen mit einem Gewicht in 0 und jeweils ein Mann wuumlrde mit gleicher Staumlrke an den Enden der Seile ziehen dann wuumlrde sich das Gewicht in eine bestimmte Richtung bewegen (vgl die gestrichelte
12 Es werden hier andere Werte als im Ausgangsbeispiel verwendet um zunaumlchst eine einshydeutige graphische Loumlsung zu ermoumlglichen
Vorgehensweise 285
Linie in Abbildung 523) Diesen Vektor bezeichnen wir als Resultante Er ist die graphische Repraumlsentation des 1 Faktors
Abbildung 522 Graphische Darstellung des 5-Variablen-Beispiels
~
XsXl
bull
Abbildung 523 Graphische Darstellung des Schwerpunktes
X2
XIX
Faktorshyvektor2
Betrachtet man nun die jetzt gebildeten Winkel zwischen dem 1 Faktor und den Ausgangsvektoren dann hat man auch die gesuchten Faktorladungen gefunden
(Erste Reshysultante)
4512
-------o
- -
286 Faktorenanalyse
Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen
Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben
Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge
die Werte selbst uumlberpruumlfen)
Abbildung 524 Einfaktorielle Ladungsmatrix
Faktor
05707Xl 07046x2 bull 09668x3
08211x4
07096
Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)
Abbildung 525 ZweifaktorieHe Ladungsmatrix
Faktor 1 Faktor 2
Xl 05707 -08211
x2 07046 -07096
x3 09668 02554
x4 08211 05707
Xs 07096 07046
Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa
Vorgehensweise 287
In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum
I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1
~~ 00
2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation
Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist
Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt
Sf = 1 = Ijj (9)J
3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt
Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)
Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung
Resutlanie 2 (Faktor 2)
A Vektor x o
120lt= fH bull C Resultante 1 (Faktor 1)
B Vektor x
288 Faktorenanalyse
Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB
Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel
Wenn obige Behauptung stimmt muumlszligte gelten
(lOa)[~J +[~~J =1
Uumlberpruumlfung 2 2 uumlc2
OC 00 +002 (lOb)--+-shy 2
OA OA OA2 2
In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)
Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)
(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)
2 2 OC +00
4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten
sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)
wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-
q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1
(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix
(2) Extraktion der
(5) Faktorinterpretatiln
(6) Bestimmung der Faktorwerte
Vorgehensweise 289
523 Bestimmung der Kommunalitaumlten
In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem
Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy
fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig
mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da
J
i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins
Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung
erklaumlrte Variant
standardisierte Gesamtvariant = 1
290 Faktorenanalyse
Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung
2 a j1 =07
2 2 8 j2 = 01 siRest= 02
Kommunalitat H =08 (erllt1arte Varianz)
Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)
R AmiddotA+U (7a)
Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet
Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion
Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer
Vorgehensweise 291
100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY
In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy
weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen
Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen
1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen
2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit
2 2I ~ ~ R j ~ mx rjk
Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse
- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy
13 Vgl Loehlin J C 1998 S 154 14
Vgl Uberla K 1972 S 155 ff
292 Faktorenanalyse
nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird
- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit
Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy
15formationsverlust deklariert wird
Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen
Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy
15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt
Vorgehensweise 293
tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder
Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren
Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen
Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren
Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist
Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf
Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden
Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel
Kommunalltlten
Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325
Extraktionsmelhode Hauptachsen-Faktorenanalyse
bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix
294 Faktorenanalyse
Abbildung 530 Faktorladungen im 6-Produkte-Beispiel
Faktoranmatrixmiddot
Faktor
1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608
Extraktionsmethode Hauptachsen-Faktorenanalyse
a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt
Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert
Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel
Reproduzierte Korrelationen
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT
KALORIEN
VITAMIN
HALTBARK
PREIS
96845 71193 96034 11035 04241
71193 52552b
70480
12709
07717
96034 70480 95292b
08461 01722
11035
12709 08461 99056b
8325
04241 07717 01722 98325 98070b
Residuun1 UNGEFETi
KALORIEN
VITAMIN
HALTBARK
PREIS
-00017 00101
-00141 00144
-00017
-00083 01001
- 01005
00101 -00083
-00036 00640
-00141 01061
-00636
00010
00144 -01005 00640 00010
ExtrakHonsmethode Hauptllchsenfaktorenanalyse
a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005
b Reproduzierte Kommunalltaumlten
Vorgehensweise 295
Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen
Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R
524 Zahl der Faktoren
(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix
(2) Extraktion der Faktoren
(6) Bestimmung der Faktorwerte
Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff
Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-
q N
trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N
Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden
Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy
296 Faktorenanalyse
Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre
Abbildung 532 Bestimmung der Eigenwerte
Faktorenmatrix
Faktor
1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)
Eigenwerte 25068 19112
Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil
Kom munalltaumlten
Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807
- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren
V orgehensweise 297
Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung
Abbildung 534 Scree-Test im 6-Produkte-Beispiel
Eigen- Screeplot wert 30
25
20
15
Kaiser-Kriterium
10 1 Elbow5
00 2 3 4 5
Faktomummer
298 Faktorenanalyse
525 Faktorinterpretation
Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)
Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt
(1) Variablenauswalll und Errechnung der Korrelationsmalrix
(2) Extraktion der Faktoran
(3) Bestimmung der Kommunalltaumllen
(6) Bestimmung derFaktorwerte _______---11
middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull
geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht
Abbildung 535 Faktorladungen im 6-Produkte-Beispiel
Preis Haltbarkeit
Extraktionsmethode Hauptachsen-Faktorenanalyse
Vorgehensweise 299
Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist
Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig
Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16
Abbildung 536 Unrotierte Faktorladungen
F
F
Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung
Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f
300 Faktorenanalyse
536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy
tert
Abbildung 537 Rotierte Faktorladungen
F (Ausgangssituation)2
11 F2 (rotiert)
F1
-- shy
(Ausgangssituation)
11
F1 (rotiert)
SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen
1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen
(rechtwinkligen) Rotation
2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren
Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die
vorgenenswelse j U 1
Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind
Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel
Faktor
1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt
Haltbarkeit
72152 bull 07020
07962 I 99208 Preis 01060 99025
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung
Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen
A bull =A T mit TC~SI7 - sina ] sma cosa
Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links
A T A 094331 - 028039 098357 003229
[C0s341570 - sin34 157 ]070669 016156 072152 007020
sin34157deg cos34157092825 - 030210 097615 000694
038926 091599 007962 099208
032320 093608 001060 099025
Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)
Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix
Faktor 1 2
1 94868 31622
2 -31622 94868
Il
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung
Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig
von a=1843deg
526 Bestimmung der Faktorwerte
(1) Variablenauswanl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitaumlten
Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte
Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt
(3c)Z=PmiddotA
Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY
(12)Z AT1p AAT
Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt
(13)ZArl=pE
Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten
(3c) wird von rechts mit A multipliziert
ZmiddotA=PmiddotAmiddotA (15)
Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar
ZAmiddot(A At1=P(A A) (A Atl (16)
Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt
P=ZA(AAt l (17)
In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren
In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term
AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte
Abbildung 540 Koeffizientenmatrix der Faktorwerte
Faktor 1 2
Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression
Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die
xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf
SjDa p E=P ist ergibt sich
Seite 271 zu (14)
P=ZAT
304 Faktorenanalyse
Abbildung 541 Standardisierte Ausgangsdatenmatrix Z
45ampt6R4LJL4
Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542
Abbildung 542 Faktorwerte im 6-Produkte-Beispiel
Vorgehensweise 305
Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel
Du darfst
VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG
E 11 BecelS
U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T
Sanella IIII Holl Butter
-1
bull Rama
-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18
WIRTSCHAFTLICHKEIT
Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen
527 Zusammenfassende Darstellung der Faktorenanalyse
Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy
e Vorgehensweise 307 306 Faktorenanalyse
Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen
sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-
schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy
tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig
wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy
nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy
chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy
analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte
Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht
Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der
Verwendung des Verfahrens offenzulegen
I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _
CQ)l2CQgtQ ~ i
-Q)C t l5~11
0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C
CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O
~ ~ 11 t 3
uj~fi
t Imiddot~ J1 ~SHaa
It c~
c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~
-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi
o~ ~ -gEG)
I ~l c c ~l~ampi
2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E
U~a ]i E
J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy
~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--
----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt
Fallbeispiel 309308 Faktorenanalyse
Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert
531 Problemstellung
In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften
Variable und Objekte des BeispielsAbbildung 545
EigenschaftenMarken M k (k=I Il) xj(j=I IO)
A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado
5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H
I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama
Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist
Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)
Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern
Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse
---
310Faktorenanalyse
532 Ergebnisse
1 Variablenauswahl und Errechnung der Korrelationsmatrix
Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung
548 wiedergegeben
Abbildung 548 Die Korrelationskoeffizienten -_ -
-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy
In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der
Fallbeispiel 311
Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet
Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie
-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -
06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170
-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260
62444 -97126 66229 -83532 -62589
-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545
-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno
Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)
Abbildung 550 Dialogfeld Deskriptive Statistik
312 Faktorenanalyse
2 Bestimmung der Kommunalitilten
Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt
wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend
bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich
von den Startwerten abweichen
Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten
Hauptkomponentenanalyse Hauptachsenanalyse
Variable Korrunuriali- Kommunali- Korrununali- Kommunali-
Ut (Startwerte)
tlt (Endwerte)
tlIl (Startwerte )
tlIl (End werte)
STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR
100000 100000 100000 100000 100000 100000 100000 100000 100000 100000
88619
76855
89167 85324 76043 84012 80223 92668 63297 88786
97414
89018
79497
85847
96501
98810
97132
99166
78019
96445
85325
55717
85754
91075
55819
82330
73903
94796
40402
87851
Fallbeispiel 313
Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy
I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren
Abbildung 552 Dialogfeld Extraktion
Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist
3 Wabl der Extraktionsmetbode
Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen
4 Zabl der Faktoren
Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen
Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet
Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch
17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f
1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden
Erklaumlrte Gesamtvarianz
Anfaumlngliche Eigenwerte
314 Faktorenanalyse
Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy
den sich fUnfFaktoren ergeben
Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien
95) der Varianz erklaumlrt sind
2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)
3 Extrahiere n (zB 3) Faktoren
4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy
renzahl
5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein
6 Extrahiere alle Faktoren die nach der
Vom Computer automatisch verwandt wenn keine andere Spezifikation
Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden
Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden
Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist
Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt
Fallbeispiel 315
Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil
Faktor 1
2 3
4
5
6
7
8
9
10
Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden
Abbildung 555 Scree-Test und Kaiser-Kriterium
Eigen- -=gtcreeplot wert
5
4
3
2
10
o Kaisershy
~ 3 i i 7 i Q
Faktornummer
Gesamt 505188
177106
142700
81935
42961
24709
15928
06190
02943
00340
der Varianz 5051883
1771061
1427002
819349 429611
247085
159275
61902
29434
03398
Kumulierte 5051883
6822944
8249946
9069295
9498905
9745991
9905266
9967168
9996602
10000000
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
~ IV taAtvJuAtJ(U)0
Korrelationskoeffizient
K 2(Xkl-XI)(XkZ -X2)
k = I (1)r = -===========XX2 I K K
2 (Xkl _X))2 2(XkZ -X2Y k = I k = I
mit
Auspraumlgung der Variablen I bei Objekt k (in unserem BeispielXkl laumluft k von 1 bis 6 (6 Markenraquo Mittelwert der Auspraumlgung von Variable 1 uumlber alle Objekte k Xl Auspraumlgung der Variablen 2 bei Objekt k xkZ Mittelwert der Auspraumlgung von Variable 2 uumlber alle Objekte k X2
Setzt man in Formel (1) die entsprechenden Werte der Ausgangsdatenmatrix ein so ergibt sich ein Korrelationskoeffizient von rbullbull =071176 Um die im einshy
1 2
zeInen notwendigen Rechenschritte zu erleichtern bedient man sich zurErmittlung der Korrelationskoeffizienten am besten der Hilfstabelle (Abbildung 59) Dabei stellt Xl den Mittelwert uumlber alle Marken rur die Eigenschaft Ungesaumlttigte Fettshy
saumluren ((1+2+4+5+2+36=283) und X2 ftlr die Eigenschaft Kaloriengeshy
halt ((1+6+5+6+3+46=417) dar
Abbildung 59 Hilfstabelle zur Berechnung eines Korrelationskoeffizienten
(x-l() (x-llt) (x-x)(x-J()(x -x) (x-llt)
336110 1002780 580555183333 -316667Rama 336110 middot152777-083333 183333 069444Sanella 069444 097222116667 063333 136112Becel 336110 397222216667 183333 469446Du darfst 097222middot083333 -116667 069444 136111Holt Butter 002778 -002778016667 -016667 002778Weihnechtsbutter
1083334 1883333 1016666 ----__----~--------__~-~~------_
(xx) I6 (xx) I6
(x-i)(xx) k=1 k=1
1016664r =VOuml8333011883333 =071176
Berechnet man die Korrelationskoeffizienten uumlber alle Eigenschaften ergibt sich rur die Mittelwertmatrix die in Abbildung 510 abgebildete Korrelationsmatrix
vorgenenswelse L 1
Abbildung 510 Korrelationsmatrix rur das 6-Produkte-Beispiel
UNGEFETI KALORlEN VITAMIN HALTBARK PREIS
-------------------- ---_--- ----------UNGEFETT 100000 KALORlEN 071176 100000
VITAMIN Q~~Pplusmn _QJQ~~__ 19PPQQ __ HALTBARK 010894 013771 007825 ri~oumloumloumloumloumlmiddot-------------------
PREIS 004385 006652 002362 098334 100000
In der Regel empfiehlt es sich die Ausgangsdatenmatrix vorab zu standardisieren da dadurch
- die Korrelationsrechnung und die im Rahmen der Faktorenanalyse erforderlishychen Rechenschritte erleichtert werden
- Interpretationserleichterungen erzielt werden - eine Vergleichbarkeit der Variablen ermoumlglicht wird die in unterschiedlichen
Maszligeinheiten erhoben wurden (zB Einkommen gemessen in Euro und Verkauf von Guumltern in Stck)
Eine Standardisierung der Datenmatrix erfolgt durch die Bildung der Differenz zwischen dem Mittelwert und dem jeweiligen Beobachtungswert einer Variablen sowie der anschlieszligenden Division durch die Standardabweichung Dadurch wird sichergestellt daszlig der neue Mittelwert gleich Null und die Standardabweichung einer Variablen gleich Eins ist Die Werte einer standardisierten Datenmatrix beshyzeichnen wir im folgenden nicht mehr mit x sondern mit z
Standardisierte Variable
Xk -x Zkj = J j
Sj
mit
Xkj BeobachtungSlVert der Variablenj bei Objekt k
Xj Durchschnitt aller Beobachtungswerte der Variablenj uumlber alle Objekte
s j Standardabweichung der Variablen j
Zkj Standardisierter Beobachtungswert der Variablen j bei Objekt k
Aus der standardisierten Datenmatrix ergibt sich auch eine einfachere Berechnung der Korrelationsmatrix R nach folgender Formel
R=_I_ZmiddotZ (2)K-I
272 Faktorenanalyse Vorgehensweise 273
wobei Z die transponierte Matrix der standardisierten Ausgangsdatenmatrix Z darstellt
Der Leser moumlge selbst anhand des Beispiels die Guumlltigkeit der Formel uumlberpruumlshyfen Dabei wird klar werden daszlig die Korrelationsmatrix auf Basis der Ausshygangsdaten identisch ist mit der Korrelationsmatrix auf Basis der standardisierten Daten Wird die Korrelationsmatrix aus standardisierten Daten errechnet so sind in diesem Falle Varianz-Kovarianzmatrix und Korrelationsmatrix identisch Fuumlr den Korrelationskoeffizienten laumlszligt sich auch schreiben
S 1middot2 SI ( - )( - )rx =-- mit x x =--t xkl-x Xk2-x 2
1 2 S S Imiddot 2 K -1 k XI X2
Da wegen der Standardisierung die beiden Varia~zen im Nenner 1 sind folgt daszlig Korrelationskoeffizient und Kovarianz SIX2) identisch sind
Die Korrelationsmatrix zeigt dem Anwender auf welche Variablen der Ausgangsshybefragung offenbar mit welchen anderen Variablen dieser Befragung irgendwie zusammenhaumlngen Sie zeigt ihm jedoch nicht ob
I die Variablen sich gegenseitig bedingen
oder
2 das Zustandekommen der Korrelationswerte durch einen oder mehrere hinter den zusammenhaumlngenden Variablen stehenden Faktoren bestimmt wird
Angesichts der beiden klar trennbaren Bloumlcke der Korrelationsmatrix (vgL die abshygegrenzten Vierecke) laumlszligt sich vermuten daszlig die Variablen XI bis x3 und x4xS durch zwei Faktoren erklaumlrt werden koumlnnten
Ausgehend von dieser Hypothese stellt sich unmittelbar die Frage mit welchem Gewicht denn die beiden Faktoren an der Beschreibung der beobachteten Zusamshymenhaumlnge beteiligt sind Es ist ja denkbar daszlig der Faktor Gesundheit als alleinishyger Beschreibungsfaktor filr die Variablen Xl bis x3 fast filr die gesamten Untershyschiede in der Ausgangsbefragung verantwortlich ist Es kann aber auch sein daszlig er nur einen Teil der unterschiedlichen Beurteilungen in der Ausgangsbefragung erklaumlrt Die groumlszligere oder geringere Bedeutung beider Faktoren laumlszligt sich in einer Gewichtszahl ausdrucken die im Rahmen einer Faktorenanalyse auch als Eigenshywert bezeichnet wird
5Ul Eignung der Korrelationsmatrix
Zu Beginn des Abschnittes 521 hatten wir bereits darauf hingewiesen daszlig sich die Eignung der Ausgangsdaten filr faktoranalytische Zwecke in der Korrelatishyonsmatrix widerspiegelt Dabei liefern bereits die Ausgangsdaten selbst einen Anshyhaltspunkt zur Eignungsbeurteilung der Daten zum Zwecke der Faktorenanalyse da die Houmlhe der Korrelationskoeffizienten durch die Verteilung der Variablen in der Erhebungsgesamtheit (Symmetrie Schiefe und Woumllbung der Verteilung) beeinfluszligt wird Liegt einer Erhebung eine heterogene Datenstruktur zugrunde so
macht sich dies durch viele kleine Werte in der Korrelationsmatrix bemerkbar II womit eine sinnvolle Anwendung der Faktorenanalyse in Frage gestellt ist Es ist
deshalb vorab eine Prufung der Variablen auf Normalverteilung ZUmindest aber auf Gleichartigkeit der Verteilungen empfehlenswert obwohl die Faktorenanalyseselbst keine Verteilungsannahmen setzt
Bezogen auf unser 6-Produkte-Beispiel treten neben sehr hohen Werten (gt 07) insbesondere im unteren Teil der Matrix kleine Korrelationen auf (vgl Abbildung 510) so daszlig die Korrelationsmatrix selbst kein eindeutiges Urteil uumlber die Eigshynung der Daten zur Faktorenanalyse zulaumlszligt
Es ist deshalb zweckmaumlszligig weitere Kriterien zur Pruumlfung heranzuziehen Hierzu bieten sich insbesondere statistische Prufkriterien an die eine Uumlberpruumlfung der Korrelationskoeffizienten auf Eignung zur Faktorenanalyse ermoumlglichen Es ist durchaus empfehlenswert mehr als ein Kriterium zur faktoranalytischen Eignung der Datenmatrix anzuwenden da die verschiedenen Kriterien unterschiedliche Vor- und Nachteile haben Im einzelnen werden durch SPSS folgende Kriterien bereitgestellt
Signifikanzniveaus der Korrelationen
Ein Signifikanzniveau uumlberpruumlft die Wahrscheinlichkeit mit der eine ZUvor formushylierte Hypothese zutrifft oder nicht Fuumlr alle Korrelationskoeffizienten lassen sich die Signifikanzniveaus anfilhren Zuvor wird eine sogenannte Ho-Hypothese forshymuliert die aussagt daszlig kein Zusammenhang zwischen den Variablen besteht Das Signifikanzniveau des Korrelationskoeffizienten berechnet anschlieszligend mit welshycher Irrtums wahrscheinlichkeit eben diese Ho-Hypothese abgelehnt werden kann Ein beispielhaftes Signifikanzniveau von 000 bedeutet daszlig mit dieser Irrtumsshywahrscheinlichkeit die Ho-Hypothese abgelehnt werden kann sprich zu 00 wird sich der Anwender taumluschen wenn er von einem Zusammenhang ungleich Null zwischen den Variablen ausgeht Anders ausgedruckt Mit einer Wahrscheinlichshykeit von 100 wird sich die Korrelation von Null unterscheiden
Abbildung 511 Signifikanzniveaus der Korrelationskoeffizienten im 6-ProdukteshyBeispiel
KOrrelatlonmatrix
UNGEFETT KALORIEN VITAMIN HALTBARKISignIfikanz (l-seitlg) UNGEFETT PREIS05632 00111 411lSZ 46713KAlORIEN 05632 05924 39737 45018VITAMIN 00111 05924 44144 49229HALTBARK 41862 39737 44144 00021PREIS 46713 45018 48229 00021
Fuumlr unser Beispiel zeigt Abbildung 511 daszlig sich genau diejenigen Korrelationsshykoeffizienten signifikant von Null unterscheiden (niedrige Werte in Abbildung 511) die in Abbildung 510 hbhe Werte (gt 07) aufweisen waumlhrend die Korrelashy
f
274 Faktorenanalyse
tionskoeffizienten mit geringen Werten auch ein hohes Signifikanzniveau (Wertegt 04) besitzen Das bedeutet daszlig sich ZB die Korrelation zwischen den Variablen Vitamingehalt und Haltbarkeit nur mit einer Wahrscheinlichkeit von (1- 044 =) 56 von Null unterscheidet
Inverse der Korrelationsmatrix
Die Eignung einer Korrelationsmatrix fuumlr die Faktorenanalyse laumlszligt sich weiterhin an der Struktur der Inversen der Korrelationsmatrix erkennen Dabei wird davon ausgegangen daszlig eine Eignung dann gegeben ist wenn die Inverse eine Diagoshynamatrix darstellt d h die Nicht-diagonal-Elemente der inversen Korrelatishyonsmatrix moumlglichst nahe bei Null liegen Fuumlr das 6-Produkte-Beispiel zeigt Abbildung 512 daszlig insbesondere fuumlr die Werte der Variablen Ungesaumlttigte Fettshysaumluren und Vitamingehalt sowie Haltbarkeit und Preis hohe Werte auftreshyten waumlhrend alle anderen Werte relativ nahe bei Null liegen Es existiert allerdings kein allgemeinguumlltiges Kriterium dafuumlr wie stark und wie haumlufig die Nicht-diashygonal-Elemente von Null abweichen duumlrfen
Abbildung 512 Inverse der Korrelationsmatrix im 6-Produkte-Beispie1
Inverse KorrelationsmatrIx
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS UNIiIIt
KALORIEN VITAMIN
HALTBARK
PREIS
1449910 -60678
-1319772 -558018 520353
-60678 217944 -82863
-218066 204555
-1319772 -82863
1400000 479257
-440959
-558018 -218066 479257
3817871 -3126624
520353 204555
-440959 -3726624 3738542
Bartlett-Test (test of spherlcity)
Der Bartlett-Test uumlberpruumlft die Hypothese ob die Stichprobe aus einer Grundgeshysamtheit entstammt in der die Variablen unkorreliert sinds
Gleichbedeutend mit dieser Aussage ist die Frage ob die Korrelationsmatrix nur zuflillig von einer Einheitsmatrix abweicht da im Falle der Einheitsmatrix alle Nicht-diagonal-Elemente Null sind d h keine Korrelationen zwischen den Varishyablen vorliegen Es werden folgende Hypothesen formuliert
HO Die Variablen in der Erhebungsgesamtheit sind unkorreliert
H1 Die Variablen in der Erhebungsgesamtheit sind korreliert
Der Bartlett-Test setzt voraus daszlig die Variablen in der Erhebungsgesamtheit einer Normaverteiung folgen und die entsprechende Pruumlf groumlszlige annaumlhernd ChishyQuadrat-verteilt ist Letzteres aber bedeutet daszlig der Wert der Pruumlfgroumlszlige in hohem
5 Vgl Dziuban C DlShirkey E C 1974 S 358 ff bull
Vorgehensweise 275
Maszlige durch die Groumlszlige der Stichprobe beeinfluszligt wird Fuumlr unser Beispiel erbrachshyte der Bartlett-Test eine Pruumlfgroumlszlige von 17371 bei einem Signifikanzniveau von 00665 Das bedeutet daszlig mit einer Wahrscheinlichkeit von (1- 00655=)9345
davon auszugehen ist daszlig die Variablen der Erhebungsgesamtheit korreliert sind Setzt man als kritische Irrtumswahrscheinlichkeit einen Wert von 005 fest so waumlshyre fuumlr unser Beispiel die Nullhypothese anzunehmen und folglich die Korrelatishyonsmatrix nur zufaumlllig von der Einheitsmatrix verschieden Das laumlszligt dann den Schluszlig zu daszlig die Ausgangsvariablen in unserem Fall unkorreliert sind
Allerdings sei an dieser Stelle nochmals darauf hingewiesen daszlig die Anwenshydung des Bartlett-Tests eine Pruumlfung der Ausgangsdaten auf Normalverteilung voraussetzt die in unserem Fall noch erfolgen muumlszligte
Anti-Image-Kovarianz-Matrix
Der Begriff Anti-Image stammt aus der Image-Analyse von Guttmann6 Guttrnann geht davon aus daszlig sich die Varianz einer Variablen in zwei Teile zerlegen laumlszligt das Image und das Anti-Image
Das Image beschreibt dabei den Anteil der Varianz der durch die verbleibenden Variablen mit Hilfe einer multiplen Regressionsanalyse (vgl Kapitel 1) erklaumlrt werden kann waumlhrend das Anti-Image denjenigen Teil darstellt der von den uumlbrishygen Variablen unabhaumlngig istlDa die Faktorenanalyse unterstellt daszlig den Variabshylen gemeinsame Faktoren zugrunde liegen ist es unmittelbar einsichtig daszlig Varishyablen nur dann fuumlr eine Faktorenanalyse geeriiet sind wenn das Anti-Image der Variablen moumlglichst gering ausflilltDas ab bedJJltet daszlig die Nicht-diagonalshyElemente der Anti-Image-Kovarianz-Matrix m glichst nahe bei Null liegen muumlsshysen bzw diese Matrix eine Diagonamatrix darstellen sollte Fuumlr das 6-ProdukteshyBeispiel zeigt Abbildung 513 daszlig die Forderung nach einer Diagonalmatrix ershyfiiHt ist
Abbildung 513 Anti-Image-Kovarianz-Matrix im 6-Produkte-Beispiel
AnIlJmIU_atrIzen
UNGEFETT KALORIEN VITAMIN HALTBARKi Arililinage-lltovananz PREISUNuumll1 06897 -01920 -06502 -01008 00960KAlORIEN -01920 45883 -02716 -02621 02511VITAMIN -06502 02716 07143 00897 -00842HALTBARK -01008 02621 00697 02619 -02611PREIS 00960 02511 -00842 middot02611 02675
Als Kriterium dafilr wann die Forderung nach einer Diagonalmatrix erfuumlllt ist schlagen Dziuban und Shirkey vor die Korrelationsmatrix dann als fuumlr die Fakshytorenanalyse ungeeignet anzusehen wenn der Anteil der Nicht-diagonal-Elemente die ungleich Null sind (gt 009) in der Anti-Image-Kovarianzmatrix (AIC) 25
Vgl Guttmann L 1953 S 277 ff
LIO r aKlOrenanalyse
oder mehr betraumlgt7 Das trifft in unserem Fall filr keines der Nicht-diagonalshyElemente der Ale-Matrix zu womit nach diesem Kriterium die Korrelationsmatrix filr faktoranalytische Auswertungen geeignet ist
Kaiser-Meyer-Olkin-Kriterium
Waumlhrend die Uumlberlegungen von Dziuban und Shirkey auf Plausibilitaumlt beruhen haben Kaiser Meyer und Olkin versucht eine geeignete Pruumlfgroumlszlige zu entwickeln und diese zur Entscheidungsfindung heranzuziehen Sie berechnen ihre PTUumlfgroumlszlige die als measure 0sampling adequacy (MSA) bezeichnet wird auf Basis der Anshyti-Image-KorrelationsmatrixbullDas MSA-Kriterium zeigt an in welchem Umfang die Ausgangsvariablen zusammengehoumlren und dient somit als Indikator dafilr ob eine Faktorenanalyse sinnvoll erscheint oder nichtDas MSA-Kriterium erlaubt sowohl eine Beurteilung der Korrelationsmatrix insgesamt als auch einzelner Varishyablen sein Wertebereich liegt zwischen degund 1 Kaiser und Rice schlagen folgenshy
8de Beurteilungen vor
MSA 2 09 marvelous (erstaunlich) MSA 2 08 meritorious (verdienstvoll) MSA 2 07 middling (ziemlich gut) MSA 2 06 mediocre (mittelmaumlszligig) MSA 2 05 miserable (klaumlglich) MSA lt05 unacceptable (untragbar)
Sie vertreten die Meinung daszlig sich eine Korrelationsmatrix mit MSA lt 05 nicht rur eine Faktorenanalyse eignet9 Als wuumlnschenswert sehen sie einen Wert von MSA 2 08 an lO In der Literatur wird das MSA-Kriterium das auch als KaisershyMeyer-Olkin-Kriterium (KMK) bezeichnet wird als das beste zur Verrugung steshyhende Verfahren zur Pruumlfung der Korrelationsmatrix angesehen weshalb seine Anwendunrvor der Durchfuhrung einer Faktorenanalyse auf jeden Fall zu empshyfehlen ist 1
Bezogen auf unser 6-Produkte-Beispiel ergab sich rur die Korrelationsmatrix insgesamt ein MSA-Wert von 0576 womit sich rur unser Beispiel ein riur klaumlglishyches Ergebnis ergibt Daruumlber hinaus gibt SPSS in der Diagonalen der AntishyImage-Korrelationsmatrix aber auch das MSA-Kriterium rur die einzelnen Variabshylen an
7 Vgl Dziuban C DlShirkey E C 1974 S 359
8 Vgl Kaiser H FRice J 1974 S 111 ff
9 Vgl Cureton E EDAgostino R B 1983 S 389 f
10 Vgl Kaiser H F 1970 S 405
II Vgl Stewart D W 1981 S 57 f Dziuban C DlShirkey E C 1974 S 360 f
Vorgehensweise 277
Abbildung 514 Anti-Image-Korrelations-Matrix im 6-Produkte-Beispiel
Antllmlge-Matrlun
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS AntI-lmageMrrelilllOn UNGEFETT 59680middot 10794 -92633 -23717 22350
KALORIEN -10794 87789 -15001 -23906 22661 VITAMIN -92633 -15001 59755 20730 -19274 HALTSARK -23717 -23906 20730 47060 -98640 PREIS 22350 22561 -19274 -95640 45701
8 Maszlig der StlchplObenelgnung
Abbildung 514 macht deutlich daszlig lediglich die Variable Kaloriengehalt mit einem MSA-Wert von 087789 als verdienstvoll anzusehen ist waumlhrend alle uumlbshyrigen Variablen eher klaumlgliche oder untragbare Ergebnisse aufweisen Die vashyriablenspezifischen MSA-Werte liefern damit rur den Anwender einen Anshyhaltspunkt dafuumlr welche Variablen aus der Analyse auszuschlieszligen waumlren wobei sich ein sukzessiver Ausschluszlig von Variablen mit jeweiliger Pruumlfung der vorgeshystellten Kriterien empfiehlt
522 Extraktion der Faktoren
(4) Zahl der Faktoren
(5) Faktorinterp~etat~ (6) Bestimmung der
Faktorwerte
Die bisherigen Ausruhrungen haben verdeutlicht daszlig bei Faktorenanalysen groszlige Sorgfalt auf die Wahl der Untersuchungsmerkmale und -einheiten zu verwenden ist da durch die Guumlte der Korrelationsmatrix die den Startpunkt der Faktorenanalyse darstellt alle Ershygebnisse der Faktorenanalyse beeinfluszligt werden Im folgenden ist nun zu fragen wie denn nun die Faktoren rein rechnerisch aus den Variablen ermittelt werden koumlnnen Wir werden im folgenden zunaumlchst das Funshydamentaltheorem der Faktorenanalyse darstellen und anschlieszligend die Extraktion auf graphischem Wege plausibel machen Auf die Unterschiede zwischen konkreten (rechnerischen) Faktorextraktionsverfahren gehen wir dann im Zusammenhang mit der Bestimshymung der Kommunalitaumlten (Abs~hnitt 523) ein
278 Faktorenanalyse
5221 Das FundamentaItheorem
Waumlhrend die bisherigen Uumlberlegungen die Ausgangsdaten und ihre Eignung fuumlr faktoranalytische Zwecke betrafen stellt sich nun die Frage wie sich die Faktoren rechnerisch aus den Variablen ennitteln lassen Zu diesem Zweck geht die Faktoshyrenanalyse von folgender grundlegenden Annahme aus
Jeder Beobachtungswert einer Ausgangsvariablen Xj oder der stanshydardisierten Variablen Zj laumlszligt sich als eine Linearkombination mehshyrerer (hypothetischer) Faktoren beschreiben
Mathematisch laumlszligt sich dieser Zusammenhang wie folgt fonnulieren
(3a)Xkj =ajl Pkl +ap PIa + +ajQ PkQ
bzw fuumlr standardisierte x-Werte
(3b)Zkj=ajIPkl+a j2middotPIa+middot+a jQmiddotPkQ=iajqPkq
q~l
Die obige Fonnel (3b) besagt fuumlr das 2-Faktorenbeispiel nichts anderes als daszlig zB die standardisierten Beobachtungswerte fuumlr Anteil ungesaumlttigter Fettsaumluren und Vitamingehalt beschrieben werden durch die Faktoren P 1 und P2 so wie sie im Hinblick auf Marke k gesehen wurden ltPIel bzw Pk2) jeweils multipliziert mit ihren Gewichten bzw Faktorenladungen beim Merkmal j also fuumlr Faktor 1 ajl und
fuumlr Faktor 2 a2 Oie Faktorradung gibt dabei an wieviel ein Faktor mit einer Ausgangsvariablen
zu tun hat Im mathematisch-statistischen Sinne sind Faktorladungen nichts andeshyres als eine Maszliggroumlszlige fuumlr den Zusammenhang zwischen Variablen und Faktor und das ist wiederum nichts anderes als ein Korrelationskoeffizient zwischen Fakshytor und Variablen
Um die Notation zu verkuumlrzen schreibt man haumlufig den Ausdruck (3b) auch in Matrixschreibweise Identisch mit Fonnel (3b) ist daher auch folgende Mashytrixschreibweise die die Grundgleichung der Faktorenanalyse darstellt
(3c)Z=pmiddotA
Aufbauend auf diesem Grundzusammenhang laumlszligt sich dann auch eine Rechenshyvorschrift ableiten die aufzeigt wie aus den erhobenen Daten die vennuteten Fakshytoren mathematisch ennittelt werden koumlnnen
Wir hatten gezeigt daszlig die Korrelationsmatrix R sich bei standardisierten Daten wie folgt aus der Datenmatrix Z ennitteln laumlszligt
R=_I_ZZ (2) K-l
Vorgehensweise 279
Da Z aber im Rahmen der Faktorenanalyse durch P A beschrieben wird (Z =PA) ist in (2) Z durch Fonnel (3c) zu ersetzen so daszlig sich folgende Fonnet
ergibt
R=_I_PA)PA) (4)K I
Nach Aufloumlsung der Klammem ergibt sich nach den Regeln der Matrixmultiplishykation
r------- R=_I_APPA=A-I_pPA (5)
K-I ~
~
Da alle Daten standardisiert sind laumlszligt sich der _1_ ptP Ausdruck in Formel (5)K-l ----y---J
auch als K(Jrrelationsmatrix der Faktoren (C) bezeichnen (vgl Fonnel (2raquo so daszlig sich schreiben laumlszligt
R = AmiddotCmiddotA (6)
Da die Faktoren als unkorreliert angenommen werden entspricht C einer Einheitsshymatrix (einer Matrix die auf der Hauptdiagonalen nur Einsen und sonst Nullen enthaumllt) Da die Multiplikation einer Matrix mit einer Einheitsmatrix aber wieder die Ausgangsmatrix ergibt vereinfacht sich die Fonnel (6) zu
R = AmiddotA (7)
Die Beziehungen (6) und (7) werden von Thurstone als das Fundamentaltheorem der Faktorenanalyse bezeichnet da sie den Zusammenhang zwischen Korrelatishyonsmatrix und Faktorladungsmatrix beschreiben
Das Fundarnentaltheorem der Faktorenanalyse besagt nicht anderes als daszlig sich die Korrelationsmatrix durch die Faktorladungen (Matrix A) und die Korrelationen zwischen den Faktoren (Matrix C) reproduzieren laumlszligt Fuumlr den Fall daszlig man von unabhaumlngigen (orthogonalen) Faktoren ausgeht reduziert sich das Funshydamentaltheorem auf Fonnel (7) Dabei muszlig sich der Anwender allerdings bewuszligt sein daszlig das Fundamentaltheorem der Faktorenanalyse nach Fonnel (7) stets nur unter der Praumlmisse einer Linearverknuumlpfung und Unabhaumlngigkeit der Faktoren Guumlltigkeit besitzt
5222 Graphische Interpretation von Faktoren
Der Infonnationsgehalt einer Korrelationsmatrix laumlszligt sich auch graphisch in einem Vektor-Diagramm darstellen in dem die jeweiligen Korrelationskoeffizienten als Winkel zwischen zwei Vektoren dargestellt werden Zwei Vektoren werden dann
280 Faktorenanalyse
als linear unabhaumlngig bezeichnet wenn sie senkrecht (orthogonal) aufeinander steshyhen Sind die beiden betrachteten Vektoren (Variablen) jedoch korreliert ist der Korrelationskoeffizient also C 0 zB 05 dann wird dies graphisch durch einen Winkel von 60deg zwischen den beiden Vektoren dargestellt
Es stellt sich die Frage Warum entspricht ein Korrelationskoeffizient von 05 genau einem Winkel von 60deg Die Verbindung wird uumlber den Cosinus des jeshy
weiligen Winkels hergestellt Verdeutlichen wir uns dies anhand des Ausgangsbeispiels (Abbildung 515)
In Abbildung 515 repraumlsentieren die Vektoren AC und AB zB die beiden Vashyriablen Kaloriengehalt und Vitamingehalt Zwischen den beid~_yariablen moumlge eine Korrelation von 05 gemessen worden sein Der Vektor AC der den Kaloriengehalt repraumlsentiert und der genau wie AB aufgrund der Standardisierung eine Laumlnge von 1 hat weist zu AB einen Winkel von 60deg auf Der Cosinus des Winkels 60deg der die Stellung der beiden Variablen zueinander (ihre Richtung) anmiddot gibt ist definiert als Quotient aus Ankathete und Hypothenuse also als AD AC Da AC aber gleich 1 ist ist der Korrelationskoeffizient identisch mit der Strecke
AD Wie Abbildung 516 ausschnitthaft zeigt ist zB der Cosinus eines 60deg-Winkels
gleich 05 Entsprechend laumlszligt sich jeder beliebige Korrelationskoeffizient zwischen zwei Variablen auch durch zwei Vektoren mit einem genau definierten Winkel zushyeinander darstellen Verdeutlichen wir uns dies noch einmal anband einer Korrelamiddot tionsmatrix mit drei Variablen (Abbildung 517)
Abbildung 515 Vektordarstellung einer Korrelation zwischen zwei Variablen
c
A 0 B
)V
Standardisierte LOnge von 1
Vorgehensweise 281
Abbildung 516 Werte rur den Cosinus (entnommen aus Geliert W JKuumlstnerHlHellwich MfKaumlstner H Kleine Enzyshyklopaumldie Mathematik Leipzig 1969 S 799)
Grad CO Grad cO
45 07071 90 00000 44 7193 89 0175 43 7314 88 0349 42 7431 87 0523 41 7547 86 0698 40 07660 85 0872 39 7771 84 1045 38 7880 83 1219 37 7986 82 1392 36 8090 81 1564 35 8192 80 01736 34 8290 79 1908 33 8387 78 2079 32 8480 77 2250 31 8572 76 2419 30 08660 75 2588 29 8746 74 2756 28 8829 73 2924 27 8910 72 3090 26 8988 71 3256 25 9063 70 03420 24 9135 69 3584 23 9205 68 3746 22 9272 67 3907 21 9336 middot66 4067 ZO 09397 65 4226 19 9455 64 4384 18 9511 63 4540 17 9563 62 4695 16 9613 61 4848 15 9659 60 05000 14 9703 59 5150 13 9744 58 5299 12 9781 57 5446 11 9816 56 5592 10 09848 55 5736 9 9877 54 5878 8 9903 53 6018 7 9925 52 6157 6 9945 51 6293 5 9962 50 06428 4 9976 49 6561 3 9986 48 6691 2 9994 47 6820 1 9998 46 6947 0 10000 45 7071
282 Faktorenanalyse
Abbildung 517 Korrelationsmatrix
R =r68660 1 06428lO1736 ~
R laumlszligt sich auch anders schreiben (vgl Abbildung 518)
Abbildung 518 Korrelationsmatrix mit Winkelausdrucken
l0deg R = 30deg 0deg
80deg 50deg 0deg
Der Leser moumlge die entsprechenden Werte selbst in einer Cosinus-Tabelle uumlbershy
pruumlfenDie der oben gezeigten Korrelationsmatrix zugrundeliegenden drei Variablen
und ihre Beziehungen zueinander lassen sich relativ leicht in einem zweidimen sionalen Raum darstellen (Abbildung 519)
Abbildung 519 Graphische Darstellung des 3-Variablen-Beispiels
Vektor X2
Vektorx3Vektor Xl
Vorgehensweise 283
Je mehr Variable jedoch zu beruumlcksichtigen sind desto mehr Dimensionen werden benoumltigt um die Vektoren in ihren entsprechenden Winkeln zueinander zu positioshy
nieren Die Faktorenanalyse trachtet nun danach das sich uumlber die Korrelationsshykoeffizienten gemessene Verhaumlltnis der Variablen zueinander in einem moumlglichst gering dimensionierten Raum zu reproduzieren Die Zahl der benoumltigten Achsen gibt dann die entsprechende Zahl der Faktoren an
Wenn man die Achsen als Faktoren ansieht dann stellt sich unmittelbar die Frashyge Wie werden diese Achsen (Faktoren) in ihrer Lage zu den jeweiligen Vektoren (Variablen) bestimmt
Dazu vergegenwaumlrtigt man sich am besten das Bild eines halboffenen Schirmes Die Zacken des Schirmgestaumlnges die alle in eine bestimmte Richtung weisend die Variablen repraumlsentieren lassen sich naumlherungsweise auch durch den Schirmstock darstellen Vereinfacht man diese Uumlberlegung aus DarstellungsgrQnden noch weishyter auf den 2-Variablen-Fall wie in AbbiIdu8520 die einen Korrelationskoshyeffizienten von 05 fuumlr die durch die Vektoren OA und OB dargestellten Variablen repraumlsentiert dann gibt der Vektor OC eine zusammenfassende (faktorielle) Beshyschreibung wieder Die beiden Winkel von 30deg zwischen Vektor I bzw Vektor II und Faktor-Vektor geben wiederum an inwieweit der gefundene Faktor mit Vekshytor (Variable) I bzw II zusammenhaumlngt Sie repraumlsentieren ebenfalls Korrelationsshykoeffizienten und zwar die zwischen den jeweiligen Variablen und dem Faktor Diese Korrelationskoeffizienten hatten wir oben als Faktorladungen bezeichnet Die Faktorladungen des 1 Faktors betragen also in bezug auf Variable I und Varishyable II cos 30deg = 08660
Abbildung 520 FaktorlOsung bei 2 Variablen
j
A
Vektor x
~---------__------~---- C
Resultante
e Vektor X
284 Faktorenanalyse
5223 Das Problem der Faktorextraktion
Nachdem wir nun wissen was eine Faktorladung inhaltlich bedeutet ist zu fragen Wie findet man einen solchen Vektor (Faktor) der stellvertretend ftir mehrere zushysammenhaumlngende Variable fungieren kann Erinnern wir uns noch einmal des Ausgangsbeispiels Aufstrichfette waren nach den ftinfMerkmalen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt - Haltbarkeit - Preis bewertet worden l2
Aus dieser Bewertung sei die Korrelationsmatrix in Abbildung 521 berechnet worden
Abbildung 521 Spiegelbildlich identische KOlTelationsmatrix
x X x x x
x 70 100 09848 90middotX 03420 30x 00000 10middotx
X -01736
Diese Korrelationsmatrix enthaumllt in der unteren Dreiecks-Matrix die Korrelationsshywerte in der oberen (spiegelbildlich identischen) Dreiecks-Matrix die entshysprechenden Winkel Graphisch ist der Inhalt dieser Matrix in Abbildung 522 darshygestellt
Das Beispiel wurde so gewaumlhlt daszlig die Winkel zwischen den Faktoren in einer zweidimensionalen Darstellung abgebildet werden koumlnnen - ein Fall der in der Realitaumlt allerdings kaum relevant ist
Wie findet man nun den 1 Faktor in dieser Vektordarstellung Bleiben wir zunaumlchst bei der graphischen Darstellung dann sucht man den
Schwerpunkt aus den ftinf Vektoren Der Leser moumlge sich dazu folgendes verdeutlichen
In Abbildung 522 ist der Faktor nichts anderes als die Resultante der funfVektoshyren Wuumlrden die ftinfVektoren funf Seile darstellen mit einem Gewicht in 0 und jeweils ein Mann wuumlrde mit gleicher Staumlrke an den Enden der Seile ziehen dann wuumlrde sich das Gewicht in eine bestimmte Richtung bewegen (vgl die gestrichelte
12 Es werden hier andere Werte als im Ausgangsbeispiel verwendet um zunaumlchst eine einshydeutige graphische Loumlsung zu ermoumlglichen
Vorgehensweise 285
Linie in Abbildung 523) Diesen Vektor bezeichnen wir als Resultante Er ist die graphische Repraumlsentation des 1 Faktors
Abbildung 522 Graphische Darstellung des 5-Variablen-Beispiels
~
XsXl
bull
Abbildung 523 Graphische Darstellung des Schwerpunktes
X2
XIX
Faktorshyvektor2
Betrachtet man nun die jetzt gebildeten Winkel zwischen dem 1 Faktor und den Ausgangsvektoren dann hat man auch die gesuchten Faktorladungen gefunden
(Erste Reshysultante)
4512
-------o
- -
286 Faktorenanalyse
Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen
Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben
Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge
die Werte selbst uumlberpruumlfen)
Abbildung 524 Einfaktorielle Ladungsmatrix
Faktor
05707Xl 07046x2 bull 09668x3
08211x4
07096
Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)
Abbildung 525 ZweifaktorieHe Ladungsmatrix
Faktor 1 Faktor 2
Xl 05707 -08211
x2 07046 -07096
x3 09668 02554
x4 08211 05707
Xs 07096 07046
Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa
Vorgehensweise 287
In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum
I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1
~~ 00
2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation
Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist
Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt
Sf = 1 = Ijj (9)J
3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt
Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)
Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung
Resutlanie 2 (Faktor 2)
A Vektor x o
120lt= fH bull C Resultante 1 (Faktor 1)
B Vektor x
288 Faktorenanalyse
Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB
Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel
Wenn obige Behauptung stimmt muumlszligte gelten
(lOa)[~J +[~~J =1
Uumlberpruumlfung 2 2 uumlc2
OC 00 +002 (lOb)--+-shy 2
OA OA OA2 2
In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)
Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)
(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)
2 2 OC +00
4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten
sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)
wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-
q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1
(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix
(2) Extraktion der
(5) Faktorinterpretatiln
(6) Bestimmung der Faktorwerte
Vorgehensweise 289
523 Bestimmung der Kommunalitaumlten
In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem
Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy
fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig
mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da
J
i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins
Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung
erklaumlrte Variant
standardisierte Gesamtvariant = 1
290 Faktorenanalyse
Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung
2 a j1 =07
2 2 8 j2 = 01 siRest= 02
Kommunalitat H =08 (erllt1arte Varianz)
Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)
R AmiddotA+U (7a)
Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet
Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion
Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer
Vorgehensweise 291
100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY
In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy
weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen
Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen
1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen
2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit
2 2I ~ ~ R j ~ mx rjk
Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse
- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy
13 Vgl Loehlin J C 1998 S 154 14
Vgl Uberla K 1972 S 155 ff
292 Faktorenanalyse
nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird
- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit
Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy
15formationsverlust deklariert wird
Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen
Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy
15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt
Vorgehensweise 293
tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder
Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren
Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen
Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren
Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist
Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf
Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden
Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel
Kommunalltlten
Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325
Extraktionsmelhode Hauptachsen-Faktorenanalyse
bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix
294 Faktorenanalyse
Abbildung 530 Faktorladungen im 6-Produkte-Beispiel
Faktoranmatrixmiddot
Faktor
1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608
Extraktionsmethode Hauptachsen-Faktorenanalyse
a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt
Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert
Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel
Reproduzierte Korrelationen
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT
KALORIEN
VITAMIN
HALTBARK
PREIS
96845 71193 96034 11035 04241
71193 52552b
70480
12709
07717
96034 70480 95292b
08461 01722
11035
12709 08461 99056b
8325
04241 07717 01722 98325 98070b
Residuun1 UNGEFETi
KALORIEN
VITAMIN
HALTBARK
PREIS
-00017 00101
-00141 00144
-00017
-00083 01001
- 01005
00101 -00083
-00036 00640
-00141 01061
-00636
00010
00144 -01005 00640 00010
ExtrakHonsmethode Hauptllchsenfaktorenanalyse
a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005
b Reproduzierte Kommunalltaumlten
Vorgehensweise 295
Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen
Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R
524 Zahl der Faktoren
(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix
(2) Extraktion der Faktoren
(6) Bestimmung der Faktorwerte
Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff
Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-
q N
trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N
Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden
Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy
296 Faktorenanalyse
Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre
Abbildung 532 Bestimmung der Eigenwerte
Faktorenmatrix
Faktor
1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)
Eigenwerte 25068 19112
Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil
Kom munalltaumlten
Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807
- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren
V orgehensweise 297
Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung
Abbildung 534 Scree-Test im 6-Produkte-Beispiel
Eigen- Screeplot wert 30
25
20
15
Kaiser-Kriterium
10 1 Elbow5
00 2 3 4 5
Faktomummer
298 Faktorenanalyse
525 Faktorinterpretation
Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)
Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt
(1) Variablenauswalll und Errechnung der Korrelationsmalrix
(2) Extraktion der Faktoran
(3) Bestimmung der Kommunalltaumllen
(6) Bestimmung derFaktorwerte _______---11
middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull
geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht
Abbildung 535 Faktorladungen im 6-Produkte-Beispiel
Preis Haltbarkeit
Extraktionsmethode Hauptachsen-Faktorenanalyse
Vorgehensweise 299
Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist
Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig
Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16
Abbildung 536 Unrotierte Faktorladungen
F
F
Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung
Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f
300 Faktorenanalyse
536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy
tert
Abbildung 537 Rotierte Faktorladungen
F (Ausgangssituation)2
11 F2 (rotiert)
F1
-- shy
(Ausgangssituation)
11
F1 (rotiert)
SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen
1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen
(rechtwinkligen) Rotation
2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren
Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die
vorgenenswelse j U 1
Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind
Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel
Faktor
1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt
Haltbarkeit
72152 bull 07020
07962 I 99208 Preis 01060 99025
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung
Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen
A bull =A T mit TC~SI7 - sina ] sma cosa
Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links
A T A 094331 - 028039 098357 003229
[C0s341570 - sin34 157 ]070669 016156 072152 007020
sin34157deg cos34157092825 - 030210 097615 000694
038926 091599 007962 099208
032320 093608 001060 099025
Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)
Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix
Faktor 1 2
1 94868 31622
2 -31622 94868
Il
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung
Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig
von a=1843deg
526 Bestimmung der Faktorwerte
(1) Variablenauswanl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitaumlten
Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte
Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt
(3c)Z=PmiddotA
Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY
(12)Z AT1p AAT
Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt
(13)ZArl=pE
Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten
(3c) wird von rechts mit A multipliziert
ZmiddotA=PmiddotAmiddotA (15)
Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar
ZAmiddot(A At1=P(A A) (A Atl (16)
Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt
P=ZA(AAt l (17)
In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren
In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term
AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte
Abbildung 540 Koeffizientenmatrix der Faktorwerte
Faktor 1 2
Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression
Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die
xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf
SjDa p E=P ist ergibt sich
Seite 271 zu (14)
P=ZAT
304 Faktorenanalyse
Abbildung 541 Standardisierte Ausgangsdatenmatrix Z
45ampt6R4LJL4
Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542
Abbildung 542 Faktorwerte im 6-Produkte-Beispiel
Vorgehensweise 305
Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel
Du darfst
VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG
E 11 BecelS
U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T
Sanella IIII Holl Butter
-1
bull Rama
-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18
WIRTSCHAFTLICHKEIT
Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen
527 Zusammenfassende Darstellung der Faktorenanalyse
Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy
e Vorgehensweise 307 306 Faktorenanalyse
Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen
sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-
schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy
tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig
wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy
nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy
chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy
analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte
Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht
Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der
Verwendung des Verfahrens offenzulegen
I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _
CQ)l2CQgtQ ~ i
-Q)C t l5~11
0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C
CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O
~ ~ 11 t 3
uj~fi
t Imiddot~ J1 ~SHaa
It c~
c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~
-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi
o~ ~ -gEG)
I ~l c c ~l~ampi
2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E
U~a ]i E
J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy
~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--
----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt
Fallbeispiel 309308 Faktorenanalyse
Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert
531 Problemstellung
In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften
Variable und Objekte des BeispielsAbbildung 545
EigenschaftenMarken M k (k=I Il) xj(j=I IO)
A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado
5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H
I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama
Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist
Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)
Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern
Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse
---
310Faktorenanalyse
532 Ergebnisse
1 Variablenauswahl und Errechnung der Korrelationsmatrix
Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung
548 wiedergegeben
Abbildung 548 Die Korrelationskoeffizienten -_ -
-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy
In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der
Fallbeispiel 311
Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet
Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie
-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -
06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170
-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260
62444 -97126 66229 -83532 -62589
-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545
-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno
Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)
Abbildung 550 Dialogfeld Deskriptive Statistik
312 Faktorenanalyse
2 Bestimmung der Kommunalitilten
Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt
wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend
bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich
von den Startwerten abweichen
Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten
Hauptkomponentenanalyse Hauptachsenanalyse
Variable Korrunuriali- Kommunali- Korrununali- Kommunali-
Ut (Startwerte)
tlt (Endwerte)
tlIl (Startwerte )
tlIl (End werte)
STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR
100000 100000 100000 100000 100000 100000 100000 100000 100000 100000
88619
76855
89167 85324 76043 84012 80223 92668 63297 88786
97414
89018
79497
85847
96501
98810
97132
99166
78019
96445
85325
55717
85754
91075
55819
82330
73903
94796
40402
87851
Fallbeispiel 313
Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy
I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren
Abbildung 552 Dialogfeld Extraktion
Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist
3 Wabl der Extraktionsmetbode
Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen
4 Zabl der Faktoren
Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen
Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet
Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch
17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f
1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden
Erklaumlrte Gesamtvarianz
Anfaumlngliche Eigenwerte
314 Faktorenanalyse
Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy
den sich fUnfFaktoren ergeben
Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien
95) der Varianz erklaumlrt sind
2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)
3 Extrahiere n (zB 3) Faktoren
4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy
renzahl
5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein
6 Extrahiere alle Faktoren die nach der
Vom Computer automatisch verwandt wenn keine andere Spezifikation
Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden
Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden
Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist
Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt
Fallbeispiel 315
Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil
Faktor 1
2 3
4
5
6
7
8
9
10
Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden
Abbildung 555 Scree-Test und Kaiser-Kriterium
Eigen- -=gtcreeplot wert
5
4
3
2
10
o Kaisershy
~ 3 i i 7 i Q
Faktornummer
Gesamt 505188
177106
142700
81935
42961
24709
15928
06190
02943
00340
der Varianz 5051883
1771061
1427002
819349 429611
247085
159275
61902
29434
03398
Kumulierte 5051883
6822944
8249946
9069295
9498905
9745991
9905266
9967168
9996602
10000000
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
272 Faktorenanalyse Vorgehensweise 273
wobei Z die transponierte Matrix der standardisierten Ausgangsdatenmatrix Z darstellt
Der Leser moumlge selbst anhand des Beispiels die Guumlltigkeit der Formel uumlberpruumlshyfen Dabei wird klar werden daszlig die Korrelationsmatrix auf Basis der Ausshygangsdaten identisch ist mit der Korrelationsmatrix auf Basis der standardisierten Daten Wird die Korrelationsmatrix aus standardisierten Daten errechnet so sind in diesem Falle Varianz-Kovarianzmatrix und Korrelationsmatrix identisch Fuumlr den Korrelationskoeffizienten laumlszligt sich auch schreiben
S 1middot2 SI ( - )( - )rx =-- mit x x =--t xkl-x Xk2-x 2
1 2 S S Imiddot 2 K -1 k XI X2
Da wegen der Standardisierung die beiden Varia~zen im Nenner 1 sind folgt daszlig Korrelationskoeffizient und Kovarianz SIX2) identisch sind
Die Korrelationsmatrix zeigt dem Anwender auf welche Variablen der Ausgangsshybefragung offenbar mit welchen anderen Variablen dieser Befragung irgendwie zusammenhaumlngen Sie zeigt ihm jedoch nicht ob
I die Variablen sich gegenseitig bedingen
oder
2 das Zustandekommen der Korrelationswerte durch einen oder mehrere hinter den zusammenhaumlngenden Variablen stehenden Faktoren bestimmt wird
Angesichts der beiden klar trennbaren Bloumlcke der Korrelationsmatrix (vgL die abshygegrenzten Vierecke) laumlszligt sich vermuten daszlig die Variablen XI bis x3 und x4xS durch zwei Faktoren erklaumlrt werden koumlnnten
Ausgehend von dieser Hypothese stellt sich unmittelbar die Frage mit welchem Gewicht denn die beiden Faktoren an der Beschreibung der beobachteten Zusamshymenhaumlnge beteiligt sind Es ist ja denkbar daszlig der Faktor Gesundheit als alleinishyger Beschreibungsfaktor filr die Variablen Xl bis x3 fast filr die gesamten Untershyschiede in der Ausgangsbefragung verantwortlich ist Es kann aber auch sein daszlig er nur einen Teil der unterschiedlichen Beurteilungen in der Ausgangsbefragung erklaumlrt Die groumlszligere oder geringere Bedeutung beider Faktoren laumlszligt sich in einer Gewichtszahl ausdrucken die im Rahmen einer Faktorenanalyse auch als Eigenshywert bezeichnet wird
5Ul Eignung der Korrelationsmatrix
Zu Beginn des Abschnittes 521 hatten wir bereits darauf hingewiesen daszlig sich die Eignung der Ausgangsdaten filr faktoranalytische Zwecke in der Korrelatishyonsmatrix widerspiegelt Dabei liefern bereits die Ausgangsdaten selbst einen Anshyhaltspunkt zur Eignungsbeurteilung der Daten zum Zwecke der Faktorenanalyse da die Houmlhe der Korrelationskoeffizienten durch die Verteilung der Variablen in der Erhebungsgesamtheit (Symmetrie Schiefe und Woumllbung der Verteilung) beeinfluszligt wird Liegt einer Erhebung eine heterogene Datenstruktur zugrunde so
macht sich dies durch viele kleine Werte in der Korrelationsmatrix bemerkbar II womit eine sinnvolle Anwendung der Faktorenanalyse in Frage gestellt ist Es ist
deshalb vorab eine Prufung der Variablen auf Normalverteilung ZUmindest aber auf Gleichartigkeit der Verteilungen empfehlenswert obwohl die Faktorenanalyseselbst keine Verteilungsannahmen setzt
Bezogen auf unser 6-Produkte-Beispiel treten neben sehr hohen Werten (gt 07) insbesondere im unteren Teil der Matrix kleine Korrelationen auf (vgl Abbildung 510) so daszlig die Korrelationsmatrix selbst kein eindeutiges Urteil uumlber die Eigshynung der Daten zur Faktorenanalyse zulaumlszligt
Es ist deshalb zweckmaumlszligig weitere Kriterien zur Pruumlfung heranzuziehen Hierzu bieten sich insbesondere statistische Prufkriterien an die eine Uumlberpruumlfung der Korrelationskoeffizienten auf Eignung zur Faktorenanalyse ermoumlglichen Es ist durchaus empfehlenswert mehr als ein Kriterium zur faktoranalytischen Eignung der Datenmatrix anzuwenden da die verschiedenen Kriterien unterschiedliche Vor- und Nachteile haben Im einzelnen werden durch SPSS folgende Kriterien bereitgestellt
Signifikanzniveaus der Korrelationen
Ein Signifikanzniveau uumlberpruumlft die Wahrscheinlichkeit mit der eine ZUvor formushylierte Hypothese zutrifft oder nicht Fuumlr alle Korrelationskoeffizienten lassen sich die Signifikanzniveaus anfilhren Zuvor wird eine sogenannte Ho-Hypothese forshymuliert die aussagt daszlig kein Zusammenhang zwischen den Variablen besteht Das Signifikanzniveau des Korrelationskoeffizienten berechnet anschlieszligend mit welshycher Irrtums wahrscheinlichkeit eben diese Ho-Hypothese abgelehnt werden kann Ein beispielhaftes Signifikanzniveau von 000 bedeutet daszlig mit dieser Irrtumsshywahrscheinlichkeit die Ho-Hypothese abgelehnt werden kann sprich zu 00 wird sich der Anwender taumluschen wenn er von einem Zusammenhang ungleich Null zwischen den Variablen ausgeht Anders ausgedruckt Mit einer Wahrscheinlichshykeit von 100 wird sich die Korrelation von Null unterscheiden
Abbildung 511 Signifikanzniveaus der Korrelationskoeffizienten im 6-ProdukteshyBeispiel
KOrrelatlonmatrix
UNGEFETT KALORIEN VITAMIN HALTBARKISignIfikanz (l-seitlg) UNGEFETT PREIS05632 00111 411lSZ 46713KAlORIEN 05632 05924 39737 45018VITAMIN 00111 05924 44144 49229HALTBARK 41862 39737 44144 00021PREIS 46713 45018 48229 00021
Fuumlr unser Beispiel zeigt Abbildung 511 daszlig sich genau diejenigen Korrelationsshykoeffizienten signifikant von Null unterscheiden (niedrige Werte in Abbildung 511) die in Abbildung 510 hbhe Werte (gt 07) aufweisen waumlhrend die Korrelashy
f
274 Faktorenanalyse
tionskoeffizienten mit geringen Werten auch ein hohes Signifikanzniveau (Wertegt 04) besitzen Das bedeutet daszlig sich ZB die Korrelation zwischen den Variablen Vitamingehalt und Haltbarkeit nur mit einer Wahrscheinlichkeit von (1- 044 =) 56 von Null unterscheidet
Inverse der Korrelationsmatrix
Die Eignung einer Korrelationsmatrix fuumlr die Faktorenanalyse laumlszligt sich weiterhin an der Struktur der Inversen der Korrelationsmatrix erkennen Dabei wird davon ausgegangen daszlig eine Eignung dann gegeben ist wenn die Inverse eine Diagoshynamatrix darstellt d h die Nicht-diagonal-Elemente der inversen Korrelatishyonsmatrix moumlglichst nahe bei Null liegen Fuumlr das 6-Produkte-Beispiel zeigt Abbildung 512 daszlig insbesondere fuumlr die Werte der Variablen Ungesaumlttigte Fettshysaumluren und Vitamingehalt sowie Haltbarkeit und Preis hohe Werte auftreshyten waumlhrend alle anderen Werte relativ nahe bei Null liegen Es existiert allerdings kein allgemeinguumlltiges Kriterium dafuumlr wie stark und wie haumlufig die Nicht-diashygonal-Elemente von Null abweichen duumlrfen
Abbildung 512 Inverse der Korrelationsmatrix im 6-Produkte-Beispie1
Inverse KorrelationsmatrIx
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS UNIiIIt
KALORIEN VITAMIN
HALTBARK
PREIS
1449910 -60678
-1319772 -558018 520353
-60678 217944 -82863
-218066 204555
-1319772 -82863
1400000 479257
-440959
-558018 -218066 479257
3817871 -3126624
520353 204555
-440959 -3726624 3738542
Bartlett-Test (test of spherlcity)
Der Bartlett-Test uumlberpruumlft die Hypothese ob die Stichprobe aus einer Grundgeshysamtheit entstammt in der die Variablen unkorreliert sinds
Gleichbedeutend mit dieser Aussage ist die Frage ob die Korrelationsmatrix nur zuflillig von einer Einheitsmatrix abweicht da im Falle der Einheitsmatrix alle Nicht-diagonal-Elemente Null sind d h keine Korrelationen zwischen den Varishyablen vorliegen Es werden folgende Hypothesen formuliert
HO Die Variablen in der Erhebungsgesamtheit sind unkorreliert
H1 Die Variablen in der Erhebungsgesamtheit sind korreliert
Der Bartlett-Test setzt voraus daszlig die Variablen in der Erhebungsgesamtheit einer Normaverteiung folgen und die entsprechende Pruumlf groumlszlige annaumlhernd ChishyQuadrat-verteilt ist Letzteres aber bedeutet daszlig der Wert der Pruumlfgroumlszlige in hohem
5 Vgl Dziuban C DlShirkey E C 1974 S 358 ff bull
Vorgehensweise 275
Maszlige durch die Groumlszlige der Stichprobe beeinfluszligt wird Fuumlr unser Beispiel erbrachshyte der Bartlett-Test eine Pruumlfgroumlszlige von 17371 bei einem Signifikanzniveau von 00665 Das bedeutet daszlig mit einer Wahrscheinlichkeit von (1- 00655=)9345
davon auszugehen ist daszlig die Variablen der Erhebungsgesamtheit korreliert sind Setzt man als kritische Irrtumswahrscheinlichkeit einen Wert von 005 fest so waumlshyre fuumlr unser Beispiel die Nullhypothese anzunehmen und folglich die Korrelatishyonsmatrix nur zufaumlllig von der Einheitsmatrix verschieden Das laumlszligt dann den Schluszlig zu daszlig die Ausgangsvariablen in unserem Fall unkorreliert sind
Allerdings sei an dieser Stelle nochmals darauf hingewiesen daszlig die Anwenshydung des Bartlett-Tests eine Pruumlfung der Ausgangsdaten auf Normalverteilung voraussetzt die in unserem Fall noch erfolgen muumlszligte
Anti-Image-Kovarianz-Matrix
Der Begriff Anti-Image stammt aus der Image-Analyse von Guttmann6 Guttrnann geht davon aus daszlig sich die Varianz einer Variablen in zwei Teile zerlegen laumlszligt das Image und das Anti-Image
Das Image beschreibt dabei den Anteil der Varianz der durch die verbleibenden Variablen mit Hilfe einer multiplen Regressionsanalyse (vgl Kapitel 1) erklaumlrt werden kann waumlhrend das Anti-Image denjenigen Teil darstellt der von den uumlbrishygen Variablen unabhaumlngig istlDa die Faktorenanalyse unterstellt daszlig den Variabshylen gemeinsame Faktoren zugrunde liegen ist es unmittelbar einsichtig daszlig Varishyablen nur dann fuumlr eine Faktorenanalyse geeriiet sind wenn das Anti-Image der Variablen moumlglichst gering ausflilltDas ab bedJJltet daszlig die Nicht-diagonalshyElemente der Anti-Image-Kovarianz-Matrix m glichst nahe bei Null liegen muumlsshysen bzw diese Matrix eine Diagonamatrix darstellen sollte Fuumlr das 6-ProdukteshyBeispiel zeigt Abbildung 513 daszlig die Forderung nach einer Diagonalmatrix ershyfiiHt ist
Abbildung 513 Anti-Image-Kovarianz-Matrix im 6-Produkte-Beispiel
AnIlJmIU_atrIzen
UNGEFETT KALORIEN VITAMIN HALTBARKi Arililinage-lltovananz PREISUNuumll1 06897 -01920 -06502 -01008 00960KAlORIEN -01920 45883 -02716 -02621 02511VITAMIN -06502 02716 07143 00897 -00842HALTBARK -01008 02621 00697 02619 -02611PREIS 00960 02511 -00842 middot02611 02675
Als Kriterium dafilr wann die Forderung nach einer Diagonalmatrix erfuumlllt ist schlagen Dziuban und Shirkey vor die Korrelationsmatrix dann als fuumlr die Fakshytorenanalyse ungeeignet anzusehen wenn der Anteil der Nicht-diagonal-Elemente die ungleich Null sind (gt 009) in der Anti-Image-Kovarianzmatrix (AIC) 25
Vgl Guttmann L 1953 S 277 ff
LIO r aKlOrenanalyse
oder mehr betraumlgt7 Das trifft in unserem Fall filr keines der Nicht-diagonalshyElemente der Ale-Matrix zu womit nach diesem Kriterium die Korrelationsmatrix filr faktoranalytische Auswertungen geeignet ist
Kaiser-Meyer-Olkin-Kriterium
Waumlhrend die Uumlberlegungen von Dziuban und Shirkey auf Plausibilitaumlt beruhen haben Kaiser Meyer und Olkin versucht eine geeignete Pruumlfgroumlszlige zu entwickeln und diese zur Entscheidungsfindung heranzuziehen Sie berechnen ihre PTUumlfgroumlszlige die als measure 0sampling adequacy (MSA) bezeichnet wird auf Basis der Anshyti-Image-KorrelationsmatrixbullDas MSA-Kriterium zeigt an in welchem Umfang die Ausgangsvariablen zusammengehoumlren und dient somit als Indikator dafilr ob eine Faktorenanalyse sinnvoll erscheint oder nichtDas MSA-Kriterium erlaubt sowohl eine Beurteilung der Korrelationsmatrix insgesamt als auch einzelner Varishyablen sein Wertebereich liegt zwischen degund 1 Kaiser und Rice schlagen folgenshy
8de Beurteilungen vor
MSA 2 09 marvelous (erstaunlich) MSA 2 08 meritorious (verdienstvoll) MSA 2 07 middling (ziemlich gut) MSA 2 06 mediocre (mittelmaumlszligig) MSA 2 05 miserable (klaumlglich) MSA lt05 unacceptable (untragbar)
Sie vertreten die Meinung daszlig sich eine Korrelationsmatrix mit MSA lt 05 nicht rur eine Faktorenanalyse eignet9 Als wuumlnschenswert sehen sie einen Wert von MSA 2 08 an lO In der Literatur wird das MSA-Kriterium das auch als KaisershyMeyer-Olkin-Kriterium (KMK) bezeichnet wird als das beste zur Verrugung steshyhende Verfahren zur Pruumlfung der Korrelationsmatrix angesehen weshalb seine Anwendunrvor der Durchfuhrung einer Faktorenanalyse auf jeden Fall zu empshyfehlen ist 1
Bezogen auf unser 6-Produkte-Beispiel ergab sich rur die Korrelationsmatrix insgesamt ein MSA-Wert von 0576 womit sich rur unser Beispiel ein riur klaumlglishyches Ergebnis ergibt Daruumlber hinaus gibt SPSS in der Diagonalen der AntishyImage-Korrelationsmatrix aber auch das MSA-Kriterium rur die einzelnen Variabshylen an
7 Vgl Dziuban C DlShirkey E C 1974 S 359
8 Vgl Kaiser H FRice J 1974 S 111 ff
9 Vgl Cureton E EDAgostino R B 1983 S 389 f
10 Vgl Kaiser H F 1970 S 405
II Vgl Stewart D W 1981 S 57 f Dziuban C DlShirkey E C 1974 S 360 f
Vorgehensweise 277
Abbildung 514 Anti-Image-Korrelations-Matrix im 6-Produkte-Beispiel
Antllmlge-Matrlun
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS AntI-lmageMrrelilllOn UNGEFETT 59680middot 10794 -92633 -23717 22350
KALORIEN -10794 87789 -15001 -23906 22661 VITAMIN -92633 -15001 59755 20730 -19274 HALTSARK -23717 -23906 20730 47060 -98640 PREIS 22350 22561 -19274 -95640 45701
8 Maszlig der StlchplObenelgnung
Abbildung 514 macht deutlich daszlig lediglich die Variable Kaloriengehalt mit einem MSA-Wert von 087789 als verdienstvoll anzusehen ist waumlhrend alle uumlbshyrigen Variablen eher klaumlgliche oder untragbare Ergebnisse aufweisen Die vashyriablenspezifischen MSA-Werte liefern damit rur den Anwender einen Anshyhaltspunkt dafuumlr welche Variablen aus der Analyse auszuschlieszligen waumlren wobei sich ein sukzessiver Ausschluszlig von Variablen mit jeweiliger Pruumlfung der vorgeshystellten Kriterien empfiehlt
522 Extraktion der Faktoren
(4) Zahl der Faktoren
(5) Faktorinterp~etat~ (6) Bestimmung der
Faktorwerte
Die bisherigen Ausruhrungen haben verdeutlicht daszlig bei Faktorenanalysen groszlige Sorgfalt auf die Wahl der Untersuchungsmerkmale und -einheiten zu verwenden ist da durch die Guumlte der Korrelationsmatrix die den Startpunkt der Faktorenanalyse darstellt alle Ershygebnisse der Faktorenanalyse beeinfluszligt werden Im folgenden ist nun zu fragen wie denn nun die Faktoren rein rechnerisch aus den Variablen ermittelt werden koumlnnen Wir werden im folgenden zunaumlchst das Funshydamentaltheorem der Faktorenanalyse darstellen und anschlieszligend die Extraktion auf graphischem Wege plausibel machen Auf die Unterschiede zwischen konkreten (rechnerischen) Faktorextraktionsverfahren gehen wir dann im Zusammenhang mit der Bestimshymung der Kommunalitaumlten (Abs~hnitt 523) ein
278 Faktorenanalyse
5221 Das FundamentaItheorem
Waumlhrend die bisherigen Uumlberlegungen die Ausgangsdaten und ihre Eignung fuumlr faktoranalytische Zwecke betrafen stellt sich nun die Frage wie sich die Faktoren rechnerisch aus den Variablen ennitteln lassen Zu diesem Zweck geht die Faktoshyrenanalyse von folgender grundlegenden Annahme aus
Jeder Beobachtungswert einer Ausgangsvariablen Xj oder der stanshydardisierten Variablen Zj laumlszligt sich als eine Linearkombination mehshyrerer (hypothetischer) Faktoren beschreiben
Mathematisch laumlszligt sich dieser Zusammenhang wie folgt fonnulieren
(3a)Xkj =ajl Pkl +ap PIa + +ajQ PkQ
bzw fuumlr standardisierte x-Werte
(3b)Zkj=ajIPkl+a j2middotPIa+middot+a jQmiddotPkQ=iajqPkq
q~l
Die obige Fonnel (3b) besagt fuumlr das 2-Faktorenbeispiel nichts anderes als daszlig zB die standardisierten Beobachtungswerte fuumlr Anteil ungesaumlttigter Fettsaumluren und Vitamingehalt beschrieben werden durch die Faktoren P 1 und P2 so wie sie im Hinblick auf Marke k gesehen wurden ltPIel bzw Pk2) jeweils multipliziert mit ihren Gewichten bzw Faktorenladungen beim Merkmal j also fuumlr Faktor 1 ajl und
fuumlr Faktor 2 a2 Oie Faktorradung gibt dabei an wieviel ein Faktor mit einer Ausgangsvariablen
zu tun hat Im mathematisch-statistischen Sinne sind Faktorladungen nichts andeshyres als eine Maszliggroumlszlige fuumlr den Zusammenhang zwischen Variablen und Faktor und das ist wiederum nichts anderes als ein Korrelationskoeffizient zwischen Fakshytor und Variablen
Um die Notation zu verkuumlrzen schreibt man haumlufig den Ausdruck (3b) auch in Matrixschreibweise Identisch mit Fonnel (3b) ist daher auch folgende Mashytrixschreibweise die die Grundgleichung der Faktorenanalyse darstellt
(3c)Z=pmiddotA
Aufbauend auf diesem Grundzusammenhang laumlszligt sich dann auch eine Rechenshyvorschrift ableiten die aufzeigt wie aus den erhobenen Daten die vennuteten Fakshytoren mathematisch ennittelt werden koumlnnen
Wir hatten gezeigt daszlig die Korrelationsmatrix R sich bei standardisierten Daten wie folgt aus der Datenmatrix Z ennitteln laumlszligt
R=_I_ZZ (2) K-l
Vorgehensweise 279
Da Z aber im Rahmen der Faktorenanalyse durch P A beschrieben wird (Z =PA) ist in (2) Z durch Fonnel (3c) zu ersetzen so daszlig sich folgende Fonnet
ergibt
R=_I_PA)PA) (4)K I
Nach Aufloumlsung der Klammem ergibt sich nach den Regeln der Matrixmultiplishykation
r------- R=_I_APPA=A-I_pPA (5)
K-I ~
~
Da alle Daten standardisiert sind laumlszligt sich der _1_ ptP Ausdruck in Formel (5)K-l ----y---J
auch als K(Jrrelationsmatrix der Faktoren (C) bezeichnen (vgl Fonnel (2raquo so daszlig sich schreiben laumlszligt
R = AmiddotCmiddotA (6)
Da die Faktoren als unkorreliert angenommen werden entspricht C einer Einheitsshymatrix (einer Matrix die auf der Hauptdiagonalen nur Einsen und sonst Nullen enthaumllt) Da die Multiplikation einer Matrix mit einer Einheitsmatrix aber wieder die Ausgangsmatrix ergibt vereinfacht sich die Fonnel (6) zu
R = AmiddotA (7)
Die Beziehungen (6) und (7) werden von Thurstone als das Fundamentaltheorem der Faktorenanalyse bezeichnet da sie den Zusammenhang zwischen Korrelatishyonsmatrix und Faktorladungsmatrix beschreiben
Das Fundarnentaltheorem der Faktorenanalyse besagt nicht anderes als daszlig sich die Korrelationsmatrix durch die Faktorladungen (Matrix A) und die Korrelationen zwischen den Faktoren (Matrix C) reproduzieren laumlszligt Fuumlr den Fall daszlig man von unabhaumlngigen (orthogonalen) Faktoren ausgeht reduziert sich das Funshydamentaltheorem auf Fonnel (7) Dabei muszlig sich der Anwender allerdings bewuszligt sein daszlig das Fundamentaltheorem der Faktorenanalyse nach Fonnel (7) stets nur unter der Praumlmisse einer Linearverknuumlpfung und Unabhaumlngigkeit der Faktoren Guumlltigkeit besitzt
5222 Graphische Interpretation von Faktoren
Der Infonnationsgehalt einer Korrelationsmatrix laumlszligt sich auch graphisch in einem Vektor-Diagramm darstellen in dem die jeweiligen Korrelationskoeffizienten als Winkel zwischen zwei Vektoren dargestellt werden Zwei Vektoren werden dann
280 Faktorenanalyse
als linear unabhaumlngig bezeichnet wenn sie senkrecht (orthogonal) aufeinander steshyhen Sind die beiden betrachteten Vektoren (Variablen) jedoch korreliert ist der Korrelationskoeffizient also C 0 zB 05 dann wird dies graphisch durch einen Winkel von 60deg zwischen den beiden Vektoren dargestellt
Es stellt sich die Frage Warum entspricht ein Korrelationskoeffizient von 05 genau einem Winkel von 60deg Die Verbindung wird uumlber den Cosinus des jeshy
weiligen Winkels hergestellt Verdeutlichen wir uns dies anhand des Ausgangsbeispiels (Abbildung 515)
In Abbildung 515 repraumlsentieren die Vektoren AC und AB zB die beiden Vashyriablen Kaloriengehalt und Vitamingehalt Zwischen den beid~_yariablen moumlge eine Korrelation von 05 gemessen worden sein Der Vektor AC der den Kaloriengehalt repraumlsentiert und der genau wie AB aufgrund der Standardisierung eine Laumlnge von 1 hat weist zu AB einen Winkel von 60deg auf Der Cosinus des Winkels 60deg der die Stellung der beiden Variablen zueinander (ihre Richtung) anmiddot gibt ist definiert als Quotient aus Ankathete und Hypothenuse also als AD AC Da AC aber gleich 1 ist ist der Korrelationskoeffizient identisch mit der Strecke
AD Wie Abbildung 516 ausschnitthaft zeigt ist zB der Cosinus eines 60deg-Winkels
gleich 05 Entsprechend laumlszligt sich jeder beliebige Korrelationskoeffizient zwischen zwei Variablen auch durch zwei Vektoren mit einem genau definierten Winkel zushyeinander darstellen Verdeutlichen wir uns dies noch einmal anband einer Korrelamiddot tionsmatrix mit drei Variablen (Abbildung 517)
Abbildung 515 Vektordarstellung einer Korrelation zwischen zwei Variablen
c
A 0 B
)V
Standardisierte LOnge von 1
Vorgehensweise 281
Abbildung 516 Werte rur den Cosinus (entnommen aus Geliert W JKuumlstnerHlHellwich MfKaumlstner H Kleine Enzyshyklopaumldie Mathematik Leipzig 1969 S 799)
Grad CO Grad cO
45 07071 90 00000 44 7193 89 0175 43 7314 88 0349 42 7431 87 0523 41 7547 86 0698 40 07660 85 0872 39 7771 84 1045 38 7880 83 1219 37 7986 82 1392 36 8090 81 1564 35 8192 80 01736 34 8290 79 1908 33 8387 78 2079 32 8480 77 2250 31 8572 76 2419 30 08660 75 2588 29 8746 74 2756 28 8829 73 2924 27 8910 72 3090 26 8988 71 3256 25 9063 70 03420 24 9135 69 3584 23 9205 68 3746 22 9272 67 3907 21 9336 middot66 4067 ZO 09397 65 4226 19 9455 64 4384 18 9511 63 4540 17 9563 62 4695 16 9613 61 4848 15 9659 60 05000 14 9703 59 5150 13 9744 58 5299 12 9781 57 5446 11 9816 56 5592 10 09848 55 5736 9 9877 54 5878 8 9903 53 6018 7 9925 52 6157 6 9945 51 6293 5 9962 50 06428 4 9976 49 6561 3 9986 48 6691 2 9994 47 6820 1 9998 46 6947 0 10000 45 7071
282 Faktorenanalyse
Abbildung 517 Korrelationsmatrix
R =r68660 1 06428lO1736 ~
R laumlszligt sich auch anders schreiben (vgl Abbildung 518)
Abbildung 518 Korrelationsmatrix mit Winkelausdrucken
l0deg R = 30deg 0deg
80deg 50deg 0deg
Der Leser moumlge die entsprechenden Werte selbst in einer Cosinus-Tabelle uumlbershy
pruumlfenDie der oben gezeigten Korrelationsmatrix zugrundeliegenden drei Variablen
und ihre Beziehungen zueinander lassen sich relativ leicht in einem zweidimen sionalen Raum darstellen (Abbildung 519)
Abbildung 519 Graphische Darstellung des 3-Variablen-Beispiels
Vektor X2
Vektorx3Vektor Xl
Vorgehensweise 283
Je mehr Variable jedoch zu beruumlcksichtigen sind desto mehr Dimensionen werden benoumltigt um die Vektoren in ihren entsprechenden Winkeln zueinander zu positioshy
nieren Die Faktorenanalyse trachtet nun danach das sich uumlber die Korrelationsshykoeffizienten gemessene Verhaumlltnis der Variablen zueinander in einem moumlglichst gering dimensionierten Raum zu reproduzieren Die Zahl der benoumltigten Achsen gibt dann die entsprechende Zahl der Faktoren an
Wenn man die Achsen als Faktoren ansieht dann stellt sich unmittelbar die Frashyge Wie werden diese Achsen (Faktoren) in ihrer Lage zu den jeweiligen Vektoren (Variablen) bestimmt
Dazu vergegenwaumlrtigt man sich am besten das Bild eines halboffenen Schirmes Die Zacken des Schirmgestaumlnges die alle in eine bestimmte Richtung weisend die Variablen repraumlsentieren lassen sich naumlherungsweise auch durch den Schirmstock darstellen Vereinfacht man diese Uumlberlegung aus DarstellungsgrQnden noch weishyter auf den 2-Variablen-Fall wie in AbbiIdu8520 die einen Korrelationskoshyeffizienten von 05 fuumlr die durch die Vektoren OA und OB dargestellten Variablen repraumlsentiert dann gibt der Vektor OC eine zusammenfassende (faktorielle) Beshyschreibung wieder Die beiden Winkel von 30deg zwischen Vektor I bzw Vektor II und Faktor-Vektor geben wiederum an inwieweit der gefundene Faktor mit Vekshytor (Variable) I bzw II zusammenhaumlngt Sie repraumlsentieren ebenfalls Korrelationsshykoeffizienten und zwar die zwischen den jeweiligen Variablen und dem Faktor Diese Korrelationskoeffizienten hatten wir oben als Faktorladungen bezeichnet Die Faktorladungen des 1 Faktors betragen also in bezug auf Variable I und Varishyable II cos 30deg = 08660
Abbildung 520 FaktorlOsung bei 2 Variablen
j
A
Vektor x
~---------__------~---- C
Resultante
e Vektor X
284 Faktorenanalyse
5223 Das Problem der Faktorextraktion
Nachdem wir nun wissen was eine Faktorladung inhaltlich bedeutet ist zu fragen Wie findet man einen solchen Vektor (Faktor) der stellvertretend ftir mehrere zushysammenhaumlngende Variable fungieren kann Erinnern wir uns noch einmal des Ausgangsbeispiels Aufstrichfette waren nach den ftinfMerkmalen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt - Haltbarkeit - Preis bewertet worden l2
Aus dieser Bewertung sei die Korrelationsmatrix in Abbildung 521 berechnet worden
Abbildung 521 Spiegelbildlich identische KOlTelationsmatrix
x X x x x
x 70 100 09848 90middotX 03420 30x 00000 10middotx
X -01736
Diese Korrelationsmatrix enthaumllt in der unteren Dreiecks-Matrix die Korrelationsshywerte in der oberen (spiegelbildlich identischen) Dreiecks-Matrix die entshysprechenden Winkel Graphisch ist der Inhalt dieser Matrix in Abbildung 522 darshygestellt
Das Beispiel wurde so gewaumlhlt daszlig die Winkel zwischen den Faktoren in einer zweidimensionalen Darstellung abgebildet werden koumlnnen - ein Fall der in der Realitaumlt allerdings kaum relevant ist
Wie findet man nun den 1 Faktor in dieser Vektordarstellung Bleiben wir zunaumlchst bei der graphischen Darstellung dann sucht man den
Schwerpunkt aus den ftinf Vektoren Der Leser moumlge sich dazu folgendes verdeutlichen
In Abbildung 522 ist der Faktor nichts anderes als die Resultante der funfVektoshyren Wuumlrden die ftinfVektoren funf Seile darstellen mit einem Gewicht in 0 und jeweils ein Mann wuumlrde mit gleicher Staumlrke an den Enden der Seile ziehen dann wuumlrde sich das Gewicht in eine bestimmte Richtung bewegen (vgl die gestrichelte
12 Es werden hier andere Werte als im Ausgangsbeispiel verwendet um zunaumlchst eine einshydeutige graphische Loumlsung zu ermoumlglichen
Vorgehensweise 285
Linie in Abbildung 523) Diesen Vektor bezeichnen wir als Resultante Er ist die graphische Repraumlsentation des 1 Faktors
Abbildung 522 Graphische Darstellung des 5-Variablen-Beispiels
~
XsXl
bull
Abbildung 523 Graphische Darstellung des Schwerpunktes
X2
XIX
Faktorshyvektor2
Betrachtet man nun die jetzt gebildeten Winkel zwischen dem 1 Faktor und den Ausgangsvektoren dann hat man auch die gesuchten Faktorladungen gefunden
(Erste Reshysultante)
4512
-------o
- -
286 Faktorenanalyse
Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen
Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben
Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge
die Werte selbst uumlberpruumlfen)
Abbildung 524 Einfaktorielle Ladungsmatrix
Faktor
05707Xl 07046x2 bull 09668x3
08211x4
07096
Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)
Abbildung 525 ZweifaktorieHe Ladungsmatrix
Faktor 1 Faktor 2
Xl 05707 -08211
x2 07046 -07096
x3 09668 02554
x4 08211 05707
Xs 07096 07046
Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa
Vorgehensweise 287
In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum
I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1
~~ 00
2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation
Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist
Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt
Sf = 1 = Ijj (9)J
3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt
Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)
Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung
Resutlanie 2 (Faktor 2)
A Vektor x o
120lt= fH bull C Resultante 1 (Faktor 1)
B Vektor x
288 Faktorenanalyse
Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB
Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel
Wenn obige Behauptung stimmt muumlszligte gelten
(lOa)[~J +[~~J =1
Uumlberpruumlfung 2 2 uumlc2
OC 00 +002 (lOb)--+-shy 2
OA OA OA2 2
In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)
Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)
(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)
2 2 OC +00
4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten
sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)
wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-
q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1
(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix
(2) Extraktion der
(5) Faktorinterpretatiln
(6) Bestimmung der Faktorwerte
Vorgehensweise 289
523 Bestimmung der Kommunalitaumlten
In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem
Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy
fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig
mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da
J
i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins
Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung
erklaumlrte Variant
standardisierte Gesamtvariant = 1
290 Faktorenanalyse
Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung
2 a j1 =07
2 2 8 j2 = 01 siRest= 02
Kommunalitat H =08 (erllt1arte Varianz)
Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)
R AmiddotA+U (7a)
Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet
Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion
Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer
Vorgehensweise 291
100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY
In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy
weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen
Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen
1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen
2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit
2 2I ~ ~ R j ~ mx rjk
Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse
- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy
13 Vgl Loehlin J C 1998 S 154 14
Vgl Uberla K 1972 S 155 ff
292 Faktorenanalyse
nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird
- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit
Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy
15formationsverlust deklariert wird
Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen
Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy
15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt
Vorgehensweise 293
tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder
Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren
Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen
Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren
Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist
Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf
Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden
Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel
Kommunalltlten
Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325
Extraktionsmelhode Hauptachsen-Faktorenanalyse
bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix
294 Faktorenanalyse
Abbildung 530 Faktorladungen im 6-Produkte-Beispiel
Faktoranmatrixmiddot
Faktor
1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608
Extraktionsmethode Hauptachsen-Faktorenanalyse
a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt
Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert
Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel
Reproduzierte Korrelationen
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT
KALORIEN
VITAMIN
HALTBARK
PREIS
96845 71193 96034 11035 04241
71193 52552b
70480
12709
07717
96034 70480 95292b
08461 01722
11035
12709 08461 99056b
8325
04241 07717 01722 98325 98070b
Residuun1 UNGEFETi
KALORIEN
VITAMIN
HALTBARK
PREIS
-00017 00101
-00141 00144
-00017
-00083 01001
- 01005
00101 -00083
-00036 00640
-00141 01061
-00636
00010
00144 -01005 00640 00010
ExtrakHonsmethode Hauptllchsenfaktorenanalyse
a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005
b Reproduzierte Kommunalltaumlten
Vorgehensweise 295
Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen
Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R
524 Zahl der Faktoren
(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix
(2) Extraktion der Faktoren
(6) Bestimmung der Faktorwerte
Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff
Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-
q N
trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N
Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden
Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy
296 Faktorenanalyse
Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre
Abbildung 532 Bestimmung der Eigenwerte
Faktorenmatrix
Faktor
1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)
Eigenwerte 25068 19112
Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil
Kom munalltaumlten
Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807
- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren
V orgehensweise 297
Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung
Abbildung 534 Scree-Test im 6-Produkte-Beispiel
Eigen- Screeplot wert 30
25
20
15
Kaiser-Kriterium
10 1 Elbow5
00 2 3 4 5
Faktomummer
298 Faktorenanalyse
525 Faktorinterpretation
Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)
Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt
(1) Variablenauswalll und Errechnung der Korrelationsmalrix
(2) Extraktion der Faktoran
(3) Bestimmung der Kommunalltaumllen
(6) Bestimmung derFaktorwerte _______---11
middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull
geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht
Abbildung 535 Faktorladungen im 6-Produkte-Beispiel
Preis Haltbarkeit
Extraktionsmethode Hauptachsen-Faktorenanalyse
Vorgehensweise 299
Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist
Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig
Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16
Abbildung 536 Unrotierte Faktorladungen
F
F
Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung
Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f
300 Faktorenanalyse
536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy
tert
Abbildung 537 Rotierte Faktorladungen
F (Ausgangssituation)2
11 F2 (rotiert)
F1
-- shy
(Ausgangssituation)
11
F1 (rotiert)
SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen
1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen
(rechtwinkligen) Rotation
2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren
Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die
vorgenenswelse j U 1
Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind
Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel
Faktor
1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt
Haltbarkeit
72152 bull 07020
07962 I 99208 Preis 01060 99025
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung
Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen
A bull =A T mit TC~SI7 - sina ] sma cosa
Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links
A T A 094331 - 028039 098357 003229
[C0s341570 - sin34 157 ]070669 016156 072152 007020
sin34157deg cos34157092825 - 030210 097615 000694
038926 091599 007962 099208
032320 093608 001060 099025
Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)
Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix
Faktor 1 2
1 94868 31622
2 -31622 94868
Il
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung
Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig
von a=1843deg
526 Bestimmung der Faktorwerte
(1) Variablenauswanl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitaumlten
Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte
Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt
(3c)Z=PmiddotA
Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY
(12)Z AT1p AAT
Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt
(13)ZArl=pE
Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten
(3c) wird von rechts mit A multipliziert
ZmiddotA=PmiddotAmiddotA (15)
Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar
ZAmiddot(A At1=P(A A) (A Atl (16)
Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt
P=ZA(AAt l (17)
In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren
In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term
AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte
Abbildung 540 Koeffizientenmatrix der Faktorwerte
Faktor 1 2
Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression
Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die
xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf
SjDa p E=P ist ergibt sich
Seite 271 zu (14)
P=ZAT
304 Faktorenanalyse
Abbildung 541 Standardisierte Ausgangsdatenmatrix Z
45ampt6R4LJL4
Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542
Abbildung 542 Faktorwerte im 6-Produkte-Beispiel
Vorgehensweise 305
Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel
Du darfst
VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG
E 11 BecelS
U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T
Sanella IIII Holl Butter
-1
bull Rama
-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18
WIRTSCHAFTLICHKEIT
Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen
527 Zusammenfassende Darstellung der Faktorenanalyse
Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy
e Vorgehensweise 307 306 Faktorenanalyse
Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen
sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-
schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy
tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig
wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy
nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy
chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy
analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte
Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht
Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der
Verwendung des Verfahrens offenzulegen
I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _
CQ)l2CQgtQ ~ i
-Q)C t l5~11
0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C
CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O
~ ~ 11 t 3
uj~fi
t Imiddot~ J1 ~SHaa
It c~
c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~
-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi
o~ ~ -gEG)
I ~l c c ~l~ampi
2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E
U~a ]i E
J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy
~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--
----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt
Fallbeispiel 309308 Faktorenanalyse
Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert
531 Problemstellung
In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften
Variable und Objekte des BeispielsAbbildung 545
EigenschaftenMarken M k (k=I Il) xj(j=I IO)
A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado
5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H
I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama
Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist
Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)
Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern
Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse
---
310Faktorenanalyse
532 Ergebnisse
1 Variablenauswahl und Errechnung der Korrelationsmatrix
Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung
548 wiedergegeben
Abbildung 548 Die Korrelationskoeffizienten -_ -
-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy
In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der
Fallbeispiel 311
Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet
Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie
-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -
06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170
-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260
62444 -97126 66229 -83532 -62589
-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545
-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno
Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)
Abbildung 550 Dialogfeld Deskriptive Statistik
312 Faktorenanalyse
2 Bestimmung der Kommunalitilten
Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt
wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend
bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich
von den Startwerten abweichen
Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten
Hauptkomponentenanalyse Hauptachsenanalyse
Variable Korrunuriali- Kommunali- Korrununali- Kommunali-
Ut (Startwerte)
tlt (Endwerte)
tlIl (Startwerte )
tlIl (End werte)
STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR
100000 100000 100000 100000 100000 100000 100000 100000 100000 100000
88619
76855
89167 85324 76043 84012 80223 92668 63297 88786
97414
89018
79497
85847
96501
98810
97132
99166
78019
96445
85325
55717
85754
91075
55819
82330
73903
94796
40402
87851
Fallbeispiel 313
Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy
I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren
Abbildung 552 Dialogfeld Extraktion
Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist
3 Wabl der Extraktionsmetbode
Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen
4 Zabl der Faktoren
Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen
Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet
Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch
17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f
1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden
Erklaumlrte Gesamtvarianz
Anfaumlngliche Eigenwerte
314 Faktorenanalyse
Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy
den sich fUnfFaktoren ergeben
Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien
95) der Varianz erklaumlrt sind
2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)
3 Extrahiere n (zB 3) Faktoren
4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy
renzahl
5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein
6 Extrahiere alle Faktoren die nach der
Vom Computer automatisch verwandt wenn keine andere Spezifikation
Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden
Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden
Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist
Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt
Fallbeispiel 315
Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil
Faktor 1
2 3
4
5
6
7
8
9
10
Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden
Abbildung 555 Scree-Test und Kaiser-Kriterium
Eigen- -=gtcreeplot wert
5
4
3
2
10
o Kaisershy
~ 3 i i 7 i Q
Faktornummer
Gesamt 505188
177106
142700
81935
42961
24709
15928
06190
02943
00340
der Varianz 5051883
1771061
1427002
819349 429611
247085
159275
61902
29434
03398
Kumulierte 5051883
6822944
8249946
9069295
9498905
9745991
9905266
9967168
9996602
10000000
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
274 Faktorenanalyse
tionskoeffizienten mit geringen Werten auch ein hohes Signifikanzniveau (Wertegt 04) besitzen Das bedeutet daszlig sich ZB die Korrelation zwischen den Variablen Vitamingehalt und Haltbarkeit nur mit einer Wahrscheinlichkeit von (1- 044 =) 56 von Null unterscheidet
Inverse der Korrelationsmatrix
Die Eignung einer Korrelationsmatrix fuumlr die Faktorenanalyse laumlszligt sich weiterhin an der Struktur der Inversen der Korrelationsmatrix erkennen Dabei wird davon ausgegangen daszlig eine Eignung dann gegeben ist wenn die Inverse eine Diagoshynamatrix darstellt d h die Nicht-diagonal-Elemente der inversen Korrelatishyonsmatrix moumlglichst nahe bei Null liegen Fuumlr das 6-Produkte-Beispiel zeigt Abbildung 512 daszlig insbesondere fuumlr die Werte der Variablen Ungesaumlttigte Fettshysaumluren und Vitamingehalt sowie Haltbarkeit und Preis hohe Werte auftreshyten waumlhrend alle anderen Werte relativ nahe bei Null liegen Es existiert allerdings kein allgemeinguumlltiges Kriterium dafuumlr wie stark und wie haumlufig die Nicht-diashygonal-Elemente von Null abweichen duumlrfen
Abbildung 512 Inverse der Korrelationsmatrix im 6-Produkte-Beispie1
Inverse KorrelationsmatrIx
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS UNIiIIt
KALORIEN VITAMIN
HALTBARK
PREIS
1449910 -60678
-1319772 -558018 520353
-60678 217944 -82863
-218066 204555
-1319772 -82863
1400000 479257
-440959
-558018 -218066 479257
3817871 -3126624
520353 204555
-440959 -3726624 3738542
Bartlett-Test (test of spherlcity)
Der Bartlett-Test uumlberpruumlft die Hypothese ob die Stichprobe aus einer Grundgeshysamtheit entstammt in der die Variablen unkorreliert sinds
Gleichbedeutend mit dieser Aussage ist die Frage ob die Korrelationsmatrix nur zuflillig von einer Einheitsmatrix abweicht da im Falle der Einheitsmatrix alle Nicht-diagonal-Elemente Null sind d h keine Korrelationen zwischen den Varishyablen vorliegen Es werden folgende Hypothesen formuliert
HO Die Variablen in der Erhebungsgesamtheit sind unkorreliert
H1 Die Variablen in der Erhebungsgesamtheit sind korreliert
Der Bartlett-Test setzt voraus daszlig die Variablen in der Erhebungsgesamtheit einer Normaverteiung folgen und die entsprechende Pruumlf groumlszlige annaumlhernd ChishyQuadrat-verteilt ist Letzteres aber bedeutet daszlig der Wert der Pruumlfgroumlszlige in hohem
5 Vgl Dziuban C DlShirkey E C 1974 S 358 ff bull
Vorgehensweise 275
Maszlige durch die Groumlszlige der Stichprobe beeinfluszligt wird Fuumlr unser Beispiel erbrachshyte der Bartlett-Test eine Pruumlfgroumlszlige von 17371 bei einem Signifikanzniveau von 00665 Das bedeutet daszlig mit einer Wahrscheinlichkeit von (1- 00655=)9345
davon auszugehen ist daszlig die Variablen der Erhebungsgesamtheit korreliert sind Setzt man als kritische Irrtumswahrscheinlichkeit einen Wert von 005 fest so waumlshyre fuumlr unser Beispiel die Nullhypothese anzunehmen und folglich die Korrelatishyonsmatrix nur zufaumlllig von der Einheitsmatrix verschieden Das laumlszligt dann den Schluszlig zu daszlig die Ausgangsvariablen in unserem Fall unkorreliert sind
Allerdings sei an dieser Stelle nochmals darauf hingewiesen daszlig die Anwenshydung des Bartlett-Tests eine Pruumlfung der Ausgangsdaten auf Normalverteilung voraussetzt die in unserem Fall noch erfolgen muumlszligte
Anti-Image-Kovarianz-Matrix
Der Begriff Anti-Image stammt aus der Image-Analyse von Guttmann6 Guttrnann geht davon aus daszlig sich die Varianz einer Variablen in zwei Teile zerlegen laumlszligt das Image und das Anti-Image
Das Image beschreibt dabei den Anteil der Varianz der durch die verbleibenden Variablen mit Hilfe einer multiplen Regressionsanalyse (vgl Kapitel 1) erklaumlrt werden kann waumlhrend das Anti-Image denjenigen Teil darstellt der von den uumlbrishygen Variablen unabhaumlngig istlDa die Faktorenanalyse unterstellt daszlig den Variabshylen gemeinsame Faktoren zugrunde liegen ist es unmittelbar einsichtig daszlig Varishyablen nur dann fuumlr eine Faktorenanalyse geeriiet sind wenn das Anti-Image der Variablen moumlglichst gering ausflilltDas ab bedJJltet daszlig die Nicht-diagonalshyElemente der Anti-Image-Kovarianz-Matrix m glichst nahe bei Null liegen muumlsshysen bzw diese Matrix eine Diagonamatrix darstellen sollte Fuumlr das 6-ProdukteshyBeispiel zeigt Abbildung 513 daszlig die Forderung nach einer Diagonalmatrix ershyfiiHt ist
Abbildung 513 Anti-Image-Kovarianz-Matrix im 6-Produkte-Beispiel
AnIlJmIU_atrIzen
UNGEFETT KALORIEN VITAMIN HALTBARKi Arililinage-lltovananz PREISUNuumll1 06897 -01920 -06502 -01008 00960KAlORIEN -01920 45883 -02716 -02621 02511VITAMIN -06502 02716 07143 00897 -00842HALTBARK -01008 02621 00697 02619 -02611PREIS 00960 02511 -00842 middot02611 02675
Als Kriterium dafilr wann die Forderung nach einer Diagonalmatrix erfuumlllt ist schlagen Dziuban und Shirkey vor die Korrelationsmatrix dann als fuumlr die Fakshytorenanalyse ungeeignet anzusehen wenn der Anteil der Nicht-diagonal-Elemente die ungleich Null sind (gt 009) in der Anti-Image-Kovarianzmatrix (AIC) 25
Vgl Guttmann L 1953 S 277 ff
LIO r aKlOrenanalyse
oder mehr betraumlgt7 Das trifft in unserem Fall filr keines der Nicht-diagonalshyElemente der Ale-Matrix zu womit nach diesem Kriterium die Korrelationsmatrix filr faktoranalytische Auswertungen geeignet ist
Kaiser-Meyer-Olkin-Kriterium
Waumlhrend die Uumlberlegungen von Dziuban und Shirkey auf Plausibilitaumlt beruhen haben Kaiser Meyer und Olkin versucht eine geeignete Pruumlfgroumlszlige zu entwickeln und diese zur Entscheidungsfindung heranzuziehen Sie berechnen ihre PTUumlfgroumlszlige die als measure 0sampling adequacy (MSA) bezeichnet wird auf Basis der Anshyti-Image-KorrelationsmatrixbullDas MSA-Kriterium zeigt an in welchem Umfang die Ausgangsvariablen zusammengehoumlren und dient somit als Indikator dafilr ob eine Faktorenanalyse sinnvoll erscheint oder nichtDas MSA-Kriterium erlaubt sowohl eine Beurteilung der Korrelationsmatrix insgesamt als auch einzelner Varishyablen sein Wertebereich liegt zwischen degund 1 Kaiser und Rice schlagen folgenshy
8de Beurteilungen vor
MSA 2 09 marvelous (erstaunlich) MSA 2 08 meritorious (verdienstvoll) MSA 2 07 middling (ziemlich gut) MSA 2 06 mediocre (mittelmaumlszligig) MSA 2 05 miserable (klaumlglich) MSA lt05 unacceptable (untragbar)
Sie vertreten die Meinung daszlig sich eine Korrelationsmatrix mit MSA lt 05 nicht rur eine Faktorenanalyse eignet9 Als wuumlnschenswert sehen sie einen Wert von MSA 2 08 an lO In der Literatur wird das MSA-Kriterium das auch als KaisershyMeyer-Olkin-Kriterium (KMK) bezeichnet wird als das beste zur Verrugung steshyhende Verfahren zur Pruumlfung der Korrelationsmatrix angesehen weshalb seine Anwendunrvor der Durchfuhrung einer Faktorenanalyse auf jeden Fall zu empshyfehlen ist 1
Bezogen auf unser 6-Produkte-Beispiel ergab sich rur die Korrelationsmatrix insgesamt ein MSA-Wert von 0576 womit sich rur unser Beispiel ein riur klaumlglishyches Ergebnis ergibt Daruumlber hinaus gibt SPSS in der Diagonalen der AntishyImage-Korrelationsmatrix aber auch das MSA-Kriterium rur die einzelnen Variabshylen an
7 Vgl Dziuban C DlShirkey E C 1974 S 359
8 Vgl Kaiser H FRice J 1974 S 111 ff
9 Vgl Cureton E EDAgostino R B 1983 S 389 f
10 Vgl Kaiser H F 1970 S 405
II Vgl Stewart D W 1981 S 57 f Dziuban C DlShirkey E C 1974 S 360 f
Vorgehensweise 277
Abbildung 514 Anti-Image-Korrelations-Matrix im 6-Produkte-Beispiel
Antllmlge-Matrlun
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS AntI-lmageMrrelilllOn UNGEFETT 59680middot 10794 -92633 -23717 22350
KALORIEN -10794 87789 -15001 -23906 22661 VITAMIN -92633 -15001 59755 20730 -19274 HALTSARK -23717 -23906 20730 47060 -98640 PREIS 22350 22561 -19274 -95640 45701
8 Maszlig der StlchplObenelgnung
Abbildung 514 macht deutlich daszlig lediglich die Variable Kaloriengehalt mit einem MSA-Wert von 087789 als verdienstvoll anzusehen ist waumlhrend alle uumlbshyrigen Variablen eher klaumlgliche oder untragbare Ergebnisse aufweisen Die vashyriablenspezifischen MSA-Werte liefern damit rur den Anwender einen Anshyhaltspunkt dafuumlr welche Variablen aus der Analyse auszuschlieszligen waumlren wobei sich ein sukzessiver Ausschluszlig von Variablen mit jeweiliger Pruumlfung der vorgeshystellten Kriterien empfiehlt
522 Extraktion der Faktoren
(4) Zahl der Faktoren
(5) Faktorinterp~etat~ (6) Bestimmung der
Faktorwerte
Die bisherigen Ausruhrungen haben verdeutlicht daszlig bei Faktorenanalysen groszlige Sorgfalt auf die Wahl der Untersuchungsmerkmale und -einheiten zu verwenden ist da durch die Guumlte der Korrelationsmatrix die den Startpunkt der Faktorenanalyse darstellt alle Ershygebnisse der Faktorenanalyse beeinfluszligt werden Im folgenden ist nun zu fragen wie denn nun die Faktoren rein rechnerisch aus den Variablen ermittelt werden koumlnnen Wir werden im folgenden zunaumlchst das Funshydamentaltheorem der Faktorenanalyse darstellen und anschlieszligend die Extraktion auf graphischem Wege plausibel machen Auf die Unterschiede zwischen konkreten (rechnerischen) Faktorextraktionsverfahren gehen wir dann im Zusammenhang mit der Bestimshymung der Kommunalitaumlten (Abs~hnitt 523) ein
278 Faktorenanalyse
5221 Das FundamentaItheorem
Waumlhrend die bisherigen Uumlberlegungen die Ausgangsdaten und ihre Eignung fuumlr faktoranalytische Zwecke betrafen stellt sich nun die Frage wie sich die Faktoren rechnerisch aus den Variablen ennitteln lassen Zu diesem Zweck geht die Faktoshyrenanalyse von folgender grundlegenden Annahme aus
Jeder Beobachtungswert einer Ausgangsvariablen Xj oder der stanshydardisierten Variablen Zj laumlszligt sich als eine Linearkombination mehshyrerer (hypothetischer) Faktoren beschreiben
Mathematisch laumlszligt sich dieser Zusammenhang wie folgt fonnulieren
(3a)Xkj =ajl Pkl +ap PIa + +ajQ PkQ
bzw fuumlr standardisierte x-Werte
(3b)Zkj=ajIPkl+a j2middotPIa+middot+a jQmiddotPkQ=iajqPkq
q~l
Die obige Fonnel (3b) besagt fuumlr das 2-Faktorenbeispiel nichts anderes als daszlig zB die standardisierten Beobachtungswerte fuumlr Anteil ungesaumlttigter Fettsaumluren und Vitamingehalt beschrieben werden durch die Faktoren P 1 und P2 so wie sie im Hinblick auf Marke k gesehen wurden ltPIel bzw Pk2) jeweils multipliziert mit ihren Gewichten bzw Faktorenladungen beim Merkmal j also fuumlr Faktor 1 ajl und
fuumlr Faktor 2 a2 Oie Faktorradung gibt dabei an wieviel ein Faktor mit einer Ausgangsvariablen
zu tun hat Im mathematisch-statistischen Sinne sind Faktorladungen nichts andeshyres als eine Maszliggroumlszlige fuumlr den Zusammenhang zwischen Variablen und Faktor und das ist wiederum nichts anderes als ein Korrelationskoeffizient zwischen Fakshytor und Variablen
Um die Notation zu verkuumlrzen schreibt man haumlufig den Ausdruck (3b) auch in Matrixschreibweise Identisch mit Fonnel (3b) ist daher auch folgende Mashytrixschreibweise die die Grundgleichung der Faktorenanalyse darstellt
(3c)Z=pmiddotA
Aufbauend auf diesem Grundzusammenhang laumlszligt sich dann auch eine Rechenshyvorschrift ableiten die aufzeigt wie aus den erhobenen Daten die vennuteten Fakshytoren mathematisch ennittelt werden koumlnnen
Wir hatten gezeigt daszlig die Korrelationsmatrix R sich bei standardisierten Daten wie folgt aus der Datenmatrix Z ennitteln laumlszligt
R=_I_ZZ (2) K-l
Vorgehensweise 279
Da Z aber im Rahmen der Faktorenanalyse durch P A beschrieben wird (Z =PA) ist in (2) Z durch Fonnel (3c) zu ersetzen so daszlig sich folgende Fonnet
ergibt
R=_I_PA)PA) (4)K I
Nach Aufloumlsung der Klammem ergibt sich nach den Regeln der Matrixmultiplishykation
r------- R=_I_APPA=A-I_pPA (5)
K-I ~
~
Da alle Daten standardisiert sind laumlszligt sich der _1_ ptP Ausdruck in Formel (5)K-l ----y---J
auch als K(Jrrelationsmatrix der Faktoren (C) bezeichnen (vgl Fonnel (2raquo so daszlig sich schreiben laumlszligt
R = AmiddotCmiddotA (6)
Da die Faktoren als unkorreliert angenommen werden entspricht C einer Einheitsshymatrix (einer Matrix die auf der Hauptdiagonalen nur Einsen und sonst Nullen enthaumllt) Da die Multiplikation einer Matrix mit einer Einheitsmatrix aber wieder die Ausgangsmatrix ergibt vereinfacht sich die Fonnel (6) zu
R = AmiddotA (7)
Die Beziehungen (6) und (7) werden von Thurstone als das Fundamentaltheorem der Faktorenanalyse bezeichnet da sie den Zusammenhang zwischen Korrelatishyonsmatrix und Faktorladungsmatrix beschreiben
Das Fundarnentaltheorem der Faktorenanalyse besagt nicht anderes als daszlig sich die Korrelationsmatrix durch die Faktorladungen (Matrix A) und die Korrelationen zwischen den Faktoren (Matrix C) reproduzieren laumlszligt Fuumlr den Fall daszlig man von unabhaumlngigen (orthogonalen) Faktoren ausgeht reduziert sich das Funshydamentaltheorem auf Fonnel (7) Dabei muszlig sich der Anwender allerdings bewuszligt sein daszlig das Fundamentaltheorem der Faktorenanalyse nach Fonnel (7) stets nur unter der Praumlmisse einer Linearverknuumlpfung und Unabhaumlngigkeit der Faktoren Guumlltigkeit besitzt
5222 Graphische Interpretation von Faktoren
Der Infonnationsgehalt einer Korrelationsmatrix laumlszligt sich auch graphisch in einem Vektor-Diagramm darstellen in dem die jeweiligen Korrelationskoeffizienten als Winkel zwischen zwei Vektoren dargestellt werden Zwei Vektoren werden dann
280 Faktorenanalyse
als linear unabhaumlngig bezeichnet wenn sie senkrecht (orthogonal) aufeinander steshyhen Sind die beiden betrachteten Vektoren (Variablen) jedoch korreliert ist der Korrelationskoeffizient also C 0 zB 05 dann wird dies graphisch durch einen Winkel von 60deg zwischen den beiden Vektoren dargestellt
Es stellt sich die Frage Warum entspricht ein Korrelationskoeffizient von 05 genau einem Winkel von 60deg Die Verbindung wird uumlber den Cosinus des jeshy
weiligen Winkels hergestellt Verdeutlichen wir uns dies anhand des Ausgangsbeispiels (Abbildung 515)
In Abbildung 515 repraumlsentieren die Vektoren AC und AB zB die beiden Vashyriablen Kaloriengehalt und Vitamingehalt Zwischen den beid~_yariablen moumlge eine Korrelation von 05 gemessen worden sein Der Vektor AC der den Kaloriengehalt repraumlsentiert und der genau wie AB aufgrund der Standardisierung eine Laumlnge von 1 hat weist zu AB einen Winkel von 60deg auf Der Cosinus des Winkels 60deg der die Stellung der beiden Variablen zueinander (ihre Richtung) anmiddot gibt ist definiert als Quotient aus Ankathete und Hypothenuse also als AD AC Da AC aber gleich 1 ist ist der Korrelationskoeffizient identisch mit der Strecke
AD Wie Abbildung 516 ausschnitthaft zeigt ist zB der Cosinus eines 60deg-Winkels
gleich 05 Entsprechend laumlszligt sich jeder beliebige Korrelationskoeffizient zwischen zwei Variablen auch durch zwei Vektoren mit einem genau definierten Winkel zushyeinander darstellen Verdeutlichen wir uns dies noch einmal anband einer Korrelamiddot tionsmatrix mit drei Variablen (Abbildung 517)
Abbildung 515 Vektordarstellung einer Korrelation zwischen zwei Variablen
c
A 0 B
)V
Standardisierte LOnge von 1
Vorgehensweise 281
Abbildung 516 Werte rur den Cosinus (entnommen aus Geliert W JKuumlstnerHlHellwich MfKaumlstner H Kleine Enzyshyklopaumldie Mathematik Leipzig 1969 S 799)
Grad CO Grad cO
45 07071 90 00000 44 7193 89 0175 43 7314 88 0349 42 7431 87 0523 41 7547 86 0698 40 07660 85 0872 39 7771 84 1045 38 7880 83 1219 37 7986 82 1392 36 8090 81 1564 35 8192 80 01736 34 8290 79 1908 33 8387 78 2079 32 8480 77 2250 31 8572 76 2419 30 08660 75 2588 29 8746 74 2756 28 8829 73 2924 27 8910 72 3090 26 8988 71 3256 25 9063 70 03420 24 9135 69 3584 23 9205 68 3746 22 9272 67 3907 21 9336 middot66 4067 ZO 09397 65 4226 19 9455 64 4384 18 9511 63 4540 17 9563 62 4695 16 9613 61 4848 15 9659 60 05000 14 9703 59 5150 13 9744 58 5299 12 9781 57 5446 11 9816 56 5592 10 09848 55 5736 9 9877 54 5878 8 9903 53 6018 7 9925 52 6157 6 9945 51 6293 5 9962 50 06428 4 9976 49 6561 3 9986 48 6691 2 9994 47 6820 1 9998 46 6947 0 10000 45 7071
282 Faktorenanalyse
Abbildung 517 Korrelationsmatrix
R =r68660 1 06428lO1736 ~
R laumlszligt sich auch anders schreiben (vgl Abbildung 518)
Abbildung 518 Korrelationsmatrix mit Winkelausdrucken
l0deg R = 30deg 0deg
80deg 50deg 0deg
Der Leser moumlge die entsprechenden Werte selbst in einer Cosinus-Tabelle uumlbershy
pruumlfenDie der oben gezeigten Korrelationsmatrix zugrundeliegenden drei Variablen
und ihre Beziehungen zueinander lassen sich relativ leicht in einem zweidimen sionalen Raum darstellen (Abbildung 519)
Abbildung 519 Graphische Darstellung des 3-Variablen-Beispiels
Vektor X2
Vektorx3Vektor Xl
Vorgehensweise 283
Je mehr Variable jedoch zu beruumlcksichtigen sind desto mehr Dimensionen werden benoumltigt um die Vektoren in ihren entsprechenden Winkeln zueinander zu positioshy
nieren Die Faktorenanalyse trachtet nun danach das sich uumlber die Korrelationsshykoeffizienten gemessene Verhaumlltnis der Variablen zueinander in einem moumlglichst gering dimensionierten Raum zu reproduzieren Die Zahl der benoumltigten Achsen gibt dann die entsprechende Zahl der Faktoren an
Wenn man die Achsen als Faktoren ansieht dann stellt sich unmittelbar die Frashyge Wie werden diese Achsen (Faktoren) in ihrer Lage zu den jeweiligen Vektoren (Variablen) bestimmt
Dazu vergegenwaumlrtigt man sich am besten das Bild eines halboffenen Schirmes Die Zacken des Schirmgestaumlnges die alle in eine bestimmte Richtung weisend die Variablen repraumlsentieren lassen sich naumlherungsweise auch durch den Schirmstock darstellen Vereinfacht man diese Uumlberlegung aus DarstellungsgrQnden noch weishyter auf den 2-Variablen-Fall wie in AbbiIdu8520 die einen Korrelationskoshyeffizienten von 05 fuumlr die durch die Vektoren OA und OB dargestellten Variablen repraumlsentiert dann gibt der Vektor OC eine zusammenfassende (faktorielle) Beshyschreibung wieder Die beiden Winkel von 30deg zwischen Vektor I bzw Vektor II und Faktor-Vektor geben wiederum an inwieweit der gefundene Faktor mit Vekshytor (Variable) I bzw II zusammenhaumlngt Sie repraumlsentieren ebenfalls Korrelationsshykoeffizienten und zwar die zwischen den jeweiligen Variablen und dem Faktor Diese Korrelationskoeffizienten hatten wir oben als Faktorladungen bezeichnet Die Faktorladungen des 1 Faktors betragen also in bezug auf Variable I und Varishyable II cos 30deg = 08660
Abbildung 520 FaktorlOsung bei 2 Variablen
j
A
Vektor x
~---------__------~---- C
Resultante
e Vektor X
284 Faktorenanalyse
5223 Das Problem der Faktorextraktion
Nachdem wir nun wissen was eine Faktorladung inhaltlich bedeutet ist zu fragen Wie findet man einen solchen Vektor (Faktor) der stellvertretend ftir mehrere zushysammenhaumlngende Variable fungieren kann Erinnern wir uns noch einmal des Ausgangsbeispiels Aufstrichfette waren nach den ftinfMerkmalen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt - Haltbarkeit - Preis bewertet worden l2
Aus dieser Bewertung sei die Korrelationsmatrix in Abbildung 521 berechnet worden
Abbildung 521 Spiegelbildlich identische KOlTelationsmatrix
x X x x x
x 70 100 09848 90middotX 03420 30x 00000 10middotx
X -01736
Diese Korrelationsmatrix enthaumllt in der unteren Dreiecks-Matrix die Korrelationsshywerte in der oberen (spiegelbildlich identischen) Dreiecks-Matrix die entshysprechenden Winkel Graphisch ist der Inhalt dieser Matrix in Abbildung 522 darshygestellt
Das Beispiel wurde so gewaumlhlt daszlig die Winkel zwischen den Faktoren in einer zweidimensionalen Darstellung abgebildet werden koumlnnen - ein Fall der in der Realitaumlt allerdings kaum relevant ist
Wie findet man nun den 1 Faktor in dieser Vektordarstellung Bleiben wir zunaumlchst bei der graphischen Darstellung dann sucht man den
Schwerpunkt aus den ftinf Vektoren Der Leser moumlge sich dazu folgendes verdeutlichen
In Abbildung 522 ist der Faktor nichts anderes als die Resultante der funfVektoshyren Wuumlrden die ftinfVektoren funf Seile darstellen mit einem Gewicht in 0 und jeweils ein Mann wuumlrde mit gleicher Staumlrke an den Enden der Seile ziehen dann wuumlrde sich das Gewicht in eine bestimmte Richtung bewegen (vgl die gestrichelte
12 Es werden hier andere Werte als im Ausgangsbeispiel verwendet um zunaumlchst eine einshydeutige graphische Loumlsung zu ermoumlglichen
Vorgehensweise 285
Linie in Abbildung 523) Diesen Vektor bezeichnen wir als Resultante Er ist die graphische Repraumlsentation des 1 Faktors
Abbildung 522 Graphische Darstellung des 5-Variablen-Beispiels
~
XsXl
bull
Abbildung 523 Graphische Darstellung des Schwerpunktes
X2
XIX
Faktorshyvektor2
Betrachtet man nun die jetzt gebildeten Winkel zwischen dem 1 Faktor und den Ausgangsvektoren dann hat man auch die gesuchten Faktorladungen gefunden
(Erste Reshysultante)
4512
-------o
- -
286 Faktorenanalyse
Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen
Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben
Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge
die Werte selbst uumlberpruumlfen)
Abbildung 524 Einfaktorielle Ladungsmatrix
Faktor
05707Xl 07046x2 bull 09668x3
08211x4
07096
Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)
Abbildung 525 ZweifaktorieHe Ladungsmatrix
Faktor 1 Faktor 2
Xl 05707 -08211
x2 07046 -07096
x3 09668 02554
x4 08211 05707
Xs 07096 07046
Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa
Vorgehensweise 287
In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum
I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1
~~ 00
2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation
Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist
Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt
Sf = 1 = Ijj (9)J
3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt
Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)
Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung
Resutlanie 2 (Faktor 2)
A Vektor x o
120lt= fH bull C Resultante 1 (Faktor 1)
B Vektor x
288 Faktorenanalyse
Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB
Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel
Wenn obige Behauptung stimmt muumlszligte gelten
(lOa)[~J +[~~J =1
Uumlberpruumlfung 2 2 uumlc2
OC 00 +002 (lOb)--+-shy 2
OA OA OA2 2
In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)
Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)
(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)
2 2 OC +00
4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten
sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)
wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-
q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1
(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix
(2) Extraktion der
(5) Faktorinterpretatiln
(6) Bestimmung der Faktorwerte
Vorgehensweise 289
523 Bestimmung der Kommunalitaumlten
In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem
Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy
fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig
mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da
J
i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins
Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung
erklaumlrte Variant
standardisierte Gesamtvariant = 1
290 Faktorenanalyse
Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung
2 a j1 =07
2 2 8 j2 = 01 siRest= 02
Kommunalitat H =08 (erllt1arte Varianz)
Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)
R AmiddotA+U (7a)
Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet
Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion
Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer
Vorgehensweise 291
100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY
In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy
weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen
Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen
1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen
2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit
2 2I ~ ~ R j ~ mx rjk
Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse
- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy
13 Vgl Loehlin J C 1998 S 154 14
Vgl Uberla K 1972 S 155 ff
292 Faktorenanalyse
nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird
- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit
Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy
15formationsverlust deklariert wird
Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen
Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy
15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt
Vorgehensweise 293
tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder
Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren
Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen
Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren
Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist
Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf
Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden
Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel
Kommunalltlten
Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325
Extraktionsmelhode Hauptachsen-Faktorenanalyse
bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix
294 Faktorenanalyse
Abbildung 530 Faktorladungen im 6-Produkte-Beispiel
Faktoranmatrixmiddot
Faktor
1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608
Extraktionsmethode Hauptachsen-Faktorenanalyse
a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt
Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert
Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel
Reproduzierte Korrelationen
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT
KALORIEN
VITAMIN
HALTBARK
PREIS
96845 71193 96034 11035 04241
71193 52552b
70480
12709
07717
96034 70480 95292b
08461 01722
11035
12709 08461 99056b
8325
04241 07717 01722 98325 98070b
Residuun1 UNGEFETi
KALORIEN
VITAMIN
HALTBARK
PREIS
-00017 00101
-00141 00144
-00017
-00083 01001
- 01005
00101 -00083
-00036 00640
-00141 01061
-00636
00010
00144 -01005 00640 00010
ExtrakHonsmethode Hauptllchsenfaktorenanalyse
a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005
b Reproduzierte Kommunalltaumlten
Vorgehensweise 295
Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen
Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R
524 Zahl der Faktoren
(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix
(2) Extraktion der Faktoren
(6) Bestimmung der Faktorwerte
Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff
Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-
q N
trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N
Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden
Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy
296 Faktorenanalyse
Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre
Abbildung 532 Bestimmung der Eigenwerte
Faktorenmatrix
Faktor
1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)
Eigenwerte 25068 19112
Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil
Kom munalltaumlten
Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807
- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren
V orgehensweise 297
Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung
Abbildung 534 Scree-Test im 6-Produkte-Beispiel
Eigen- Screeplot wert 30
25
20
15
Kaiser-Kriterium
10 1 Elbow5
00 2 3 4 5
Faktomummer
298 Faktorenanalyse
525 Faktorinterpretation
Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)
Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt
(1) Variablenauswalll und Errechnung der Korrelationsmalrix
(2) Extraktion der Faktoran
(3) Bestimmung der Kommunalltaumllen
(6) Bestimmung derFaktorwerte _______---11
middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull
geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht
Abbildung 535 Faktorladungen im 6-Produkte-Beispiel
Preis Haltbarkeit
Extraktionsmethode Hauptachsen-Faktorenanalyse
Vorgehensweise 299
Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist
Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig
Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16
Abbildung 536 Unrotierte Faktorladungen
F
F
Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung
Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f
300 Faktorenanalyse
536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy
tert
Abbildung 537 Rotierte Faktorladungen
F (Ausgangssituation)2
11 F2 (rotiert)
F1
-- shy
(Ausgangssituation)
11
F1 (rotiert)
SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen
1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen
(rechtwinkligen) Rotation
2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren
Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die
vorgenenswelse j U 1
Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind
Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel
Faktor
1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt
Haltbarkeit
72152 bull 07020
07962 I 99208 Preis 01060 99025
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung
Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen
A bull =A T mit TC~SI7 - sina ] sma cosa
Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links
A T A 094331 - 028039 098357 003229
[C0s341570 - sin34 157 ]070669 016156 072152 007020
sin34157deg cos34157092825 - 030210 097615 000694
038926 091599 007962 099208
032320 093608 001060 099025
Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)
Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix
Faktor 1 2
1 94868 31622
2 -31622 94868
Il
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung
Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig
von a=1843deg
526 Bestimmung der Faktorwerte
(1) Variablenauswanl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitaumlten
Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte
Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt
(3c)Z=PmiddotA
Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY
(12)Z AT1p AAT
Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt
(13)ZArl=pE
Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten
(3c) wird von rechts mit A multipliziert
ZmiddotA=PmiddotAmiddotA (15)
Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar
ZAmiddot(A At1=P(A A) (A Atl (16)
Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt
P=ZA(AAt l (17)
In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren
In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term
AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte
Abbildung 540 Koeffizientenmatrix der Faktorwerte
Faktor 1 2
Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression
Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die
xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf
SjDa p E=P ist ergibt sich
Seite 271 zu (14)
P=ZAT
304 Faktorenanalyse
Abbildung 541 Standardisierte Ausgangsdatenmatrix Z
45ampt6R4LJL4
Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542
Abbildung 542 Faktorwerte im 6-Produkte-Beispiel
Vorgehensweise 305
Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel
Du darfst
VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG
E 11 BecelS
U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T
Sanella IIII Holl Butter
-1
bull Rama
-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18
WIRTSCHAFTLICHKEIT
Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen
527 Zusammenfassende Darstellung der Faktorenanalyse
Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy
e Vorgehensweise 307 306 Faktorenanalyse
Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen
sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-
schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy
tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig
wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy
nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy
chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy
analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte
Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht
Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der
Verwendung des Verfahrens offenzulegen
I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _
CQ)l2CQgtQ ~ i
-Q)C t l5~11
0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C
CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O
~ ~ 11 t 3
uj~fi
t Imiddot~ J1 ~SHaa
It c~
c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~
-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi
o~ ~ -gEG)
I ~l c c ~l~ampi
2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E
U~a ]i E
J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy
~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--
----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt
Fallbeispiel 309308 Faktorenanalyse
Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert
531 Problemstellung
In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften
Variable und Objekte des BeispielsAbbildung 545
EigenschaftenMarken M k (k=I Il) xj(j=I IO)
A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado
5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H
I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama
Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist
Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)
Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern
Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse
---
310Faktorenanalyse
532 Ergebnisse
1 Variablenauswahl und Errechnung der Korrelationsmatrix
Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung
548 wiedergegeben
Abbildung 548 Die Korrelationskoeffizienten -_ -
-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy
In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der
Fallbeispiel 311
Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet
Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie
-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -
06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170
-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260
62444 -97126 66229 -83532 -62589
-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545
-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno
Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)
Abbildung 550 Dialogfeld Deskriptive Statistik
312 Faktorenanalyse
2 Bestimmung der Kommunalitilten
Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt
wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend
bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich
von den Startwerten abweichen
Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten
Hauptkomponentenanalyse Hauptachsenanalyse
Variable Korrunuriali- Kommunali- Korrununali- Kommunali-
Ut (Startwerte)
tlt (Endwerte)
tlIl (Startwerte )
tlIl (End werte)
STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR
100000 100000 100000 100000 100000 100000 100000 100000 100000 100000
88619
76855
89167 85324 76043 84012 80223 92668 63297 88786
97414
89018
79497
85847
96501
98810
97132
99166
78019
96445
85325
55717
85754
91075
55819
82330
73903
94796
40402
87851
Fallbeispiel 313
Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy
I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren
Abbildung 552 Dialogfeld Extraktion
Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist
3 Wabl der Extraktionsmetbode
Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen
4 Zabl der Faktoren
Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen
Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet
Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch
17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f
1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden
Erklaumlrte Gesamtvarianz
Anfaumlngliche Eigenwerte
314 Faktorenanalyse
Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy
den sich fUnfFaktoren ergeben
Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien
95) der Varianz erklaumlrt sind
2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)
3 Extrahiere n (zB 3) Faktoren
4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy
renzahl
5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein
6 Extrahiere alle Faktoren die nach der
Vom Computer automatisch verwandt wenn keine andere Spezifikation
Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden
Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden
Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist
Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt
Fallbeispiel 315
Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil
Faktor 1
2 3
4
5
6
7
8
9
10
Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden
Abbildung 555 Scree-Test und Kaiser-Kriterium
Eigen- -=gtcreeplot wert
5
4
3
2
10
o Kaisershy
~ 3 i i 7 i Q
Faktornummer
Gesamt 505188
177106
142700
81935
42961
24709
15928
06190
02943
00340
der Varianz 5051883
1771061
1427002
819349 429611
247085
159275
61902
29434
03398
Kumulierte 5051883
6822944
8249946
9069295
9498905
9745991
9905266
9967168
9996602
10000000
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
LIO r aKlOrenanalyse
oder mehr betraumlgt7 Das trifft in unserem Fall filr keines der Nicht-diagonalshyElemente der Ale-Matrix zu womit nach diesem Kriterium die Korrelationsmatrix filr faktoranalytische Auswertungen geeignet ist
Kaiser-Meyer-Olkin-Kriterium
Waumlhrend die Uumlberlegungen von Dziuban und Shirkey auf Plausibilitaumlt beruhen haben Kaiser Meyer und Olkin versucht eine geeignete Pruumlfgroumlszlige zu entwickeln und diese zur Entscheidungsfindung heranzuziehen Sie berechnen ihre PTUumlfgroumlszlige die als measure 0sampling adequacy (MSA) bezeichnet wird auf Basis der Anshyti-Image-KorrelationsmatrixbullDas MSA-Kriterium zeigt an in welchem Umfang die Ausgangsvariablen zusammengehoumlren und dient somit als Indikator dafilr ob eine Faktorenanalyse sinnvoll erscheint oder nichtDas MSA-Kriterium erlaubt sowohl eine Beurteilung der Korrelationsmatrix insgesamt als auch einzelner Varishyablen sein Wertebereich liegt zwischen degund 1 Kaiser und Rice schlagen folgenshy
8de Beurteilungen vor
MSA 2 09 marvelous (erstaunlich) MSA 2 08 meritorious (verdienstvoll) MSA 2 07 middling (ziemlich gut) MSA 2 06 mediocre (mittelmaumlszligig) MSA 2 05 miserable (klaumlglich) MSA lt05 unacceptable (untragbar)
Sie vertreten die Meinung daszlig sich eine Korrelationsmatrix mit MSA lt 05 nicht rur eine Faktorenanalyse eignet9 Als wuumlnschenswert sehen sie einen Wert von MSA 2 08 an lO In der Literatur wird das MSA-Kriterium das auch als KaisershyMeyer-Olkin-Kriterium (KMK) bezeichnet wird als das beste zur Verrugung steshyhende Verfahren zur Pruumlfung der Korrelationsmatrix angesehen weshalb seine Anwendunrvor der Durchfuhrung einer Faktorenanalyse auf jeden Fall zu empshyfehlen ist 1
Bezogen auf unser 6-Produkte-Beispiel ergab sich rur die Korrelationsmatrix insgesamt ein MSA-Wert von 0576 womit sich rur unser Beispiel ein riur klaumlglishyches Ergebnis ergibt Daruumlber hinaus gibt SPSS in der Diagonalen der AntishyImage-Korrelationsmatrix aber auch das MSA-Kriterium rur die einzelnen Variabshylen an
7 Vgl Dziuban C DlShirkey E C 1974 S 359
8 Vgl Kaiser H FRice J 1974 S 111 ff
9 Vgl Cureton E EDAgostino R B 1983 S 389 f
10 Vgl Kaiser H F 1970 S 405
II Vgl Stewart D W 1981 S 57 f Dziuban C DlShirkey E C 1974 S 360 f
Vorgehensweise 277
Abbildung 514 Anti-Image-Korrelations-Matrix im 6-Produkte-Beispiel
Antllmlge-Matrlun
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS AntI-lmageMrrelilllOn UNGEFETT 59680middot 10794 -92633 -23717 22350
KALORIEN -10794 87789 -15001 -23906 22661 VITAMIN -92633 -15001 59755 20730 -19274 HALTSARK -23717 -23906 20730 47060 -98640 PREIS 22350 22561 -19274 -95640 45701
8 Maszlig der StlchplObenelgnung
Abbildung 514 macht deutlich daszlig lediglich die Variable Kaloriengehalt mit einem MSA-Wert von 087789 als verdienstvoll anzusehen ist waumlhrend alle uumlbshyrigen Variablen eher klaumlgliche oder untragbare Ergebnisse aufweisen Die vashyriablenspezifischen MSA-Werte liefern damit rur den Anwender einen Anshyhaltspunkt dafuumlr welche Variablen aus der Analyse auszuschlieszligen waumlren wobei sich ein sukzessiver Ausschluszlig von Variablen mit jeweiliger Pruumlfung der vorgeshystellten Kriterien empfiehlt
522 Extraktion der Faktoren
(4) Zahl der Faktoren
(5) Faktorinterp~etat~ (6) Bestimmung der
Faktorwerte
Die bisherigen Ausruhrungen haben verdeutlicht daszlig bei Faktorenanalysen groszlige Sorgfalt auf die Wahl der Untersuchungsmerkmale und -einheiten zu verwenden ist da durch die Guumlte der Korrelationsmatrix die den Startpunkt der Faktorenanalyse darstellt alle Ershygebnisse der Faktorenanalyse beeinfluszligt werden Im folgenden ist nun zu fragen wie denn nun die Faktoren rein rechnerisch aus den Variablen ermittelt werden koumlnnen Wir werden im folgenden zunaumlchst das Funshydamentaltheorem der Faktorenanalyse darstellen und anschlieszligend die Extraktion auf graphischem Wege plausibel machen Auf die Unterschiede zwischen konkreten (rechnerischen) Faktorextraktionsverfahren gehen wir dann im Zusammenhang mit der Bestimshymung der Kommunalitaumlten (Abs~hnitt 523) ein
278 Faktorenanalyse
5221 Das FundamentaItheorem
Waumlhrend die bisherigen Uumlberlegungen die Ausgangsdaten und ihre Eignung fuumlr faktoranalytische Zwecke betrafen stellt sich nun die Frage wie sich die Faktoren rechnerisch aus den Variablen ennitteln lassen Zu diesem Zweck geht die Faktoshyrenanalyse von folgender grundlegenden Annahme aus
Jeder Beobachtungswert einer Ausgangsvariablen Xj oder der stanshydardisierten Variablen Zj laumlszligt sich als eine Linearkombination mehshyrerer (hypothetischer) Faktoren beschreiben
Mathematisch laumlszligt sich dieser Zusammenhang wie folgt fonnulieren
(3a)Xkj =ajl Pkl +ap PIa + +ajQ PkQ
bzw fuumlr standardisierte x-Werte
(3b)Zkj=ajIPkl+a j2middotPIa+middot+a jQmiddotPkQ=iajqPkq
q~l
Die obige Fonnel (3b) besagt fuumlr das 2-Faktorenbeispiel nichts anderes als daszlig zB die standardisierten Beobachtungswerte fuumlr Anteil ungesaumlttigter Fettsaumluren und Vitamingehalt beschrieben werden durch die Faktoren P 1 und P2 so wie sie im Hinblick auf Marke k gesehen wurden ltPIel bzw Pk2) jeweils multipliziert mit ihren Gewichten bzw Faktorenladungen beim Merkmal j also fuumlr Faktor 1 ajl und
fuumlr Faktor 2 a2 Oie Faktorradung gibt dabei an wieviel ein Faktor mit einer Ausgangsvariablen
zu tun hat Im mathematisch-statistischen Sinne sind Faktorladungen nichts andeshyres als eine Maszliggroumlszlige fuumlr den Zusammenhang zwischen Variablen und Faktor und das ist wiederum nichts anderes als ein Korrelationskoeffizient zwischen Fakshytor und Variablen
Um die Notation zu verkuumlrzen schreibt man haumlufig den Ausdruck (3b) auch in Matrixschreibweise Identisch mit Fonnel (3b) ist daher auch folgende Mashytrixschreibweise die die Grundgleichung der Faktorenanalyse darstellt
(3c)Z=pmiddotA
Aufbauend auf diesem Grundzusammenhang laumlszligt sich dann auch eine Rechenshyvorschrift ableiten die aufzeigt wie aus den erhobenen Daten die vennuteten Fakshytoren mathematisch ennittelt werden koumlnnen
Wir hatten gezeigt daszlig die Korrelationsmatrix R sich bei standardisierten Daten wie folgt aus der Datenmatrix Z ennitteln laumlszligt
R=_I_ZZ (2) K-l
Vorgehensweise 279
Da Z aber im Rahmen der Faktorenanalyse durch P A beschrieben wird (Z =PA) ist in (2) Z durch Fonnel (3c) zu ersetzen so daszlig sich folgende Fonnet
ergibt
R=_I_PA)PA) (4)K I
Nach Aufloumlsung der Klammem ergibt sich nach den Regeln der Matrixmultiplishykation
r------- R=_I_APPA=A-I_pPA (5)
K-I ~
~
Da alle Daten standardisiert sind laumlszligt sich der _1_ ptP Ausdruck in Formel (5)K-l ----y---J
auch als K(Jrrelationsmatrix der Faktoren (C) bezeichnen (vgl Fonnel (2raquo so daszlig sich schreiben laumlszligt
R = AmiddotCmiddotA (6)
Da die Faktoren als unkorreliert angenommen werden entspricht C einer Einheitsshymatrix (einer Matrix die auf der Hauptdiagonalen nur Einsen und sonst Nullen enthaumllt) Da die Multiplikation einer Matrix mit einer Einheitsmatrix aber wieder die Ausgangsmatrix ergibt vereinfacht sich die Fonnel (6) zu
R = AmiddotA (7)
Die Beziehungen (6) und (7) werden von Thurstone als das Fundamentaltheorem der Faktorenanalyse bezeichnet da sie den Zusammenhang zwischen Korrelatishyonsmatrix und Faktorladungsmatrix beschreiben
Das Fundarnentaltheorem der Faktorenanalyse besagt nicht anderes als daszlig sich die Korrelationsmatrix durch die Faktorladungen (Matrix A) und die Korrelationen zwischen den Faktoren (Matrix C) reproduzieren laumlszligt Fuumlr den Fall daszlig man von unabhaumlngigen (orthogonalen) Faktoren ausgeht reduziert sich das Funshydamentaltheorem auf Fonnel (7) Dabei muszlig sich der Anwender allerdings bewuszligt sein daszlig das Fundamentaltheorem der Faktorenanalyse nach Fonnel (7) stets nur unter der Praumlmisse einer Linearverknuumlpfung und Unabhaumlngigkeit der Faktoren Guumlltigkeit besitzt
5222 Graphische Interpretation von Faktoren
Der Infonnationsgehalt einer Korrelationsmatrix laumlszligt sich auch graphisch in einem Vektor-Diagramm darstellen in dem die jeweiligen Korrelationskoeffizienten als Winkel zwischen zwei Vektoren dargestellt werden Zwei Vektoren werden dann
280 Faktorenanalyse
als linear unabhaumlngig bezeichnet wenn sie senkrecht (orthogonal) aufeinander steshyhen Sind die beiden betrachteten Vektoren (Variablen) jedoch korreliert ist der Korrelationskoeffizient also C 0 zB 05 dann wird dies graphisch durch einen Winkel von 60deg zwischen den beiden Vektoren dargestellt
Es stellt sich die Frage Warum entspricht ein Korrelationskoeffizient von 05 genau einem Winkel von 60deg Die Verbindung wird uumlber den Cosinus des jeshy
weiligen Winkels hergestellt Verdeutlichen wir uns dies anhand des Ausgangsbeispiels (Abbildung 515)
In Abbildung 515 repraumlsentieren die Vektoren AC und AB zB die beiden Vashyriablen Kaloriengehalt und Vitamingehalt Zwischen den beid~_yariablen moumlge eine Korrelation von 05 gemessen worden sein Der Vektor AC der den Kaloriengehalt repraumlsentiert und der genau wie AB aufgrund der Standardisierung eine Laumlnge von 1 hat weist zu AB einen Winkel von 60deg auf Der Cosinus des Winkels 60deg der die Stellung der beiden Variablen zueinander (ihre Richtung) anmiddot gibt ist definiert als Quotient aus Ankathete und Hypothenuse also als AD AC Da AC aber gleich 1 ist ist der Korrelationskoeffizient identisch mit der Strecke
AD Wie Abbildung 516 ausschnitthaft zeigt ist zB der Cosinus eines 60deg-Winkels
gleich 05 Entsprechend laumlszligt sich jeder beliebige Korrelationskoeffizient zwischen zwei Variablen auch durch zwei Vektoren mit einem genau definierten Winkel zushyeinander darstellen Verdeutlichen wir uns dies noch einmal anband einer Korrelamiddot tionsmatrix mit drei Variablen (Abbildung 517)
Abbildung 515 Vektordarstellung einer Korrelation zwischen zwei Variablen
c
A 0 B
)V
Standardisierte LOnge von 1
Vorgehensweise 281
Abbildung 516 Werte rur den Cosinus (entnommen aus Geliert W JKuumlstnerHlHellwich MfKaumlstner H Kleine Enzyshyklopaumldie Mathematik Leipzig 1969 S 799)
Grad CO Grad cO
45 07071 90 00000 44 7193 89 0175 43 7314 88 0349 42 7431 87 0523 41 7547 86 0698 40 07660 85 0872 39 7771 84 1045 38 7880 83 1219 37 7986 82 1392 36 8090 81 1564 35 8192 80 01736 34 8290 79 1908 33 8387 78 2079 32 8480 77 2250 31 8572 76 2419 30 08660 75 2588 29 8746 74 2756 28 8829 73 2924 27 8910 72 3090 26 8988 71 3256 25 9063 70 03420 24 9135 69 3584 23 9205 68 3746 22 9272 67 3907 21 9336 middot66 4067 ZO 09397 65 4226 19 9455 64 4384 18 9511 63 4540 17 9563 62 4695 16 9613 61 4848 15 9659 60 05000 14 9703 59 5150 13 9744 58 5299 12 9781 57 5446 11 9816 56 5592 10 09848 55 5736 9 9877 54 5878 8 9903 53 6018 7 9925 52 6157 6 9945 51 6293 5 9962 50 06428 4 9976 49 6561 3 9986 48 6691 2 9994 47 6820 1 9998 46 6947 0 10000 45 7071
282 Faktorenanalyse
Abbildung 517 Korrelationsmatrix
R =r68660 1 06428lO1736 ~
R laumlszligt sich auch anders schreiben (vgl Abbildung 518)
Abbildung 518 Korrelationsmatrix mit Winkelausdrucken
l0deg R = 30deg 0deg
80deg 50deg 0deg
Der Leser moumlge die entsprechenden Werte selbst in einer Cosinus-Tabelle uumlbershy
pruumlfenDie der oben gezeigten Korrelationsmatrix zugrundeliegenden drei Variablen
und ihre Beziehungen zueinander lassen sich relativ leicht in einem zweidimen sionalen Raum darstellen (Abbildung 519)
Abbildung 519 Graphische Darstellung des 3-Variablen-Beispiels
Vektor X2
Vektorx3Vektor Xl
Vorgehensweise 283
Je mehr Variable jedoch zu beruumlcksichtigen sind desto mehr Dimensionen werden benoumltigt um die Vektoren in ihren entsprechenden Winkeln zueinander zu positioshy
nieren Die Faktorenanalyse trachtet nun danach das sich uumlber die Korrelationsshykoeffizienten gemessene Verhaumlltnis der Variablen zueinander in einem moumlglichst gering dimensionierten Raum zu reproduzieren Die Zahl der benoumltigten Achsen gibt dann die entsprechende Zahl der Faktoren an
Wenn man die Achsen als Faktoren ansieht dann stellt sich unmittelbar die Frashyge Wie werden diese Achsen (Faktoren) in ihrer Lage zu den jeweiligen Vektoren (Variablen) bestimmt
Dazu vergegenwaumlrtigt man sich am besten das Bild eines halboffenen Schirmes Die Zacken des Schirmgestaumlnges die alle in eine bestimmte Richtung weisend die Variablen repraumlsentieren lassen sich naumlherungsweise auch durch den Schirmstock darstellen Vereinfacht man diese Uumlberlegung aus DarstellungsgrQnden noch weishyter auf den 2-Variablen-Fall wie in AbbiIdu8520 die einen Korrelationskoshyeffizienten von 05 fuumlr die durch die Vektoren OA und OB dargestellten Variablen repraumlsentiert dann gibt der Vektor OC eine zusammenfassende (faktorielle) Beshyschreibung wieder Die beiden Winkel von 30deg zwischen Vektor I bzw Vektor II und Faktor-Vektor geben wiederum an inwieweit der gefundene Faktor mit Vekshytor (Variable) I bzw II zusammenhaumlngt Sie repraumlsentieren ebenfalls Korrelationsshykoeffizienten und zwar die zwischen den jeweiligen Variablen und dem Faktor Diese Korrelationskoeffizienten hatten wir oben als Faktorladungen bezeichnet Die Faktorladungen des 1 Faktors betragen also in bezug auf Variable I und Varishyable II cos 30deg = 08660
Abbildung 520 FaktorlOsung bei 2 Variablen
j
A
Vektor x
~---------__------~---- C
Resultante
e Vektor X
284 Faktorenanalyse
5223 Das Problem der Faktorextraktion
Nachdem wir nun wissen was eine Faktorladung inhaltlich bedeutet ist zu fragen Wie findet man einen solchen Vektor (Faktor) der stellvertretend ftir mehrere zushysammenhaumlngende Variable fungieren kann Erinnern wir uns noch einmal des Ausgangsbeispiels Aufstrichfette waren nach den ftinfMerkmalen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt - Haltbarkeit - Preis bewertet worden l2
Aus dieser Bewertung sei die Korrelationsmatrix in Abbildung 521 berechnet worden
Abbildung 521 Spiegelbildlich identische KOlTelationsmatrix
x X x x x
x 70 100 09848 90middotX 03420 30x 00000 10middotx
X -01736
Diese Korrelationsmatrix enthaumllt in der unteren Dreiecks-Matrix die Korrelationsshywerte in der oberen (spiegelbildlich identischen) Dreiecks-Matrix die entshysprechenden Winkel Graphisch ist der Inhalt dieser Matrix in Abbildung 522 darshygestellt
Das Beispiel wurde so gewaumlhlt daszlig die Winkel zwischen den Faktoren in einer zweidimensionalen Darstellung abgebildet werden koumlnnen - ein Fall der in der Realitaumlt allerdings kaum relevant ist
Wie findet man nun den 1 Faktor in dieser Vektordarstellung Bleiben wir zunaumlchst bei der graphischen Darstellung dann sucht man den
Schwerpunkt aus den ftinf Vektoren Der Leser moumlge sich dazu folgendes verdeutlichen
In Abbildung 522 ist der Faktor nichts anderes als die Resultante der funfVektoshyren Wuumlrden die ftinfVektoren funf Seile darstellen mit einem Gewicht in 0 und jeweils ein Mann wuumlrde mit gleicher Staumlrke an den Enden der Seile ziehen dann wuumlrde sich das Gewicht in eine bestimmte Richtung bewegen (vgl die gestrichelte
12 Es werden hier andere Werte als im Ausgangsbeispiel verwendet um zunaumlchst eine einshydeutige graphische Loumlsung zu ermoumlglichen
Vorgehensweise 285
Linie in Abbildung 523) Diesen Vektor bezeichnen wir als Resultante Er ist die graphische Repraumlsentation des 1 Faktors
Abbildung 522 Graphische Darstellung des 5-Variablen-Beispiels
~
XsXl
bull
Abbildung 523 Graphische Darstellung des Schwerpunktes
X2
XIX
Faktorshyvektor2
Betrachtet man nun die jetzt gebildeten Winkel zwischen dem 1 Faktor und den Ausgangsvektoren dann hat man auch die gesuchten Faktorladungen gefunden
(Erste Reshysultante)
4512
-------o
- -
286 Faktorenanalyse
Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen
Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben
Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge
die Werte selbst uumlberpruumlfen)
Abbildung 524 Einfaktorielle Ladungsmatrix
Faktor
05707Xl 07046x2 bull 09668x3
08211x4
07096
Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)
Abbildung 525 ZweifaktorieHe Ladungsmatrix
Faktor 1 Faktor 2
Xl 05707 -08211
x2 07046 -07096
x3 09668 02554
x4 08211 05707
Xs 07096 07046
Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa
Vorgehensweise 287
In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum
I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1
~~ 00
2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation
Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist
Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt
Sf = 1 = Ijj (9)J
3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt
Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)
Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung
Resutlanie 2 (Faktor 2)
A Vektor x o
120lt= fH bull C Resultante 1 (Faktor 1)
B Vektor x
288 Faktorenanalyse
Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB
Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel
Wenn obige Behauptung stimmt muumlszligte gelten
(lOa)[~J +[~~J =1
Uumlberpruumlfung 2 2 uumlc2
OC 00 +002 (lOb)--+-shy 2
OA OA OA2 2
In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)
Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)
(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)
2 2 OC +00
4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten
sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)
wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-
q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1
(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix
(2) Extraktion der
(5) Faktorinterpretatiln
(6) Bestimmung der Faktorwerte
Vorgehensweise 289
523 Bestimmung der Kommunalitaumlten
In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem
Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy
fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig
mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da
J
i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins
Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung
erklaumlrte Variant
standardisierte Gesamtvariant = 1
290 Faktorenanalyse
Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung
2 a j1 =07
2 2 8 j2 = 01 siRest= 02
Kommunalitat H =08 (erllt1arte Varianz)
Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)
R AmiddotA+U (7a)
Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet
Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion
Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer
Vorgehensweise 291
100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY
In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy
weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen
Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen
1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen
2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit
2 2I ~ ~ R j ~ mx rjk
Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse
- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy
13 Vgl Loehlin J C 1998 S 154 14
Vgl Uberla K 1972 S 155 ff
292 Faktorenanalyse
nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird
- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit
Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy
15formationsverlust deklariert wird
Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen
Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy
15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt
Vorgehensweise 293
tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder
Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren
Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen
Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren
Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist
Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf
Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden
Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel
Kommunalltlten
Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325
Extraktionsmelhode Hauptachsen-Faktorenanalyse
bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix
294 Faktorenanalyse
Abbildung 530 Faktorladungen im 6-Produkte-Beispiel
Faktoranmatrixmiddot
Faktor
1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608
Extraktionsmethode Hauptachsen-Faktorenanalyse
a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt
Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert
Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel
Reproduzierte Korrelationen
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT
KALORIEN
VITAMIN
HALTBARK
PREIS
96845 71193 96034 11035 04241
71193 52552b
70480
12709
07717
96034 70480 95292b
08461 01722
11035
12709 08461 99056b
8325
04241 07717 01722 98325 98070b
Residuun1 UNGEFETi
KALORIEN
VITAMIN
HALTBARK
PREIS
-00017 00101
-00141 00144
-00017
-00083 01001
- 01005
00101 -00083
-00036 00640
-00141 01061
-00636
00010
00144 -01005 00640 00010
ExtrakHonsmethode Hauptllchsenfaktorenanalyse
a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005
b Reproduzierte Kommunalltaumlten
Vorgehensweise 295
Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen
Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R
524 Zahl der Faktoren
(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix
(2) Extraktion der Faktoren
(6) Bestimmung der Faktorwerte
Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff
Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-
q N
trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N
Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden
Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy
296 Faktorenanalyse
Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre
Abbildung 532 Bestimmung der Eigenwerte
Faktorenmatrix
Faktor
1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)
Eigenwerte 25068 19112
Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil
Kom munalltaumlten
Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807
- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren
V orgehensweise 297
Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung
Abbildung 534 Scree-Test im 6-Produkte-Beispiel
Eigen- Screeplot wert 30
25
20
15
Kaiser-Kriterium
10 1 Elbow5
00 2 3 4 5
Faktomummer
298 Faktorenanalyse
525 Faktorinterpretation
Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)
Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt
(1) Variablenauswalll und Errechnung der Korrelationsmalrix
(2) Extraktion der Faktoran
(3) Bestimmung der Kommunalltaumllen
(6) Bestimmung derFaktorwerte _______---11
middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull
geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht
Abbildung 535 Faktorladungen im 6-Produkte-Beispiel
Preis Haltbarkeit
Extraktionsmethode Hauptachsen-Faktorenanalyse
Vorgehensweise 299
Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist
Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig
Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16
Abbildung 536 Unrotierte Faktorladungen
F
F
Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung
Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f
300 Faktorenanalyse
536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy
tert
Abbildung 537 Rotierte Faktorladungen
F (Ausgangssituation)2
11 F2 (rotiert)
F1
-- shy
(Ausgangssituation)
11
F1 (rotiert)
SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen
1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen
(rechtwinkligen) Rotation
2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren
Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die
vorgenenswelse j U 1
Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind
Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel
Faktor
1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt
Haltbarkeit
72152 bull 07020
07962 I 99208 Preis 01060 99025
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung
Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen
A bull =A T mit TC~SI7 - sina ] sma cosa
Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links
A T A 094331 - 028039 098357 003229
[C0s341570 - sin34 157 ]070669 016156 072152 007020
sin34157deg cos34157092825 - 030210 097615 000694
038926 091599 007962 099208
032320 093608 001060 099025
Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)
Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix
Faktor 1 2
1 94868 31622
2 -31622 94868
Il
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung
Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig
von a=1843deg
526 Bestimmung der Faktorwerte
(1) Variablenauswanl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitaumlten
Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte
Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt
(3c)Z=PmiddotA
Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY
(12)Z AT1p AAT
Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt
(13)ZArl=pE
Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten
(3c) wird von rechts mit A multipliziert
ZmiddotA=PmiddotAmiddotA (15)
Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar
ZAmiddot(A At1=P(A A) (A Atl (16)
Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt
P=ZA(AAt l (17)
In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren
In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term
AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte
Abbildung 540 Koeffizientenmatrix der Faktorwerte
Faktor 1 2
Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression
Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die
xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf
SjDa p E=P ist ergibt sich
Seite 271 zu (14)
P=ZAT
304 Faktorenanalyse
Abbildung 541 Standardisierte Ausgangsdatenmatrix Z
45ampt6R4LJL4
Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542
Abbildung 542 Faktorwerte im 6-Produkte-Beispiel
Vorgehensweise 305
Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel
Du darfst
VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG
E 11 BecelS
U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T
Sanella IIII Holl Butter
-1
bull Rama
-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18
WIRTSCHAFTLICHKEIT
Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen
527 Zusammenfassende Darstellung der Faktorenanalyse
Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy
e Vorgehensweise 307 306 Faktorenanalyse
Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen
sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-
schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy
tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig
wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy
nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy
chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy
analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte
Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht
Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der
Verwendung des Verfahrens offenzulegen
I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _
CQ)l2CQgtQ ~ i
-Q)C t l5~11
0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C
CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O
~ ~ 11 t 3
uj~fi
t Imiddot~ J1 ~SHaa
It c~
c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~
-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi
o~ ~ -gEG)
I ~l c c ~l~ampi
2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E
U~a ]i E
J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy
~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--
----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt
Fallbeispiel 309308 Faktorenanalyse
Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert
531 Problemstellung
In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften
Variable und Objekte des BeispielsAbbildung 545
EigenschaftenMarken M k (k=I Il) xj(j=I IO)
A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado
5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H
I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama
Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist
Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)
Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern
Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse
---
310Faktorenanalyse
532 Ergebnisse
1 Variablenauswahl und Errechnung der Korrelationsmatrix
Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung
548 wiedergegeben
Abbildung 548 Die Korrelationskoeffizienten -_ -
-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy
In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der
Fallbeispiel 311
Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet
Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie
-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -
06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170
-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260
62444 -97126 66229 -83532 -62589
-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545
-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno
Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)
Abbildung 550 Dialogfeld Deskriptive Statistik
312 Faktorenanalyse
2 Bestimmung der Kommunalitilten
Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt
wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend
bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich
von den Startwerten abweichen
Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten
Hauptkomponentenanalyse Hauptachsenanalyse
Variable Korrunuriali- Kommunali- Korrununali- Kommunali-
Ut (Startwerte)
tlt (Endwerte)
tlIl (Startwerte )
tlIl (End werte)
STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR
100000 100000 100000 100000 100000 100000 100000 100000 100000 100000
88619
76855
89167 85324 76043 84012 80223 92668 63297 88786
97414
89018
79497
85847
96501
98810
97132
99166
78019
96445
85325
55717
85754
91075
55819
82330
73903
94796
40402
87851
Fallbeispiel 313
Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy
I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren
Abbildung 552 Dialogfeld Extraktion
Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist
3 Wabl der Extraktionsmetbode
Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen
4 Zabl der Faktoren
Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen
Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet
Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch
17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f
1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden
Erklaumlrte Gesamtvarianz
Anfaumlngliche Eigenwerte
314 Faktorenanalyse
Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy
den sich fUnfFaktoren ergeben
Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien
95) der Varianz erklaumlrt sind
2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)
3 Extrahiere n (zB 3) Faktoren
4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy
renzahl
5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein
6 Extrahiere alle Faktoren die nach der
Vom Computer automatisch verwandt wenn keine andere Spezifikation
Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden
Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden
Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist
Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt
Fallbeispiel 315
Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil
Faktor 1
2 3
4
5
6
7
8
9
10
Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden
Abbildung 555 Scree-Test und Kaiser-Kriterium
Eigen- -=gtcreeplot wert
5
4
3
2
10
o Kaisershy
~ 3 i i 7 i Q
Faktornummer
Gesamt 505188
177106
142700
81935
42961
24709
15928
06190
02943
00340
der Varianz 5051883
1771061
1427002
819349 429611
247085
159275
61902
29434
03398
Kumulierte 5051883
6822944
8249946
9069295
9498905
9745991
9905266
9967168
9996602
10000000
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
278 Faktorenanalyse
5221 Das FundamentaItheorem
Waumlhrend die bisherigen Uumlberlegungen die Ausgangsdaten und ihre Eignung fuumlr faktoranalytische Zwecke betrafen stellt sich nun die Frage wie sich die Faktoren rechnerisch aus den Variablen ennitteln lassen Zu diesem Zweck geht die Faktoshyrenanalyse von folgender grundlegenden Annahme aus
Jeder Beobachtungswert einer Ausgangsvariablen Xj oder der stanshydardisierten Variablen Zj laumlszligt sich als eine Linearkombination mehshyrerer (hypothetischer) Faktoren beschreiben
Mathematisch laumlszligt sich dieser Zusammenhang wie folgt fonnulieren
(3a)Xkj =ajl Pkl +ap PIa + +ajQ PkQ
bzw fuumlr standardisierte x-Werte
(3b)Zkj=ajIPkl+a j2middotPIa+middot+a jQmiddotPkQ=iajqPkq
q~l
Die obige Fonnel (3b) besagt fuumlr das 2-Faktorenbeispiel nichts anderes als daszlig zB die standardisierten Beobachtungswerte fuumlr Anteil ungesaumlttigter Fettsaumluren und Vitamingehalt beschrieben werden durch die Faktoren P 1 und P2 so wie sie im Hinblick auf Marke k gesehen wurden ltPIel bzw Pk2) jeweils multipliziert mit ihren Gewichten bzw Faktorenladungen beim Merkmal j also fuumlr Faktor 1 ajl und
fuumlr Faktor 2 a2 Oie Faktorradung gibt dabei an wieviel ein Faktor mit einer Ausgangsvariablen
zu tun hat Im mathematisch-statistischen Sinne sind Faktorladungen nichts andeshyres als eine Maszliggroumlszlige fuumlr den Zusammenhang zwischen Variablen und Faktor und das ist wiederum nichts anderes als ein Korrelationskoeffizient zwischen Fakshytor und Variablen
Um die Notation zu verkuumlrzen schreibt man haumlufig den Ausdruck (3b) auch in Matrixschreibweise Identisch mit Fonnel (3b) ist daher auch folgende Mashytrixschreibweise die die Grundgleichung der Faktorenanalyse darstellt
(3c)Z=pmiddotA
Aufbauend auf diesem Grundzusammenhang laumlszligt sich dann auch eine Rechenshyvorschrift ableiten die aufzeigt wie aus den erhobenen Daten die vennuteten Fakshytoren mathematisch ennittelt werden koumlnnen
Wir hatten gezeigt daszlig die Korrelationsmatrix R sich bei standardisierten Daten wie folgt aus der Datenmatrix Z ennitteln laumlszligt
R=_I_ZZ (2) K-l
Vorgehensweise 279
Da Z aber im Rahmen der Faktorenanalyse durch P A beschrieben wird (Z =PA) ist in (2) Z durch Fonnel (3c) zu ersetzen so daszlig sich folgende Fonnet
ergibt
R=_I_PA)PA) (4)K I
Nach Aufloumlsung der Klammem ergibt sich nach den Regeln der Matrixmultiplishykation
r------- R=_I_APPA=A-I_pPA (5)
K-I ~
~
Da alle Daten standardisiert sind laumlszligt sich der _1_ ptP Ausdruck in Formel (5)K-l ----y---J
auch als K(Jrrelationsmatrix der Faktoren (C) bezeichnen (vgl Fonnel (2raquo so daszlig sich schreiben laumlszligt
R = AmiddotCmiddotA (6)
Da die Faktoren als unkorreliert angenommen werden entspricht C einer Einheitsshymatrix (einer Matrix die auf der Hauptdiagonalen nur Einsen und sonst Nullen enthaumllt) Da die Multiplikation einer Matrix mit einer Einheitsmatrix aber wieder die Ausgangsmatrix ergibt vereinfacht sich die Fonnel (6) zu
R = AmiddotA (7)
Die Beziehungen (6) und (7) werden von Thurstone als das Fundamentaltheorem der Faktorenanalyse bezeichnet da sie den Zusammenhang zwischen Korrelatishyonsmatrix und Faktorladungsmatrix beschreiben
Das Fundarnentaltheorem der Faktorenanalyse besagt nicht anderes als daszlig sich die Korrelationsmatrix durch die Faktorladungen (Matrix A) und die Korrelationen zwischen den Faktoren (Matrix C) reproduzieren laumlszligt Fuumlr den Fall daszlig man von unabhaumlngigen (orthogonalen) Faktoren ausgeht reduziert sich das Funshydamentaltheorem auf Fonnel (7) Dabei muszlig sich der Anwender allerdings bewuszligt sein daszlig das Fundamentaltheorem der Faktorenanalyse nach Fonnel (7) stets nur unter der Praumlmisse einer Linearverknuumlpfung und Unabhaumlngigkeit der Faktoren Guumlltigkeit besitzt
5222 Graphische Interpretation von Faktoren
Der Infonnationsgehalt einer Korrelationsmatrix laumlszligt sich auch graphisch in einem Vektor-Diagramm darstellen in dem die jeweiligen Korrelationskoeffizienten als Winkel zwischen zwei Vektoren dargestellt werden Zwei Vektoren werden dann
280 Faktorenanalyse
als linear unabhaumlngig bezeichnet wenn sie senkrecht (orthogonal) aufeinander steshyhen Sind die beiden betrachteten Vektoren (Variablen) jedoch korreliert ist der Korrelationskoeffizient also C 0 zB 05 dann wird dies graphisch durch einen Winkel von 60deg zwischen den beiden Vektoren dargestellt
Es stellt sich die Frage Warum entspricht ein Korrelationskoeffizient von 05 genau einem Winkel von 60deg Die Verbindung wird uumlber den Cosinus des jeshy
weiligen Winkels hergestellt Verdeutlichen wir uns dies anhand des Ausgangsbeispiels (Abbildung 515)
In Abbildung 515 repraumlsentieren die Vektoren AC und AB zB die beiden Vashyriablen Kaloriengehalt und Vitamingehalt Zwischen den beid~_yariablen moumlge eine Korrelation von 05 gemessen worden sein Der Vektor AC der den Kaloriengehalt repraumlsentiert und der genau wie AB aufgrund der Standardisierung eine Laumlnge von 1 hat weist zu AB einen Winkel von 60deg auf Der Cosinus des Winkels 60deg der die Stellung der beiden Variablen zueinander (ihre Richtung) anmiddot gibt ist definiert als Quotient aus Ankathete und Hypothenuse also als AD AC Da AC aber gleich 1 ist ist der Korrelationskoeffizient identisch mit der Strecke
AD Wie Abbildung 516 ausschnitthaft zeigt ist zB der Cosinus eines 60deg-Winkels
gleich 05 Entsprechend laumlszligt sich jeder beliebige Korrelationskoeffizient zwischen zwei Variablen auch durch zwei Vektoren mit einem genau definierten Winkel zushyeinander darstellen Verdeutlichen wir uns dies noch einmal anband einer Korrelamiddot tionsmatrix mit drei Variablen (Abbildung 517)
Abbildung 515 Vektordarstellung einer Korrelation zwischen zwei Variablen
c
A 0 B
)V
Standardisierte LOnge von 1
Vorgehensweise 281
Abbildung 516 Werte rur den Cosinus (entnommen aus Geliert W JKuumlstnerHlHellwich MfKaumlstner H Kleine Enzyshyklopaumldie Mathematik Leipzig 1969 S 799)
Grad CO Grad cO
45 07071 90 00000 44 7193 89 0175 43 7314 88 0349 42 7431 87 0523 41 7547 86 0698 40 07660 85 0872 39 7771 84 1045 38 7880 83 1219 37 7986 82 1392 36 8090 81 1564 35 8192 80 01736 34 8290 79 1908 33 8387 78 2079 32 8480 77 2250 31 8572 76 2419 30 08660 75 2588 29 8746 74 2756 28 8829 73 2924 27 8910 72 3090 26 8988 71 3256 25 9063 70 03420 24 9135 69 3584 23 9205 68 3746 22 9272 67 3907 21 9336 middot66 4067 ZO 09397 65 4226 19 9455 64 4384 18 9511 63 4540 17 9563 62 4695 16 9613 61 4848 15 9659 60 05000 14 9703 59 5150 13 9744 58 5299 12 9781 57 5446 11 9816 56 5592 10 09848 55 5736 9 9877 54 5878 8 9903 53 6018 7 9925 52 6157 6 9945 51 6293 5 9962 50 06428 4 9976 49 6561 3 9986 48 6691 2 9994 47 6820 1 9998 46 6947 0 10000 45 7071
282 Faktorenanalyse
Abbildung 517 Korrelationsmatrix
R =r68660 1 06428lO1736 ~
R laumlszligt sich auch anders schreiben (vgl Abbildung 518)
Abbildung 518 Korrelationsmatrix mit Winkelausdrucken
l0deg R = 30deg 0deg
80deg 50deg 0deg
Der Leser moumlge die entsprechenden Werte selbst in einer Cosinus-Tabelle uumlbershy
pruumlfenDie der oben gezeigten Korrelationsmatrix zugrundeliegenden drei Variablen
und ihre Beziehungen zueinander lassen sich relativ leicht in einem zweidimen sionalen Raum darstellen (Abbildung 519)
Abbildung 519 Graphische Darstellung des 3-Variablen-Beispiels
Vektor X2
Vektorx3Vektor Xl
Vorgehensweise 283
Je mehr Variable jedoch zu beruumlcksichtigen sind desto mehr Dimensionen werden benoumltigt um die Vektoren in ihren entsprechenden Winkeln zueinander zu positioshy
nieren Die Faktorenanalyse trachtet nun danach das sich uumlber die Korrelationsshykoeffizienten gemessene Verhaumlltnis der Variablen zueinander in einem moumlglichst gering dimensionierten Raum zu reproduzieren Die Zahl der benoumltigten Achsen gibt dann die entsprechende Zahl der Faktoren an
Wenn man die Achsen als Faktoren ansieht dann stellt sich unmittelbar die Frashyge Wie werden diese Achsen (Faktoren) in ihrer Lage zu den jeweiligen Vektoren (Variablen) bestimmt
Dazu vergegenwaumlrtigt man sich am besten das Bild eines halboffenen Schirmes Die Zacken des Schirmgestaumlnges die alle in eine bestimmte Richtung weisend die Variablen repraumlsentieren lassen sich naumlherungsweise auch durch den Schirmstock darstellen Vereinfacht man diese Uumlberlegung aus DarstellungsgrQnden noch weishyter auf den 2-Variablen-Fall wie in AbbiIdu8520 die einen Korrelationskoshyeffizienten von 05 fuumlr die durch die Vektoren OA und OB dargestellten Variablen repraumlsentiert dann gibt der Vektor OC eine zusammenfassende (faktorielle) Beshyschreibung wieder Die beiden Winkel von 30deg zwischen Vektor I bzw Vektor II und Faktor-Vektor geben wiederum an inwieweit der gefundene Faktor mit Vekshytor (Variable) I bzw II zusammenhaumlngt Sie repraumlsentieren ebenfalls Korrelationsshykoeffizienten und zwar die zwischen den jeweiligen Variablen und dem Faktor Diese Korrelationskoeffizienten hatten wir oben als Faktorladungen bezeichnet Die Faktorladungen des 1 Faktors betragen also in bezug auf Variable I und Varishyable II cos 30deg = 08660
Abbildung 520 FaktorlOsung bei 2 Variablen
j
A
Vektor x
~---------__------~---- C
Resultante
e Vektor X
284 Faktorenanalyse
5223 Das Problem der Faktorextraktion
Nachdem wir nun wissen was eine Faktorladung inhaltlich bedeutet ist zu fragen Wie findet man einen solchen Vektor (Faktor) der stellvertretend ftir mehrere zushysammenhaumlngende Variable fungieren kann Erinnern wir uns noch einmal des Ausgangsbeispiels Aufstrichfette waren nach den ftinfMerkmalen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt - Haltbarkeit - Preis bewertet worden l2
Aus dieser Bewertung sei die Korrelationsmatrix in Abbildung 521 berechnet worden
Abbildung 521 Spiegelbildlich identische KOlTelationsmatrix
x X x x x
x 70 100 09848 90middotX 03420 30x 00000 10middotx
X -01736
Diese Korrelationsmatrix enthaumllt in der unteren Dreiecks-Matrix die Korrelationsshywerte in der oberen (spiegelbildlich identischen) Dreiecks-Matrix die entshysprechenden Winkel Graphisch ist der Inhalt dieser Matrix in Abbildung 522 darshygestellt
Das Beispiel wurde so gewaumlhlt daszlig die Winkel zwischen den Faktoren in einer zweidimensionalen Darstellung abgebildet werden koumlnnen - ein Fall der in der Realitaumlt allerdings kaum relevant ist
Wie findet man nun den 1 Faktor in dieser Vektordarstellung Bleiben wir zunaumlchst bei der graphischen Darstellung dann sucht man den
Schwerpunkt aus den ftinf Vektoren Der Leser moumlge sich dazu folgendes verdeutlichen
In Abbildung 522 ist der Faktor nichts anderes als die Resultante der funfVektoshyren Wuumlrden die ftinfVektoren funf Seile darstellen mit einem Gewicht in 0 und jeweils ein Mann wuumlrde mit gleicher Staumlrke an den Enden der Seile ziehen dann wuumlrde sich das Gewicht in eine bestimmte Richtung bewegen (vgl die gestrichelte
12 Es werden hier andere Werte als im Ausgangsbeispiel verwendet um zunaumlchst eine einshydeutige graphische Loumlsung zu ermoumlglichen
Vorgehensweise 285
Linie in Abbildung 523) Diesen Vektor bezeichnen wir als Resultante Er ist die graphische Repraumlsentation des 1 Faktors
Abbildung 522 Graphische Darstellung des 5-Variablen-Beispiels
~
XsXl
bull
Abbildung 523 Graphische Darstellung des Schwerpunktes
X2
XIX
Faktorshyvektor2
Betrachtet man nun die jetzt gebildeten Winkel zwischen dem 1 Faktor und den Ausgangsvektoren dann hat man auch die gesuchten Faktorladungen gefunden
(Erste Reshysultante)
4512
-------o
- -
286 Faktorenanalyse
Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen
Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben
Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge
die Werte selbst uumlberpruumlfen)
Abbildung 524 Einfaktorielle Ladungsmatrix
Faktor
05707Xl 07046x2 bull 09668x3
08211x4
07096
Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)
Abbildung 525 ZweifaktorieHe Ladungsmatrix
Faktor 1 Faktor 2
Xl 05707 -08211
x2 07046 -07096
x3 09668 02554
x4 08211 05707
Xs 07096 07046
Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa
Vorgehensweise 287
In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum
I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1
~~ 00
2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation
Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist
Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt
Sf = 1 = Ijj (9)J
3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt
Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)
Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung
Resutlanie 2 (Faktor 2)
A Vektor x o
120lt= fH bull C Resultante 1 (Faktor 1)
B Vektor x
288 Faktorenanalyse
Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB
Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel
Wenn obige Behauptung stimmt muumlszligte gelten
(lOa)[~J +[~~J =1
Uumlberpruumlfung 2 2 uumlc2
OC 00 +002 (lOb)--+-shy 2
OA OA OA2 2
In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)
Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)
(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)
2 2 OC +00
4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten
sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)
wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-
q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1
(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix
(2) Extraktion der
(5) Faktorinterpretatiln
(6) Bestimmung der Faktorwerte
Vorgehensweise 289
523 Bestimmung der Kommunalitaumlten
In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem
Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy
fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig
mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da
J
i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins
Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung
erklaumlrte Variant
standardisierte Gesamtvariant = 1
290 Faktorenanalyse
Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung
2 a j1 =07
2 2 8 j2 = 01 siRest= 02
Kommunalitat H =08 (erllt1arte Varianz)
Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)
R AmiddotA+U (7a)
Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet
Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion
Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer
Vorgehensweise 291
100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY
In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy
weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen
Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen
1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen
2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit
2 2I ~ ~ R j ~ mx rjk
Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse
- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy
13 Vgl Loehlin J C 1998 S 154 14
Vgl Uberla K 1972 S 155 ff
292 Faktorenanalyse
nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird
- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit
Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy
15formationsverlust deklariert wird
Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen
Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy
15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt
Vorgehensweise 293
tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder
Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren
Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen
Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren
Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist
Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf
Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden
Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel
Kommunalltlten
Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325
Extraktionsmelhode Hauptachsen-Faktorenanalyse
bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix
294 Faktorenanalyse
Abbildung 530 Faktorladungen im 6-Produkte-Beispiel
Faktoranmatrixmiddot
Faktor
1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608
Extraktionsmethode Hauptachsen-Faktorenanalyse
a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt
Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert
Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel
Reproduzierte Korrelationen
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT
KALORIEN
VITAMIN
HALTBARK
PREIS
96845 71193 96034 11035 04241
71193 52552b
70480
12709
07717
96034 70480 95292b
08461 01722
11035
12709 08461 99056b
8325
04241 07717 01722 98325 98070b
Residuun1 UNGEFETi
KALORIEN
VITAMIN
HALTBARK
PREIS
-00017 00101
-00141 00144
-00017
-00083 01001
- 01005
00101 -00083
-00036 00640
-00141 01061
-00636
00010
00144 -01005 00640 00010
ExtrakHonsmethode Hauptllchsenfaktorenanalyse
a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005
b Reproduzierte Kommunalltaumlten
Vorgehensweise 295
Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen
Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R
524 Zahl der Faktoren
(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix
(2) Extraktion der Faktoren
(6) Bestimmung der Faktorwerte
Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff
Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-
q N
trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N
Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden
Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy
296 Faktorenanalyse
Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre
Abbildung 532 Bestimmung der Eigenwerte
Faktorenmatrix
Faktor
1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)
Eigenwerte 25068 19112
Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil
Kom munalltaumlten
Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807
- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren
V orgehensweise 297
Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung
Abbildung 534 Scree-Test im 6-Produkte-Beispiel
Eigen- Screeplot wert 30
25
20
15
Kaiser-Kriterium
10 1 Elbow5
00 2 3 4 5
Faktomummer
298 Faktorenanalyse
525 Faktorinterpretation
Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)
Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt
(1) Variablenauswalll und Errechnung der Korrelationsmalrix
(2) Extraktion der Faktoran
(3) Bestimmung der Kommunalltaumllen
(6) Bestimmung derFaktorwerte _______---11
middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull
geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht
Abbildung 535 Faktorladungen im 6-Produkte-Beispiel
Preis Haltbarkeit
Extraktionsmethode Hauptachsen-Faktorenanalyse
Vorgehensweise 299
Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist
Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig
Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16
Abbildung 536 Unrotierte Faktorladungen
F
F
Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung
Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f
300 Faktorenanalyse
536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy
tert
Abbildung 537 Rotierte Faktorladungen
F (Ausgangssituation)2
11 F2 (rotiert)
F1
-- shy
(Ausgangssituation)
11
F1 (rotiert)
SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen
1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen
(rechtwinkligen) Rotation
2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren
Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die
vorgenenswelse j U 1
Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind
Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel
Faktor
1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt
Haltbarkeit
72152 bull 07020
07962 I 99208 Preis 01060 99025
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung
Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen
A bull =A T mit TC~SI7 - sina ] sma cosa
Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links
A T A 094331 - 028039 098357 003229
[C0s341570 - sin34 157 ]070669 016156 072152 007020
sin34157deg cos34157092825 - 030210 097615 000694
038926 091599 007962 099208
032320 093608 001060 099025
Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)
Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix
Faktor 1 2
1 94868 31622
2 -31622 94868
Il
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung
Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig
von a=1843deg
526 Bestimmung der Faktorwerte
(1) Variablenauswanl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitaumlten
Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte
Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt
(3c)Z=PmiddotA
Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY
(12)Z AT1p AAT
Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt
(13)ZArl=pE
Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten
(3c) wird von rechts mit A multipliziert
ZmiddotA=PmiddotAmiddotA (15)
Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar
ZAmiddot(A At1=P(A A) (A Atl (16)
Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt
P=ZA(AAt l (17)
In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren
In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term
AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte
Abbildung 540 Koeffizientenmatrix der Faktorwerte
Faktor 1 2
Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression
Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die
xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf
SjDa p E=P ist ergibt sich
Seite 271 zu (14)
P=ZAT
304 Faktorenanalyse
Abbildung 541 Standardisierte Ausgangsdatenmatrix Z
45ampt6R4LJL4
Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542
Abbildung 542 Faktorwerte im 6-Produkte-Beispiel
Vorgehensweise 305
Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel
Du darfst
VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG
E 11 BecelS
U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T
Sanella IIII Holl Butter
-1
bull Rama
-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18
WIRTSCHAFTLICHKEIT
Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen
527 Zusammenfassende Darstellung der Faktorenanalyse
Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy
e Vorgehensweise 307 306 Faktorenanalyse
Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen
sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-
schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy
tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig
wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy
nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy
chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy
analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte
Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht
Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der
Verwendung des Verfahrens offenzulegen
I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _
CQ)l2CQgtQ ~ i
-Q)C t l5~11
0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C
CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O
~ ~ 11 t 3
uj~fi
t Imiddot~ J1 ~SHaa
It c~
c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~
-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi
o~ ~ -gEG)
I ~l c c ~l~ampi
2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E
U~a ]i E
J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy
~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--
----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt
Fallbeispiel 309308 Faktorenanalyse
Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert
531 Problemstellung
In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften
Variable und Objekte des BeispielsAbbildung 545
EigenschaftenMarken M k (k=I Il) xj(j=I IO)
A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado
5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H
I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama
Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist
Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)
Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern
Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse
---
310Faktorenanalyse
532 Ergebnisse
1 Variablenauswahl und Errechnung der Korrelationsmatrix
Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung
548 wiedergegeben
Abbildung 548 Die Korrelationskoeffizienten -_ -
-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy
In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der
Fallbeispiel 311
Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet
Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie
-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -
06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170
-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260
62444 -97126 66229 -83532 -62589
-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545
-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno
Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)
Abbildung 550 Dialogfeld Deskriptive Statistik
312 Faktorenanalyse
2 Bestimmung der Kommunalitilten
Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt
wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend
bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich
von den Startwerten abweichen
Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten
Hauptkomponentenanalyse Hauptachsenanalyse
Variable Korrunuriali- Kommunali- Korrununali- Kommunali-
Ut (Startwerte)
tlt (Endwerte)
tlIl (Startwerte )
tlIl (End werte)
STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR
100000 100000 100000 100000 100000 100000 100000 100000 100000 100000
88619
76855
89167 85324 76043 84012 80223 92668 63297 88786
97414
89018
79497
85847
96501
98810
97132
99166
78019
96445
85325
55717
85754
91075
55819
82330
73903
94796
40402
87851
Fallbeispiel 313
Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy
I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren
Abbildung 552 Dialogfeld Extraktion
Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist
3 Wabl der Extraktionsmetbode
Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen
4 Zabl der Faktoren
Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen
Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet
Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch
17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f
1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden
Erklaumlrte Gesamtvarianz
Anfaumlngliche Eigenwerte
314 Faktorenanalyse
Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy
den sich fUnfFaktoren ergeben
Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien
95) der Varianz erklaumlrt sind
2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)
3 Extrahiere n (zB 3) Faktoren
4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy
renzahl
5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein
6 Extrahiere alle Faktoren die nach der
Vom Computer automatisch verwandt wenn keine andere Spezifikation
Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden
Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden
Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist
Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt
Fallbeispiel 315
Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil
Faktor 1
2 3
4
5
6
7
8
9
10
Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden
Abbildung 555 Scree-Test und Kaiser-Kriterium
Eigen- -=gtcreeplot wert
5
4
3
2
10
o Kaisershy
~ 3 i i 7 i Q
Faktornummer
Gesamt 505188
177106
142700
81935
42961
24709
15928
06190
02943
00340
der Varianz 5051883
1771061
1427002
819349 429611
247085
159275
61902
29434
03398
Kumulierte 5051883
6822944
8249946
9069295
9498905
9745991
9905266
9967168
9996602
10000000
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
280 Faktorenanalyse
als linear unabhaumlngig bezeichnet wenn sie senkrecht (orthogonal) aufeinander steshyhen Sind die beiden betrachteten Vektoren (Variablen) jedoch korreliert ist der Korrelationskoeffizient also C 0 zB 05 dann wird dies graphisch durch einen Winkel von 60deg zwischen den beiden Vektoren dargestellt
Es stellt sich die Frage Warum entspricht ein Korrelationskoeffizient von 05 genau einem Winkel von 60deg Die Verbindung wird uumlber den Cosinus des jeshy
weiligen Winkels hergestellt Verdeutlichen wir uns dies anhand des Ausgangsbeispiels (Abbildung 515)
In Abbildung 515 repraumlsentieren die Vektoren AC und AB zB die beiden Vashyriablen Kaloriengehalt und Vitamingehalt Zwischen den beid~_yariablen moumlge eine Korrelation von 05 gemessen worden sein Der Vektor AC der den Kaloriengehalt repraumlsentiert und der genau wie AB aufgrund der Standardisierung eine Laumlnge von 1 hat weist zu AB einen Winkel von 60deg auf Der Cosinus des Winkels 60deg der die Stellung der beiden Variablen zueinander (ihre Richtung) anmiddot gibt ist definiert als Quotient aus Ankathete und Hypothenuse also als AD AC Da AC aber gleich 1 ist ist der Korrelationskoeffizient identisch mit der Strecke
AD Wie Abbildung 516 ausschnitthaft zeigt ist zB der Cosinus eines 60deg-Winkels
gleich 05 Entsprechend laumlszligt sich jeder beliebige Korrelationskoeffizient zwischen zwei Variablen auch durch zwei Vektoren mit einem genau definierten Winkel zushyeinander darstellen Verdeutlichen wir uns dies noch einmal anband einer Korrelamiddot tionsmatrix mit drei Variablen (Abbildung 517)
Abbildung 515 Vektordarstellung einer Korrelation zwischen zwei Variablen
c
A 0 B
)V
Standardisierte LOnge von 1
Vorgehensweise 281
Abbildung 516 Werte rur den Cosinus (entnommen aus Geliert W JKuumlstnerHlHellwich MfKaumlstner H Kleine Enzyshyklopaumldie Mathematik Leipzig 1969 S 799)
Grad CO Grad cO
45 07071 90 00000 44 7193 89 0175 43 7314 88 0349 42 7431 87 0523 41 7547 86 0698 40 07660 85 0872 39 7771 84 1045 38 7880 83 1219 37 7986 82 1392 36 8090 81 1564 35 8192 80 01736 34 8290 79 1908 33 8387 78 2079 32 8480 77 2250 31 8572 76 2419 30 08660 75 2588 29 8746 74 2756 28 8829 73 2924 27 8910 72 3090 26 8988 71 3256 25 9063 70 03420 24 9135 69 3584 23 9205 68 3746 22 9272 67 3907 21 9336 middot66 4067 ZO 09397 65 4226 19 9455 64 4384 18 9511 63 4540 17 9563 62 4695 16 9613 61 4848 15 9659 60 05000 14 9703 59 5150 13 9744 58 5299 12 9781 57 5446 11 9816 56 5592 10 09848 55 5736 9 9877 54 5878 8 9903 53 6018 7 9925 52 6157 6 9945 51 6293 5 9962 50 06428 4 9976 49 6561 3 9986 48 6691 2 9994 47 6820 1 9998 46 6947 0 10000 45 7071
282 Faktorenanalyse
Abbildung 517 Korrelationsmatrix
R =r68660 1 06428lO1736 ~
R laumlszligt sich auch anders schreiben (vgl Abbildung 518)
Abbildung 518 Korrelationsmatrix mit Winkelausdrucken
l0deg R = 30deg 0deg
80deg 50deg 0deg
Der Leser moumlge die entsprechenden Werte selbst in einer Cosinus-Tabelle uumlbershy
pruumlfenDie der oben gezeigten Korrelationsmatrix zugrundeliegenden drei Variablen
und ihre Beziehungen zueinander lassen sich relativ leicht in einem zweidimen sionalen Raum darstellen (Abbildung 519)
Abbildung 519 Graphische Darstellung des 3-Variablen-Beispiels
Vektor X2
Vektorx3Vektor Xl
Vorgehensweise 283
Je mehr Variable jedoch zu beruumlcksichtigen sind desto mehr Dimensionen werden benoumltigt um die Vektoren in ihren entsprechenden Winkeln zueinander zu positioshy
nieren Die Faktorenanalyse trachtet nun danach das sich uumlber die Korrelationsshykoeffizienten gemessene Verhaumlltnis der Variablen zueinander in einem moumlglichst gering dimensionierten Raum zu reproduzieren Die Zahl der benoumltigten Achsen gibt dann die entsprechende Zahl der Faktoren an
Wenn man die Achsen als Faktoren ansieht dann stellt sich unmittelbar die Frashyge Wie werden diese Achsen (Faktoren) in ihrer Lage zu den jeweiligen Vektoren (Variablen) bestimmt
Dazu vergegenwaumlrtigt man sich am besten das Bild eines halboffenen Schirmes Die Zacken des Schirmgestaumlnges die alle in eine bestimmte Richtung weisend die Variablen repraumlsentieren lassen sich naumlherungsweise auch durch den Schirmstock darstellen Vereinfacht man diese Uumlberlegung aus DarstellungsgrQnden noch weishyter auf den 2-Variablen-Fall wie in AbbiIdu8520 die einen Korrelationskoshyeffizienten von 05 fuumlr die durch die Vektoren OA und OB dargestellten Variablen repraumlsentiert dann gibt der Vektor OC eine zusammenfassende (faktorielle) Beshyschreibung wieder Die beiden Winkel von 30deg zwischen Vektor I bzw Vektor II und Faktor-Vektor geben wiederum an inwieweit der gefundene Faktor mit Vekshytor (Variable) I bzw II zusammenhaumlngt Sie repraumlsentieren ebenfalls Korrelationsshykoeffizienten und zwar die zwischen den jeweiligen Variablen und dem Faktor Diese Korrelationskoeffizienten hatten wir oben als Faktorladungen bezeichnet Die Faktorladungen des 1 Faktors betragen also in bezug auf Variable I und Varishyable II cos 30deg = 08660
Abbildung 520 FaktorlOsung bei 2 Variablen
j
A
Vektor x
~---------__------~---- C
Resultante
e Vektor X
284 Faktorenanalyse
5223 Das Problem der Faktorextraktion
Nachdem wir nun wissen was eine Faktorladung inhaltlich bedeutet ist zu fragen Wie findet man einen solchen Vektor (Faktor) der stellvertretend ftir mehrere zushysammenhaumlngende Variable fungieren kann Erinnern wir uns noch einmal des Ausgangsbeispiels Aufstrichfette waren nach den ftinfMerkmalen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt - Haltbarkeit - Preis bewertet worden l2
Aus dieser Bewertung sei die Korrelationsmatrix in Abbildung 521 berechnet worden
Abbildung 521 Spiegelbildlich identische KOlTelationsmatrix
x X x x x
x 70 100 09848 90middotX 03420 30x 00000 10middotx
X -01736
Diese Korrelationsmatrix enthaumllt in der unteren Dreiecks-Matrix die Korrelationsshywerte in der oberen (spiegelbildlich identischen) Dreiecks-Matrix die entshysprechenden Winkel Graphisch ist der Inhalt dieser Matrix in Abbildung 522 darshygestellt
Das Beispiel wurde so gewaumlhlt daszlig die Winkel zwischen den Faktoren in einer zweidimensionalen Darstellung abgebildet werden koumlnnen - ein Fall der in der Realitaumlt allerdings kaum relevant ist
Wie findet man nun den 1 Faktor in dieser Vektordarstellung Bleiben wir zunaumlchst bei der graphischen Darstellung dann sucht man den
Schwerpunkt aus den ftinf Vektoren Der Leser moumlge sich dazu folgendes verdeutlichen
In Abbildung 522 ist der Faktor nichts anderes als die Resultante der funfVektoshyren Wuumlrden die ftinfVektoren funf Seile darstellen mit einem Gewicht in 0 und jeweils ein Mann wuumlrde mit gleicher Staumlrke an den Enden der Seile ziehen dann wuumlrde sich das Gewicht in eine bestimmte Richtung bewegen (vgl die gestrichelte
12 Es werden hier andere Werte als im Ausgangsbeispiel verwendet um zunaumlchst eine einshydeutige graphische Loumlsung zu ermoumlglichen
Vorgehensweise 285
Linie in Abbildung 523) Diesen Vektor bezeichnen wir als Resultante Er ist die graphische Repraumlsentation des 1 Faktors
Abbildung 522 Graphische Darstellung des 5-Variablen-Beispiels
~
XsXl
bull
Abbildung 523 Graphische Darstellung des Schwerpunktes
X2
XIX
Faktorshyvektor2
Betrachtet man nun die jetzt gebildeten Winkel zwischen dem 1 Faktor und den Ausgangsvektoren dann hat man auch die gesuchten Faktorladungen gefunden
(Erste Reshysultante)
4512
-------o
- -
286 Faktorenanalyse
Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen
Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben
Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge
die Werte selbst uumlberpruumlfen)
Abbildung 524 Einfaktorielle Ladungsmatrix
Faktor
05707Xl 07046x2 bull 09668x3
08211x4
07096
Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)
Abbildung 525 ZweifaktorieHe Ladungsmatrix
Faktor 1 Faktor 2
Xl 05707 -08211
x2 07046 -07096
x3 09668 02554
x4 08211 05707
Xs 07096 07046
Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa
Vorgehensweise 287
In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum
I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1
~~ 00
2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation
Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist
Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt
Sf = 1 = Ijj (9)J
3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt
Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)
Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung
Resutlanie 2 (Faktor 2)
A Vektor x o
120lt= fH bull C Resultante 1 (Faktor 1)
B Vektor x
288 Faktorenanalyse
Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB
Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel
Wenn obige Behauptung stimmt muumlszligte gelten
(lOa)[~J +[~~J =1
Uumlberpruumlfung 2 2 uumlc2
OC 00 +002 (lOb)--+-shy 2
OA OA OA2 2
In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)
Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)
(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)
2 2 OC +00
4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten
sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)
wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-
q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1
(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix
(2) Extraktion der
(5) Faktorinterpretatiln
(6) Bestimmung der Faktorwerte
Vorgehensweise 289
523 Bestimmung der Kommunalitaumlten
In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem
Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy
fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig
mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da
J
i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins
Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung
erklaumlrte Variant
standardisierte Gesamtvariant = 1
290 Faktorenanalyse
Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung
2 a j1 =07
2 2 8 j2 = 01 siRest= 02
Kommunalitat H =08 (erllt1arte Varianz)
Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)
R AmiddotA+U (7a)
Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet
Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion
Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer
Vorgehensweise 291
100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY
In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy
weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen
Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen
1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen
2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit
2 2I ~ ~ R j ~ mx rjk
Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse
- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy
13 Vgl Loehlin J C 1998 S 154 14
Vgl Uberla K 1972 S 155 ff
292 Faktorenanalyse
nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird
- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit
Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy
15formationsverlust deklariert wird
Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen
Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy
15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt
Vorgehensweise 293
tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder
Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren
Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen
Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren
Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist
Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf
Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden
Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel
Kommunalltlten
Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325
Extraktionsmelhode Hauptachsen-Faktorenanalyse
bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix
294 Faktorenanalyse
Abbildung 530 Faktorladungen im 6-Produkte-Beispiel
Faktoranmatrixmiddot
Faktor
1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608
Extraktionsmethode Hauptachsen-Faktorenanalyse
a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt
Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert
Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel
Reproduzierte Korrelationen
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT
KALORIEN
VITAMIN
HALTBARK
PREIS
96845 71193 96034 11035 04241
71193 52552b
70480
12709
07717
96034 70480 95292b
08461 01722
11035
12709 08461 99056b
8325
04241 07717 01722 98325 98070b
Residuun1 UNGEFETi
KALORIEN
VITAMIN
HALTBARK
PREIS
-00017 00101
-00141 00144
-00017
-00083 01001
- 01005
00101 -00083
-00036 00640
-00141 01061
-00636
00010
00144 -01005 00640 00010
ExtrakHonsmethode Hauptllchsenfaktorenanalyse
a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005
b Reproduzierte Kommunalltaumlten
Vorgehensweise 295
Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen
Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R
524 Zahl der Faktoren
(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix
(2) Extraktion der Faktoren
(6) Bestimmung der Faktorwerte
Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff
Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-
q N
trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N
Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden
Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy
296 Faktorenanalyse
Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre
Abbildung 532 Bestimmung der Eigenwerte
Faktorenmatrix
Faktor
1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)
Eigenwerte 25068 19112
Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil
Kom munalltaumlten
Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807
- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren
V orgehensweise 297
Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung
Abbildung 534 Scree-Test im 6-Produkte-Beispiel
Eigen- Screeplot wert 30
25
20
15
Kaiser-Kriterium
10 1 Elbow5
00 2 3 4 5
Faktomummer
298 Faktorenanalyse
525 Faktorinterpretation
Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)
Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt
(1) Variablenauswalll und Errechnung der Korrelationsmalrix
(2) Extraktion der Faktoran
(3) Bestimmung der Kommunalltaumllen
(6) Bestimmung derFaktorwerte _______---11
middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull
geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht
Abbildung 535 Faktorladungen im 6-Produkte-Beispiel
Preis Haltbarkeit
Extraktionsmethode Hauptachsen-Faktorenanalyse
Vorgehensweise 299
Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist
Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig
Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16
Abbildung 536 Unrotierte Faktorladungen
F
F
Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung
Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f
300 Faktorenanalyse
536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy
tert
Abbildung 537 Rotierte Faktorladungen
F (Ausgangssituation)2
11 F2 (rotiert)
F1
-- shy
(Ausgangssituation)
11
F1 (rotiert)
SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen
1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen
(rechtwinkligen) Rotation
2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren
Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die
vorgenenswelse j U 1
Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind
Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel
Faktor
1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt
Haltbarkeit
72152 bull 07020
07962 I 99208 Preis 01060 99025
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung
Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen
A bull =A T mit TC~SI7 - sina ] sma cosa
Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links
A T A 094331 - 028039 098357 003229
[C0s341570 - sin34 157 ]070669 016156 072152 007020
sin34157deg cos34157092825 - 030210 097615 000694
038926 091599 007962 099208
032320 093608 001060 099025
Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)
Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix
Faktor 1 2
1 94868 31622
2 -31622 94868
Il
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung
Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig
von a=1843deg
526 Bestimmung der Faktorwerte
(1) Variablenauswanl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitaumlten
Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte
Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt
(3c)Z=PmiddotA
Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY
(12)Z AT1p AAT
Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt
(13)ZArl=pE
Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten
(3c) wird von rechts mit A multipliziert
ZmiddotA=PmiddotAmiddotA (15)
Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar
ZAmiddot(A At1=P(A A) (A Atl (16)
Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt
P=ZA(AAt l (17)
In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren
In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term
AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte
Abbildung 540 Koeffizientenmatrix der Faktorwerte
Faktor 1 2
Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression
Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die
xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf
SjDa p E=P ist ergibt sich
Seite 271 zu (14)
P=ZAT
304 Faktorenanalyse
Abbildung 541 Standardisierte Ausgangsdatenmatrix Z
45ampt6R4LJL4
Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542
Abbildung 542 Faktorwerte im 6-Produkte-Beispiel
Vorgehensweise 305
Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel
Du darfst
VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG
E 11 BecelS
U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T
Sanella IIII Holl Butter
-1
bull Rama
-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18
WIRTSCHAFTLICHKEIT
Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen
527 Zusammenfassende Darstellung der Faktorenanalyse
Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy
e Vorgehensweise 307 306 Faktorenanalyse
Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen
sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-
schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy
tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig
wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy
nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy
chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy
analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte
Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht
Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der
Verwendung des Verfahrens offenzulegen
I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _
CQ)l2CQgtQ ~ i
-Q)C t l5~11
0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C
CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O
~ ~ 11 t 3
uj~fi
t Imiddot~ J1 ~SHaa
It c~
c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~
-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi
o~ ~ -gEG)
I ~l c c ~l~ampi
2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E
U~a ]i E
J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy
~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--
----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt
Fallbeispiel 309308 Faktorenanalyse
Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert
531 Problemstellung
In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften
Variable und Objekte des BeispielsAbbildung 545
EigenschaftenMarken M k (k=I Il) xj(j=I IO)
A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado
5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H
I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama
Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist
Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)
Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern
Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse
---
310Faktorenanalyse
532 Ergebnisse
1 Variablenauswahl und Errechnung der Korrelationsmatrix
Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung
548 wiedergegeben
Abbildung 548 Die Korrelationskoeffizienten -_ -
-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy
In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der
Fallbeispiel 311
Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet
Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie
-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -
06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170
-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260
62444 -97126 66229 -83532 -62589
-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545
-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno
Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)
Abbildung 550 Dialogfeld Deskriptive Statistik
312 Faktorenanalyse
2 Bestimmung der Kommunalitilten
Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt
wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend
bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich
von den Startwerten abweichen
Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten
Hauptkomponentenanalyse Hauptachsenanalyse
Variable Korrunuriali- Kommunali- Korrununali- Kommunali-
Ut (Startwerte)
tlt (Endwerte)
tlIl (Startwerte )
tlIl (End werte)
STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR
100000 100000 100000 100000 100000 100000 100000 100000 100000 100000
88619
76855
89167 85324 76043 84012 80223 92668 63297 88786
97414
89018
79497
85847
96501
98810
97132
99166
78019
96445
85325
55717
85754
91075
55819
82330
73903
94796
40402
87851
Fallbeispiel 313
Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy
I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren
Abbildung 552 Dialogfeld Extraktion
Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist
3 Wabl der Extraktionsmetbode
Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen
4 Zabl der Faktoren
Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen
Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet
Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch
17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f
1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden
Erklaumlrte Gesamtvarianz
Anfaumlngliche Eigenwerte
314 Faktorenanalyse
Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy
den sich fUnfFaktoren ergeben
Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien
95) der Varianz erklaumlrt sind
2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)
3 Extrahiere n (zB 3) Faktoren
4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy
renzahl
5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein
6 Extrahiere alle Faktoren die nach der
Vom Computer automatisch verwandt wenn keine andere Spezifikation
Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden
Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden
Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist
Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt
Fallbeispiel 315
Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil
Faktor 1
2 3
4
5
6
7
8
9
10
Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden
Abbildung 555 Scree-Test und Kaiser-Kriterium
Eigen- -=gtcreeplot wert
5
4
3
2
10
o Kaisershy
~ 3 i i 7 i Q
Faktornummer
Gesamt 505188
177106
142700
81935
42961
24709
15928
06190
02943
00340
der Varianz 5051883
1771061
1427002
819349 429611
247085
159275
61902
29434
03398
Kumulierte 5051883
6822944
8249946
9069295
9498905
9745991
9905266
9967168
9996602
10000000
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
282 Faktorenanalyse
Abbildung 517 Korrelationsmatrix
R =r68660 1 06428lO1736 ~
R laumlszligt sich auch anders schreiben (vgl Abbildung 518)
Abbildung 518 Korrelationsmatrix mit Winkelausdrucken
l0deg R = 30deg 0deg
80deg 50deg 0deg
Der Leser moumlge die entsprechenden Werte selbst in einer Cosinus-Tabelle uumlbershy
pruumlfenDie der oben gezeigten Korrelationsmatrix zugrundeliegenden drei Variablen
und ihre Beziehungen zueinander lassen sich relativ leicht in einem zweidimen sionalen Raum darstellen (Abbildung 519)
Abbildung 519 Graphische Darstellung des 3-Variablen-Beispiels
Vektor X2
Vektorx3Vektor Xl
Vorgehensweise 283
Je mehr Variable jedoch zu beruumlcksichtigen sind desto mehr Dimensionen werden benoumltigt um die Vektoren in ihren entsprechenden Winkeln zueinander zu positioshy
nieren Die Faktorenanalyse trachtet nun danach das sich uumlber die Korrelationsshykoeffizienten gemessene Verhaumlltnis der Variablen zueinander in einem moumlglichst gering dimensionierten Raum zu reproduzieren Die Zahl der benoumltigten Achsen gibt dann die entsprechende Zahl der Faktoren an
Wenn man die Achsen als Faktoren ansieht dann stellt sich unmittelbar die Frashyge Wie werden diese Achsen (Faktoren) in ihrer Lage zu den jeweiligen Vektoren (Variablen) bestimmt
Dazu vergegenwaumlrtigt man sich am besten das Bild eines halboffenen Schirmes Die Zacken des Schirmgestaumlnges die alle in eine bestimmte Richtung weisend die Variablen repraumlsentieren lassen sich naumlherungsweise auch durch den Schirmstock darstellen Vereinfacht man diese Uumlberlegung aus DarstellungsgrQnden noch weishyter auf den 2-Variablen-Fall wie in AbbiIdu8520 die einen Korrelationskoshyeffizienten von 05 fuumlr die durch die Vektoren OA und OB dargestellten Variablen repraumlsentiert dann gibt der Vektor OC eine zusammenfassende (faktorielle) Beshyschreibung wieder Die beiden Winkel von 30deg zwischen Vektor I bzw Vektor II und Faktor-Vektor geben wiederum an inwieweit der gefundene Faktor mit Vekshytor (Variable) I bzw II zusammenhaumlngt Sie repraumlsentieren ebenfalls Korrelationsshykoeffizienten und zwar die zwischen den jeweiligen Variablen und dem Faktor Diese Korrelationskoeffizienten hatten wir oben als Faktorladungen bezeichnet Die Faktorladungen des 1 Faktors betragen also in bezug auf Variable I und Varishyable II cos 30deg = 08660
Abbildung 520 FaktorlOsung bei 2 Variablen
j
A
Vektor x
~---------__------~---- C
Resultante
e Vektor X
284 Faktorenanalyse
5223 Das Problem der Faktorextraktion
Nachdem wir nun wissen was eine Faktorladung inhaltlich bedeutet ist zu fragen Wie findet man einen solchen Vektor (Faktor) der stellvertretend ftir mehrere zushysammenhaumlngende Variable fungieren kann Erinnern wir uns noch einmal des Ausgangsbeispiels Aufstrichfette waren nach den ftinfMerkmalen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt - Haltbarkeit - Preis bewertet worden l2
Aus dieser Bewertung sei die Korrelationsmatrix in Abbildung 521 berechnet worden
Abbildung 521 Spiegelbildlich identische KOlTelationsmatrix
x X x x x
x 70 100 09848 90middotX 03420 30x 00000 10middotx
X -01736
Diese Korrelationsmatrix enthaumllt in der unteren Dreiecks-Matrix die Korrelationsshywerte in der oberen (spiegelbildlich identischen) Dreiecks-Matrix die entshysprechenden Winkel Graphisch ist der Inhalt dieser Matrix in Abbildung 522 darshygestellt
Das Beispiel wurde so gewaumlhlt daszlig die Winkel zwischen den Faktoren in einer zweidimensionalen Darstellung abgebildet werden koumlnnen - ein Fall der in der Realitaumlt allerdings kaum relevant ist
Wie findet man nun den 1 Faktor in dieser Vektordarstellung Bleiben wir zunaumlchst bei der graphischen Darstellung dann sucht man den
Schwerpunkt aus den ftinf Vektoren Der Leser moumlge sich dazu folgendes verdeutlichen
In Abbildung 522 ist der Faktor nichts anderes als die Resultante der funfVektoshyren Wuumlrden die ftinfVektoren funf Seile darstellen mit einem Gewicht in 0 und jeweils ein Mann wuumlrde mit gleicher Staumlrke an den Enden der Seile ziehen dann wuumlrde sich das Gewicht in eine bestimmte Richtung bewegen (vgl die gestrichelte
12 Es werden hier andere Werte als im Ausgangsbeispiel verwendet um zunaumlchst eine einshydeutige graphische Loumlsung zu ermoumlglichen
Vorgehensweise 285
Linie in Abbildung 523) Diesen Vektor bezeichnen wir als Resultante Er ist die graphische Repraumlsentation des 1 Faktors
Abbildung 522 Graphische Darstellung des 5-Variablen-Beispiels
~
XsXl
bull
Abbildung 523 Graphische Darstellung des Schwerpunktes
X2
XIX
Faktorshyvektor2
Betrachtet man nun die jetzt gebildeten Winkel zwischen dem 1 Faktor und den Ausgangsvektoren dann hat man auch die gesuchten Faktorladungen gefunden
(Erste Reshysultante)
4512
-------o
- -
286 Faktorenanalyse
Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen
Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben
Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge
die Werte selbst uumlberpruumlfen)
Abbildung 524 Einfaktorielle Ladungsmatrix
Faktor
05707Xl 07046x2 bull 09668x3
08211x4
07096
Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)
Abbildung 525 ZweifaktorieHe Ladungsmatrix
Faktor 1 Faktor 2
Xl 05707 -08211
x2 07046 -07096
x3 09668 02554
x4 08211 05707
Xs 07096 07046
Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa
Vorgehensweise 287
In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum
I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1
~~ 00
2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation
Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist
Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt
Sf = 1 = Ijj (9)J
3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt
Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)
Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung
Resutlanie 2 (Faktor 2)
A Vektor x o
120lt= fH bull C Resultante 1 (Faktor 1)
B Vektor x
288 Faktorenanalyse
Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB
Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel
Wenn obige Behauptung stimmt muumlszligte gelten
(lOa)[~J +[~~J =1
Uumlberpruumlfung 2 2 uumlc2
OC 00 +002 (lOb)--+-shy 2
OA OA OA2 2
In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)
Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)
(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)
2 2 OC +00
4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten
sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)
wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-
q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1
(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix
(2) Extraktion der
(5) Faktorinterpretatiln
(6) Bestimmung der Faktorwerte
Vorgehensweise 289
523 Bestimmung der Kommunalitaumlten
In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem
Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy
fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig
mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da
J
i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins
Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung
erklaumlrte Variant
standardisierte Gesamtvariant = 1
290 Faktorenanalyse
Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung
2 a j1 =07
2 2 8 j2 = 01 siRest= 02
Kommunalitat H =08 (erllt1arte Varianz)
Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)
R AmiddotA+U (7a)
Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet
Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion
Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer
Vorgehensweise 291
100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY
In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy
weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen
Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen
1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen
2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit
2 2I ~ ~ R j ~ mx rjk
Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse
- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy
13 Vgl Loehlin J C 1998 S 154 14
Vgl Uberla K 1972 S 155 ff
292 Faktorenanalyse
nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird
- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit
Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy
15formationsverlust deklariert wird
Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen
Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy
15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt
Vorgehensweise 293
tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder
Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren
Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen
Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren
Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist
Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf
Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden
Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel
Kommunalltlten
Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325
Extraktionsmelhode Hauptachsen-Faktorenanalyse
bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix
294 Faktorenanalyse
Abbildung 530 Faktorladungen im 6-Produkte-Beispiel
Faktoranmatrixmiddot
Faktor
1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608
Extraktionsmethode Hauptachsen-Faktorenanalyse
a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt
Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert
Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel
Reproduzierte Korrelationen
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT
KALORIEN
VITAMIN
HALTBARK
PREIS
96845 71193 96034 11035 04241
71193 52552b
70480
12709
07717
96034 70480 95292b
08461 01722
11035
12709 08461 99056b
8325
04241 07717 01722 98325 98070b
Residuun1 UNGEFETi
KALORIEN
VITAMIN
HALTBARK
PREIS
-00017 00101
-00141 00144
-00017
-00083 01001
- 01005
00101 -00083
-00036 00640
-00141 01061
-00636
00010
00144 -01005 00640 00010
ExtrakHonsmethode Hauptllchsenfaktorenanalyse
a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005
b Reproduzierte Kommunalltaumlten
Vorgehensweise 295
Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen
Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R
524 Zahl der Faktoren
(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix
(2) Extraktion der Faktoren
(6) Bestimmung der Faktorwerte
Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff
Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-
q N
trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N
Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden
Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy
296 Faktorenanalyse
Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre
Abbildung 532 Bestimmung der Eigenwerte
Faktorenmatrix
Faktor
1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)
Eigenwerte 25068 19112
Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil
Kom munalltaumlten
Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807
- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren
V orgehensweise 297
Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung
Abbildung 534 Scree-Test im 6-Produkte-Beispiel
Eigen- Screeplot wert 30
25
20
15
Kaiser-Kriterium
10 1 Elbow5
00 2 3 4 5
Faktomummer
298 Faktorenanalyse
525 Faktorinterpretation
Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)
Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt
(1) Variablenauswalll und Errechnung der Korrelationsmalrix
(2) Extraktion der Faktoran
(3) Bestimmung der Kommunalltaumllen
(6) Bestimmung derFaktorwerte _______---11
middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull
geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht
Abbildung 535 Faktorladungen im 6-Produkte-Beispiel
Preis Haltbarkeit
Extraktionsmethode Hauptachsen-Faktorenanalyse
Vorgehensweise 299
Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist
Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig
Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16
Abbildung 536 Unrotierte Faktorladungen
F
F
Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung
Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f
300 Faktorenanalyse
536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy
tert
Abbildung 537 Rotierte Faktorladungen
F (Ausgangssituation)2
11 F2 (rotiert)
F1
-- shy
(Ausgangssituation)
11
F1 (rotiert)
SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen
1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen
(rechtwinkligen) Rotation
2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren
Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die
vorgenenswelse j U 1
Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind
Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel
Faktor
1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt
Haltbarkeit
72152 bull 07020
07962 I 99208 Preis 01060 99025
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung
Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen
A bull =A T mit TC~SI7 - sina ] sma cosa
Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links
A T A 094331 - 028039 098357 003229
[C0s341570 - sin34 157 ]070669 016156 072152 007020
sin34157deg cos34157092825 - 030210 097615 000694
038926 091599 007962 099208
032320 093608 001060 099025
Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)
Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix
Faktor 1 2
1 94868 31622
2 -31622 94868
Il
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung
Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig
von a=1843deg
526 Bestimmung der Faktorwerte
(1) Variablenauswanl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitaumlten
Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte
Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt
(3c)Z=PmiddotA
Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY
(12)Z AT1p AAT
Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt
(13)ZArl=pE
Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten
(3c) wird von rechts mit A multipliziert
ZmiddotA=PmiddotAmiddotA (15)
Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar
ZAmiddot(A At1=P(A A) (A Atl (16)
Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt
P=ZA(AAt l (17)
In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren
In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term
AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte
Abbildung 540 Koeffizientenmatrix der Faktorwerte
Faktor 1 2
Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression
Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die
xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf
SjDa p E=P ist ergibt sich
Seite 271 zu (14)
P=ZAT
304 Faktorenanalyse
Abbildung 541 Standardisierte Ausgangsdatenmatrix Z
45ampt6R4LJL4
Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542
Abbildung 542 Faktorwerte im 6-Produkte-Beispiel
Vorgehensweise 305
Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel
Du darfst
VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG
E 11 BecelS
U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T
Sanella IIII Holl Butter
-1
bull Rama
-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18
WIRTSCHAFTLICHKEIT
Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen
527 Zusammenfassende Darstellung der Faktorenanalyse
Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy
e Vorgehensweise 307 306 Faktorenanalyse
Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen
sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-
schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy
tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig
wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy
nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy
chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy
analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte
Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht
Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der
Verwendung des Verfahrens offenzulegen
I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _
CQ)l2CQgtQ ~ i
-Q)C t l5~11
0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C
CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O
~ ~ 11 t 3
uj~fi
t Imiddot~ J1 ~SHaa
It c~
c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~
-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi
o~ ~ -gEG)
I ~l c c ~l~ampi
2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E
U~a ]i E
J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy
~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--
----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt
Fallbeispiel 309308 Faktorenanalyse
Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert
531 Problemstellung
In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften
Variable und Objekte des BeispielsAbbildung 545
EigenschaftenMarken M k (k=I Il) xj(j=I IO)
A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado
5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H
I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama
Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist
Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)
Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern
Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse
---
310Faktorenanalyse
532 Ergebnisse
1 Variablenauswahl und Errechnung der Korrelationsmatrix
Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung
548 wiedergegeben
Abbildung 548 Die Korrelationskoeffizienten -_ -
-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy
In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der
Fallbeispiel 311
Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet
Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie
-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -
06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170
-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260
62444 -97126 66229 -83532 -62589
-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545
-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno
Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)
Abbildung 550 Dialogfeld Deskriptive Statistik
312 Faktorenanalyse
2 Bestimmung der Kommunalitilten
Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt
wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend
bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich
von den Startwerten abweichen
Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten
Hauptkomponentenanalyse Hauptachsenanalyse
Variable Korrunuriali- Kommunali- Korrununali- Kommunali-
Ut (Startwerte)
tlt (Endwerte)
tlIl (Startwerte )
tlIl (End werte)
STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR
100000 100000 100000 100000 100000 100000 100000 100000 100000 100000
88619
76855
89167 85324 76043 84012 80223 92668 63297 88786
97414
89018
79497
85847
96501
98810
97132
99166
78019
96445
85325
55717
85754
91075
55819
82330
73903
94796
40402
87851
Fallbeispiel 313
Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy
I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren
Abbildung 552 Dialogfeld Extraktion
Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist
3 Wabl der Extraktionsmetbode
Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen
4 Zabl der Faktoren
Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen
Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet
Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch
17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f
1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden
Erklaumlrte Gesamtvarianz
Anfaumlngliche Eigenwerte
314 Faktorenanalyse
Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy
den sich fUnfFaktoren ergeben
Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien
95) der Varianz erklaumlrt sind
2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)
3 Extrahiere n (zB 3) Faktoren
4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy
renzahl
5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein
6 Extrahiere alle Faktoren die nach der
Vom Computer automatisch verwandt wenn keine andere Spezifikation
Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden
Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden
Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist
Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt
Fallbeispiel 315
Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil
Faktor 1
2 3
4
5
6
7
8
9
10
Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden
Abbildung 555 Scree-Test und Kaiser-Kriterium
Eigen- -=gtcreeplot wert
5
4
3
2
10
o Kaisershy
~ 3 i i 7 i Q
Faktornummer
Gesamt 505188
177106
142700
81935
42961
24709
15928
06190
02943
00340
der Varianz 5051883
1771061
1427002
819349 429611
247085
159275
61902
29434
03398
Kumulierte 5051883
6822944
8249946
9069295
9498905
9745991
9905266
9967168
9996602
10000000
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
284 Faktorenanalyse
5223 Das Problem der Faktorextraktion
Nachdem wir nun wissen was eine Faktorladung inhaltlich bedeutet ist zu fragen Wie findet man einen solchen Vektor (Faktor) der stellvertretend ftir mehrere zushysammenhaumlngende Variable fungieren kann Erinnern wir uns noch einmal des Ausgangsbeispiels Aufstrichfette waren nach den ftinfMerkmalen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt - Haltbarkeit - Preis bewertet worden l2
Aus dieser Bewertung sei die Korrelationsmatrix in Abbildung 521 berechnet worden
Abbildung 521 Spiegelbildlich identische KOlTelationsmatrix
x X x x x
x 70 100 09848 90middotX 03420 30x 00000 10middotx
X -01736
Diese Korrelationsmatrix enthaumllt in der unteren Dreiecks-Matrix die Korrelationsshywerte in der oberen (spiegelbildlich identischen) Dreiecks-Matrix die entshysprechenden Winkel Graphisch ist der Inhalt dieser Matrix in Abbildung 522 darshygestellt
Das Beispiel wurde so gewaumlhlt daszlig die Winkel zwischen den Faktoren in einer zweidimensionalen Darstellung abgebildet werden koumlnnen - ein Fall der in der Realitaumlt allerdings kaum relevant ist
Wie findet man nun den 1 Faktor in dieser Vektordarstellung Bleiben wir zunaumlchst bei der graphischen Darstellung dann sucht man den
Schwerpunkt aus den ftinf Vektoren Der Leser moumlge sich dazu folgendes verdeutlichen
In Abbildung 522 ist der Faktor nichts anderes als die Resultante der funfVektoshyren Wuumlrden die ftinfVektoren funf Seile darstellen mit einem Gewicht in 0 und jeweils ein Mann wuumlrde mit gleicher Staumlrke an den Enden der Seile ziehen dann wuumlrde sich das Gewicht in eine bestimmte Richtung bewegen (vgl die gestrichelte
12 Es werden hier andere Werte als im Ausgangsbeispiel verwendet um zunaumlchst eine einshydeutige graphische Loumlsung zu ermoumlglichen
Vorgehensweise 285
Linie in Abbildung 523) Diesen Vektor bezeichnen wir als Resultante Er ist die graphische Repraumlsentation des 1 Faktors
Abbildung 522 Graphische Darstellung des 5-Variablen-Beispiels
~
XsXl
bull
Abbildung 523 Graphische Darstellung des Schwerpunktes
X2
XIX
Faktorshyvektor2
Betrachtet man nun die jetzt gebildeten Winkel zwischen dem 1 Faktor und den Ausgangsvektoren dann hat man auch die gesuchten Faktorladungen gefunden
(Erste Reshysultante)
4512
-------o
- -
286 Faktorenanalyse
Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen
Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben
Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge
die Werte selbst uumlberpruumlfen)
Abbildung 524 Einfaktorielle Ladungsmatrix
Faktor
05707Xl 07046x2 bull 09668x3
08211x4
07096
Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)
Abbildung 525 ZweifaktorieHe Ladungsmatrix
Faktor 1 Faktor 2
Xl 05707 -08211
x2 07046 -07096
x3 09668 02554
x4 08211 05707
Xs 07096 07046
Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa
Vorgehensweise 287
In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum
I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1
~~ 00
2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation
Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist
Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt
Sf = 1 = Ijj (9)J
3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt
Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)
Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung
Resutlanie 2 (Faktor 2)
A Vektor x o
120lt= fH bull C Resultante 1 (Faktor 1)
B Vektor x
288 Faktorenanalyse
Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB
Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel
Wenn obige Behauptung stimmt muumlszligte gelten
(lOa)[~J +[~~J =1
Uumlberpruumlfung 2 2 uumlc2
OC 00 +002 (lOb)--+-shy 2
OA OA OA2 2
In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)
Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)
(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)
2 2 OC +00
4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten
sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)
wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-
q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1
(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix
(2) Extraktion der
(5) Faktorinterpretatiln
(6) Bestimmung der Faktorwerte
Vorgehensweise 289
523 Bestimmung der Kommunalitaumlten
In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem
Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy
fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig
mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da
J
i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins
Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung
erklaumlrte Variant
standardisierte Gesamtvariant = 1
290 Faktorenanalyse
Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung
2 a j1 =07
2 2 8 j2 = 01 siRest= 02
Kommunalitat H =08 (erllt1arte Varianz)
Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)
R AmiddotA+U (7a)
Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet
Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion
Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer
Vorgehensweise 291
100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY
In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy
weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen
Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen
1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen
2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit
2 2I ~ ~ R j ~ mx rjk
Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse
- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy
13 Vgl Loehlin J C 1998 S 154 14
Vgl Uberla K 1972 S 155 ff
292 Faktorenanalyse
nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird
- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit
Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy
15formationsverlust deklariert wird
Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen
Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy
15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt
Vorgehensweise 293
tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder
Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren
Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen
Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren
Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist
Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf
Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden
Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel
Kommunalltlten
Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325
Extraktionsmelhode Hauptachsen-Faktorenanalyse
bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix
294 Faktorenanalyse
Abbildung 530 Faktorladungen im 6-Produkte-Beispiel
Faktoranmatrixmiddot
Faktor
1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608
Extraktionsmethode Hauptachsen-Faktorenanalyse
a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt
Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert
Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel
Reproduzierte Korrelationen
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT
KALORIEN
VITAMIN
HALTBARK
PREIS
96845 71193 96034 11035 04241
71193 52552b
70480
12709
07717
96034 70480 95292b
08461 01722
11035
12709 08461 99056b
8325
04241 07717 01722 98325 98070b
Residuun1 UNGEFETi
KALORIEN
VITAMIN
HALTBARK
PREIS
-00017 00101
-00141 00144
-00017
-00083 01001
- 01005
00101 -00083
-00036 00640
-00141 01061
-00636
00010
00144 -01005 00640 00010
ExtrakHonsmethode Hauptllchsenfaktorenanalyse
a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005
b Reproduzierte Kommunalltaumlten
Vorgehensweise 295
Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen
Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R
524 Zahl der Faktoren
(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix
(2) Extraktion der Faktoren
(6) Bestimmung der Faktorwerte
Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff
Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-
q N
trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N
Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden
Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy
296 Faktorenanalyse
Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre
Abbildung 532 Bestimmung der Eigenwerte
Faktorenmatrix
Faktor
1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)
Eigenwerte 25068 19112
Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil
Kom munalltaumlten
Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807
- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren
V orgehensweise 297
Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung
Abbildung 534 Scree-Test im 6-Produkte-Beispiel
Eigen- Screeplot wert 30
25
20
15
Kaiser-Kriterium
10 1 Elbow5
00 2 3 4 5
Faktomummer
298 Faktorenanalyse
525 Faktorinterpretation
Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)
Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt
(1) Variablenauswalll und Errechnung der Korrelationsmalrix
(2) Extraktion der Faktoran
(3) Bestimmung der Kommunalltaumllen
(6) Bestimmung derFaktorwerte _______---11
middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull
geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht
Abbildung 535 Faktorladungen im 6-Produkte-Beispiel
Preis Haltbarkeit
Extraktionsmethode Hauptachsen-Faktorenanalyse
Vorgehensweise 299
Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist
Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig
Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16
Abbildung 536 Unrotierte Faktorladungen
F
F
Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung
Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f
300 Faktorenanalyse
536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy
tert
Abbildung 537 Rotierte Faktorladungen
F (Ausgangssituation)2
11 F2 (rotiert)
F1
-- shy
(Ausgangssituation)
11
F1 (rotiert)
SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen
1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen
(rechtwinkligen) Rotation
2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren
Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die
vorgenenswelse j U 1
Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind
Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel
Faktor
1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt
Haltbarkeit
72152 bull 07020
07962 I 99208 Preis 01060 99025
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung
Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen
A bull =A T mit TC~SI7 - sina ] sma cosa
Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links
A T A 094331 - 028039 098357 003229
[C0s341570 - sin34 157 ]070669 016156 072152 007020
sin34157deg cos34157092825 - 030210 097615 000694
038926 091599 007962 099208
032320 093608 001060 099025
Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)
Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix
Faktor 1 2
1 94868 31622
2 -31622 94868
Il
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung
Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig
von a=1843deg
526 Bestimmung der Faktorwerte
(1) Variablenauswanl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitaumlten
Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte
Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt
(3c)Z=PmiddotA
Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY
(12)Z AT1p AAT
Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt
(13)ZArl=pE
Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten
(3c) wird von rechts mit A multipliziert
ZmiddotA=PmiddotAmiddotA (15)
Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar
ZAmiddot(A At1=P(A A) (A Atl (16)
Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt
P=ZA(AAt l (17)
In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren
In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term
AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte
Abbildung 540 Koeffizientenmatrix der Faktorwerte
Faktor 1 2
Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression
Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die
xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf
SjDa p E=P ist ergibt sich
Seite 271 zu (14)
P=ZAT
304 Faktorenanalyse
Abbildung 541 Standardisierte Ausgangsdatenmatrix Z
45ampt6R4LJL4
Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542
Abbildung 542 Faktorwerte im 6-Produkte-Beispiel
Vorgehensweise 305
Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel
Du darfst
VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG
E 11 BecelS
U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T
Sanella IIII Holl Butter
-1
bull Rama
-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18
WIRTSCHAFTLICHKEIT
Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen
527 Zusammenfassende Darstellung der Faktorenanalyse
Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy
e Vorgehensweise 307 306 Faktorenanalyse
Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen
sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-
schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy
tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig
wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy
nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy
chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy
analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte
Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht
Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der
Verwendung des Verfahrens offenzulegen
I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _
CQ)l2CQgtQ ~ i
-Q)C t l5~11
0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C
CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O
~ ~ 11 t 3
uj~fi
t Imiddot~ J1 ~SHaa
It c~
c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~
-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi
o~ ~ -gEG)
I ~l c c ~l~ampi
2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E
U~a ]i E
J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy
~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--
----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt
Fallbeispiel 309308 Faktorenanalyse
Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert
531 Problemstellung
In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften
Variable und Objekte des BeispielsAbbildung 545
EigenschaftenMarken M k (k=I Il) xj(j=I IO)
A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado
5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H
I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama
Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist
Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)
Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern
Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse
---
310Faktorenanalyse
532 Ergebnisse
1 Variablenauswahl und Errechnung der Korrelationsmatrix
Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung
548 wiedergegeben
Abbildung 548 Die Korrelationskoeffizienten -_ -
-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy
In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der
Fallbeispiel 311
Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet
Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie
-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -
06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170
-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260
62444 -97126 66229 -83532 -62589
-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545
-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno
Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)
Abbildung 550 Dialogfeld Deskriptive Statistik
312 Faktorenanalyse
2 Bestimmung der Kommunalitilten
Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt
wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend
bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich
von den Startwerten abweichen
Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten
Hauptkomponentenanalyse Hauptachsenanalyse
Variable Korrunuriali- Kommunali- Korrununali- Kommunali-
Ut (Startwerte)
tlt (Endwerte)
tlIl (Startwerte )
tlIl (End werte)
STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR
100000 100000 100000 100000 100000 100000 100000 100000 100000 100000
88619
76855
89167 85324 76043 84012 80223 92668 63297 88786
97414
89018
79497
85847
96501
98810
97132
99166
78019
96445
85325
55717
85754
91075
55819
82330
73903
94796
40402
87851
Fallbeispiel 313
Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy
I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren
Abbildung 552 Dialogfeld Extraktion
Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist
3 Wabl der Extraktionsmetbode
Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen
4 Zabl der Faktoren
Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen
Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet
Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch
17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f
1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden
Erklaumlrte Gesamtvarianz
Anfaumlngliche Eigenwerte
314 Faktorenanalyse
Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy
den sich fUnfFaktoren ergeben
Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien
95) der Varianz erklaumlrt sind
2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)
3 Extrahiere n (zB 3) Faktoren
4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy
renzahl
5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein
6 Extrahiere alle Faktoren die nach der
Vom Computer automatisch verwandt wenn keine andere Spezifikation
Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden
Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden
Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist
Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt
Fallbeispiel 315
Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil
Faktor 1
2 3
4
5
6
7
8
9
10
Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden
Abbildung 555 Scree-Test und Kaiser-Kriterium
Eigen- -=gtcreeplot wert
5
4
3
2
10
o Kaisershy
~ 3 i i 7 i Q
Faktornummer
Gesamt 505188
177106
142700
81935
42961
24709
15928
06190
02943
00340
der Varianz 5051883
1771061
1427002
819349 429611
247085
159275
61902
29434
03398
Kumulierte 5051883
6822944
8249946
9069295
9498905
9745991
9905266
9967168
9996602
10000000
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
- -
286 Faktorenanalyse
Beispielsweise betraumlgt der Winkel zwischen 1 Faktor und 1 Variablen (Anteil unshygesaumlttigter Fettsaumluren) 55deg 12 Dies entspricht einer Faktorladung von 05707 Der Leser moumlge die uumlbrigen Winkel selbst ausmessen
Schlaumlgt er die Werte rur den Cosinus der jeweiligen Winkel in einer CosinusshyTabelle nach so wird er feststellen daszlig sich die in Abbildung 524 gezeigten uumlbrishygen Faktorladungen ergeben
Ein zweiter Faktor der ja vom 1 Faktor unabhaumlngig sein soll ergibt sich durch die Errichtung eines Vektors in 0 der rechtwinklig zum 1 Faktor steht Damit ershygeben sich die in Abbildung 525 dargestellten Faktorladungen (der Leser moumlge
die Werte selbst uumlberpruumlfen)
Abbildung 524 Einfaktorielle Ladungsmatrix
Faktor
05707Xl 07046x2 bull 09668x3
08211x4
07096
Wir haben das Beispiel so gewaumlhlt daszlig alle Korrelationskoeffizienten zwischen den Ausgangsvektoren (Variablen) im zweidimensionalen Raum darstellbar waren Damit koumlnnen die Variationen in den Korrelationskoeffizienten vollstaumlndig uumlber zwei Faktoren erklaumlrt werden Mit anderen Worten Es genuumlgen zwei Faktoren um die verschiedenen Auspraumlgungen der Ausgangsvariablen vollstaumlndig zu reproshyduzieren (deterministisches Modell)
Abbildung 525 ZweifaktorieHe Ladungsmatrix
Faktor 1 Faktor 2
Xl 05707 -08211
x2 07046 -07096
x3 09668 02554
x4 08211 05707
Xs 07096 07046
Die negativen Faktorladungen zeigen an daszlig der jeweilige Faktor negativ mit der entsprechenden Variablen verknuumlpft ist et vice versa
Vorgehensweise 287
In einem solchen Fall wenn die ermittelten (extrahierten) Faktoren die Untershyschiede in den Beobachtungsdaten restlos erklaumlren muszlig die Summe der Ladungsshyquadrate rur jede Variable gleich 1 sein Warum
I Durch die Standardisierung der Ausgangsvariablen erzeugten wir einen Mitshytelwert von 0 und eine Standardabweichung von 1 Da die Varianz das Quadrat der Standardabweichung ist ist auch die Varianz gleich 1
~~ 00
2 Die Varianz einer jeden Variablen j erscheint in der Korrelationsmatrix als Selbstkorrelation
Man kann diese Uumlberlegung an der graphischen Darstellung in Abbildung 515 deutlich machen Wir hatten gesagt daszlig die Laumlnge der Strecke AD den Korrelationskoeffizienten beschreibt wenn AC standardisiert also gleich 1 ist
Im Falle der Selbstkorrelation fallen AC und AB zusammen Die Strecke AB bzw AC mit der normierten Laumlnge vo ergibt den (Selbst-) Korrelatishyonskoeffizienten Die Laumlnge des Vektors AB bzw AC gibt aber definitishyonsgemaumlszlig die Auspraumlgungs-Spannweite der Ausgangsvariablen also die Stanshydardabweichung wieder Wegen der Standardisierung ist diese jedoch mit dem Wert 1 gleich der Varianz so daszlig tatsaumlchlich gilt
Sf = 1 = Ijj (9)J
3 Es laumlszligt sich zeigen daszlig auch die Summe der Ladungsquadrate der Faktoren gleich I ist wenn eine komplette Reproduktion der Ausgangsvariablen durch die Faktoren erfolgt
Schauen wir uns dazu ein Beispiel an bei dem zwei Variablen durch zwei Faktoren reproduziert werden (Abbildung 526)
Abbildung 526 Zwei Variablen-Zwei Faktor-Loumlsung
Resutlanie 2 (Faktor 2)
A Vektor x o
120lt= fH bull C Resultante 1 (Faktor 1)
B Vektor x
288 Faktorenanalyse
Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB
Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel
Wenn obige Behauptung stimmt muumlszligte gelten
(lOa)[~J +[~~J =1
Uumlberpruumlfung 2 2 uumlc2
OC 00 +002 (lOb)--+-shy 2
OA OA OA2 2
In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)
Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)
(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)
2 2 OC +00
4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten
sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)
wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-
q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1
(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix
(2) Extraktion der
(5) Faktorinterpretatiln
(6) Bestimmung der Faktorwerte
Vorgehensweise 289
523 Bestimmung der Kommunalitaumlten
In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem
Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy
fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig
mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da
J
i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins
Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung
erklaumlrte Variant
standardisierte Gesamtvariant = 1
290 Faktorenanalyse
Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung
2 a j1 =07
2 2 8 j2 = 01 siRest= 02
Kommunalitat H =08 (erllt1arte Varianz)
Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)
R AmiddotA+U (7a)
Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet
Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion
Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer
Vorgehensweise 291
100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY
In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy
weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen
Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen
1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen
2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit
2 2I ~ ~ R j ~ mx rjk
Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse
- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy
13 Vgl Loehlin J C 1998 S 154 14
Vgl Uberla K 1972 S 155 ff
292 Faktorenanalyse
nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird
- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit
Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy
15formationsverlust deklariert wird
Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen
Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy
15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt
Vorgehensweise 293
tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder
Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren
Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen
Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren
Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist
Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf
Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden
Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel
Kommunalltlten
Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325
Extraktionsmelhode Hauptachsen-Faktorenanalyse
bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix
294 Faktorenanalyse
Abbildung 530 Faktorladungen im 6-Produkte-Beispiel
Faktoranmatrixmiddot
Faktor
1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608
Extraktionsmethode Hauptachsen-Faktorenanalyse
a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt
Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert
Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel
Reproduzierte Korrelationen
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT
KALORIEN
VITAMIN
HALTBARK
PREIS
96845 71193 96034 11035 04241
71193 52552b
70480
12709
07717
96034 70480 95292b
08461 01722
11035
12709 08461 99056b
8325
04241 07717 01722 98325 98070b
Residuun1 UNGEFETi
KALORIEN
VITAMIN
HALTBARK
PREIS
-00017 00101
-00141 00144
-00017
-00083 01001
- 01005
00101 -00083
-00036 00640
-00141 01061
-00636
00010
00144 -01005 00640 00010
ExtrakHonsmethode Hauptllchsenfaktorenanalyse
a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005
b Reproduzierte Kommunalltaumlten
Vorgehensweise 295
Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen
Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R
524 Zahl der Faktoren
(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix
(2) Extraktion der Faktoren
(6) Bestimmung der Faktorwerte
Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff
Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-
q N
trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N
Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden
Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy
296 Faktorenanalyse
Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre
Abbildung 532 Bestimmung der Eigenwerte
Faktorenmatrix
Faktor
1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)
Eigenwerte 25068 19112
Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil
Kom munalltaumlten
Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807
- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren
V orgehensweise 297
Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung
Abbildung 534 Scree-Test im 6-Produkte-Beispiel
Eigen- Screeplot wert 30
25
20
15
Kaiser-Kriterium
10 1 Elbow5
00 2 3 4 5
Faktomummer
298 Faktorenanalyse
525 Faktorinterpretation
Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)
Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt
(1) Variablenauswalll und Errechnung der Korrelationsmalrix
(2) Extraktion der Faktoran
(3) Bestimmung der Kommunalltaumllen
(6) Bestimmung derFaktorwerte _______---11
middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull
geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht
Abbildung 535 Faktorladungen im 6-Produkte-Beispiel
Preis Haltbarkeit
Extraktionsmethode Hauptachsen-Faktorenanalyse
Vorgehensweise 299
Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist
Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig
Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16
Abbildung 536 Unrotierte Faktorladungen
F
F
Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung
Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f
300 Faktorenanalyse
536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy
tert
Abbildung 537 Rotierte Faktorladungen
F (Ausgangssituation)2
11 F2 (rotiert)
F1
-- shy
(Ausgangssituation)
11
F1 (rotiert)
SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen
1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen
(rechtwinkligen) Rotation
2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren
Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die
vorgenenswelse j U 1
Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind
Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel
Faktor
1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt
Haltbarkeit
72152 bull 07020
07962 I 99208 Preis 01060 99025
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung
Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen
A bull =A T mit TC~SI7 - sina ] sma cosa
Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links
A T A 094331 - 028039 098357 003229
[C0s341570 - sin34 157 ]070669 016156 072152 007020
sin34157deg cos34157092825 - 030210 097615 000694
038926 091599 007962 099208
032320 093608 001060 099025
Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)
Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix
Faktor 1 2
1 94868 31622
2 -31622 94868
Il
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung
Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig
von a=1843deg
526 Bestimmung der Faktorwerte
(1) Variablenauswanl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitaumlten
Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte
Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt
(3c)Z=PmiddotA
Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY
(12)Z AT1p AAT
Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt
(13)ZArl=pE
Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten
(3c) wird von rechts mit A multipliziert
ZmiddotA=PmiddotAmiddotA (15)
Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar
ZAmiddot(A At1=P(A A) (A Atl (16)
Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt
P=ZA(AAt l (17)
In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren
In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term
AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte
Abbildung 540 Koeffizientenmatrix der Faktorwerte
Faktor 1 2
Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression
Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die
xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf
SjDa p E=P ist ergibt sich
Seite 271 zu (14)
P=ZAT
304 Faktorenanalyse
Abbildung 541 Standardisierte Ausgangsdatenmatrix Z
45ampt6R4LJL4
Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542
Abbildung 542 Faktorwerte im 6-Produkte-Beispiel
Vorgehensweise 305
Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel
Du darfst
VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG
E 11 BecelS
U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T
Sanella IIII Holl Butter
-1
bull Rama
-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18
WIRTSCHAFTLICHKEIT
Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen
527 Zusammenfassende Darstellung der Faktorenanalyse
Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy
e Vorgehensweise 307 306 Faktorenanalyse
Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen
sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-
schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy
tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig
wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy
nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy
chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy
analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte
Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht
Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der
Verwendung des Verfahrens offenzulegen
I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _
CQ)l2CQgtQ ~ i
-Q)C t l5~11
0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C
CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O
~ ~ 11 t 3
uj~fi
t Imiddot~ J1 ~SHaa
It c~
c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~
-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi
o~ ~ -gEG)
I ~l c c ~l~ampi
2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E
U~a ]i E
J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy
~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--
----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt
Fallbeispiel 309308 Faktorenanalyse
Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert
531 Problemstellung
In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften
Variable und Objekte des BeispielsAbbildung 545
EigenschaftenMarken M k (k=I Il) xj(j=I IO)
A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado
5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H
I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama
Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist
Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)
Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern
Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse
---
310Faktorenanalyse
532 Ergebnisse
1 Variablenauswahl und Errechnung der Korrelationsmatrix
Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung
548 wiedergegeben
Abbildung 548 Die Korrelationskoeffizienten -_ -
-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy
In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der
Fallbeispiel 311
Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet
Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie
-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -
06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170
-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260
62444 -97126 66229 -83532 -62589
-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545
-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno
Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)
Abbildung 550 Dialogfeld Deskriptive Statistik
312 Faktorenanalyse
2 Bestimmung der Kommunalitilten
Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt
wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend
bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich
von den Startwerten abweichen
Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten
Hauptkomponentenanalyse Hauptachsenanalyse
Variable Korrunuriali- Kommunali- Korrununali- Kommunali-
Ut (Startwerte)
tlt (Endwerte)
tlIl (Startwerte )
tlIl (End werte)
STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR
100000 100000 100000 100000 100000 100000 100000 100000 100000 100000
88619
76855
89167 85324 76043 84012 80223 92668 63297 88786
97414
89018
79497
85847
96501
98810
97132
99166
78019
96445
85325
55717
85754
91075
55819
82330
73903
94796
40402
87851
Fallbeispiel 313
Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy
I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren
Abbildung 552 Dialogfeld Extraktion
Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist
3 Wabl der Extraktionsmetbode
Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen
4 Zabl der Faktoren
Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen
Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet
Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch
17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f
1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden
Erklaumlrte Gesamtvarianz
Anfaumlngliche Eigenwerte
314 Faktorenanalyse
Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy
den sich fUnfFaktoren ergeben
Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien
95) der Varianz erklaumlrt sind
2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)
3 Extrahiere n (zB 3) Faktoren
4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy
renzahl
5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein
6 Extrahiere alle Faktoren die nach der
Vom Computer automatisch verwandt wenn keine andere Spezifikation
Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden
Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden
Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist
Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt
Fallbeispiel 315
Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil
Faktor 1
2 3
4
5
6
7
8
9
10
Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden
Abbildung 555 Scree-Test und Kaiser-Kriterium
Eigen- -=gtcreeplot wert
5
4
3
2
10
o Kaisershy
~ 3 i i 7 i Q
Faktornummer
Gesamt 505188
177106
142700
81935
42961
24709
15928
06190
02943
00340
der Varianz 5051883
1771061
1427002
819349 429611
247085
159275
61902
29434
03398
Kumulierte 5051883
6822944
8249946
9069295
9498905
9745991
9905266
9967168
9996602
10000000
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
288 Faktorenanalyse
Die Faktorladungen werden durch den Cosinus der Winkel zwischen Ausshygangsvektoren und Faktoren beschrieben Oas bedeutet rur Variable I zB
Ladung des 1 Faktors cos Winkel COA = OC OA DOA OOOALadung des 2 Faktors cos Winkel
Wenn obige Behauptung stimmt muumlszligte gelten
(lOa)[~J +[~~J =1
Uumlberpruumlfung 2 2 uumlc2
OC 00 +002 (lOb)--+-shy 2
OA OA OA2 2
In Abbildung 526 in Verbindung mit dem Satz des Pythagoras gilt -2 -2 -2OA =OC + AC (IOc)
Da nach Abbildung 526 AC GD gilt auch 2OA2 == OC2 +00 (IOd)
(IOd) eingesetzt in (lOb) ergibt dann -2 -2 OC +00 == 1 (lOe)
2 2 OC +00
4 Als Fazit laumlszligt sich somit folgende wichtige Beziehung ableiten
sJ = Ijj = aJl +aJ2+middotmiddotmiddot+aJq = 1 (11)
wobei ~l bis aj die Ladungen der Faktoren I bis q auf die Variable j angibt Das bedeutet m~ts anderes als daszlig durch Quadrierung der Faktorladungen in bezug auf eine Variable und deren anschlieszligender Summation der durch die Faktoren wiedergegebene Varianzerklaumlrungsantei der betrachteten Variablen dargestellt wird r a ist nichts anderes als das Bestimmtheitsmaszlig der Regres-
q M sionsanalyse (vgl Kapitel I in diesem Buch) Im Falle der Extraktion aller moumlglichen Faktoren ist der Wert des Bestimmtheitsmaszliges gleich 1
(1) Variablenauswahl und ElTechnung der KOlTelationsmatrix
(2) Extraktion der
(5) Faktorinterpretatiln
(6) Bestimmung der Faktorwerte
Vorgehensweise 289
523 Bestimmung der Kommunalitaumlten
In einem konkreten Anwendungsfall bei dem vor dem Hintergrund des Ziels der Faktorenanalyse die Zahl der Faktoren kleiner als die Zahl der Merkmale ist kann es sein daszlig die Summe der Ladungsquadrate (erklaumlrte Varianz) kleiner als I ist Dies ist dann der Fall wenn aufgrund theoretischer Voruumlberlegungen klar ist daszlig nicht die gesamte Varianz durch die Faktoren bedingt ist Dies ist das sog Kommunalitaumltenproblem
Beispielsweise koumlnnten die auf den Wert von I norshymierten Varianzen der Variablen Kaloriengehalt und Anteil ungesaumlttigter Fettsaumluren nur zu 70 auf den Faktor Gesundheit zuruumlckzufiihren sein 30 der Varianz sind nicht durch den gemeinsamen Faktor beshydingt sondern durch andere Faktoren oder durch Meszligshy
fehler (Restvarianz) Abbildung 527 zeigt die Zusammenhaumlnge noch einmal graphisch Werden statt eines Faktors zwei Faktoren extrahiert so laumlszligt sich naturgemaumlszlig
mehr Gesamtvarianz durch die gemeinsamen Faktoren erklaumlren zB 80 wie in Abbildung 528 Den Teil der Gesamtvarianz einer Variablen der durch die geshymeinsamen Faktoren erklaumlrt werden soll bezeichnet man als Kommunalitaumlt h~ Da
J
i d R die gemeinsamen Faktoren nicht die Gesamtvarianz erklaumlren sind die Kommunalitaumlten meist kleiner als eins
Abbildung 527 Die Komponenten der Gesamtvarianz bei der I-Faktorloumlsung
erklaumlrte Variant
standardisierte Gesamtvariant = 1
290 Faktorenanalyse
Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung
2 a j1 =07
2 2 8 j2 = 01 siRest= 02
Kommunalitat H =08 (erllt1arte Varianz)
Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)
R AmiddotA+U (7a)
Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet
Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion
Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer
Vorgehensweise 291
100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY
In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy
weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen
Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen
1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen
2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit
2 2I ~ ~ R j ~ mx rjk
Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse
- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy
13 Vgl Loehlin J C 1998 S 154 14
Vgl Uberla K 1972 S 155 ff
292 Faktorenanalyse
nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird
- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit
Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy
15formationsverlust deklariert wird
Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen
Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy
15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt
Vorgehensweise 293
tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder
Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren
Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen
Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren
Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist
Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf
Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden
Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel
Kommunalltlten
Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325
Extraktionsmelhode Hauptachsen-Faktorenanalyse
bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix
294 Faktorenanalyse
Abbildung 530 Faktorladungen im 6-Produkte-Beispiel
Faktoranmatrixmiddot
Faktor
1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608
Extraktionsmethode Hauptachsen-Faktorenanalyse
a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt
Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert
Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel
Reproduzierte Korrelationen
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT
KALORIEN
VITAMIN
HALTBARK
PREIS
96845 71193 96034 11035 04241
71193 52552b
70480
12709
07717
96034 70480 95292b
08461 01722
11035
12709 08461 99056b
8325
04241 07717 01722 98325 98070b
Residuun1 UNGEFETi
KALORIEN
VITAMIN
HALTBARK
PREIS
-00017 00101
-00141 00144
-00017
-00083 01001
- 01005
00101 -00083
-00036 00640
-00141 01061
-00636
00010
00144 -01005 00640 00010
ExtrakHonsmethode Hauptllchsenfaktorenanalyse
a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005
b Reproduzierte Kommunalltaumlten
Vorgehensweise 295
Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen
Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R
524 Zahl der Faktoren
(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix
(2) Extraktion der Faktoren
(6) Bestimmung der Faktorwerte
Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff
Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-
q N
trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N
Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden
Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy
296 Faktorenanalyse
Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre
Abbildung 532 Bestimmung der Eigenwerte
Faktorenmatrix
Faktor
1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)
Eigenwerte 25068 19112
Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil
Kom munalltaumlten
Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807
- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren
V orgehensweise 297
Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung
Abbildung 534 Scree-Test im 6-Produkte-Beispiel
Eigen- Screeplot wert 30
25
20
15
Kaiser-Kriterium
10 1 Elbow5
00 2 3 4 5
Faktomummer
298 Faktorenanalyse
525 Faktorinterpretation
Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)
Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt
(1) Variablenauswalll und Errechnung der Korrelationsmalrix
(2) Extraktion der Faktoran
(3) Bestimmung der Kommunalltaumllen
(6) Bestimmung derFaktorwerte _______---11
middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull
geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht
Abbildung 535 Faktorladungen im 6-Produkte-Beispiel
Preis Haltbarkeit
Extraktionsmethode Hauptachsen-Faktorenanalyse
Vorgehensweise 299
Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist
Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig
Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16
Abbildung 536 Unrotierte Faktorladungen
F
F
Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung
Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f
300 Faktorenanalyse
536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy
tert
Abbildung 537 Rotierte Faktorladungen
F (Ausgangssituation)2
11 F2 (rotiert)
F1
-- shy
(Ausgangssituation)
11
F1 (rotiert)
SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen
1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen
(rechtwinkligen) Rotation
2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren
Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die
vorgenenswelse j U 1
Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind
Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel
Faktor
1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt
Haltbarkeit
72152 bull 07020
07962 I 99208 Preis 01060 99025
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung
Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen
A bull =A T mit TC~SI7 - sina ] sma cosa
Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links
A T A 094331 - 028039 098357 003229
[C0s341570 - sin34 157 ]070669 016156 072152 007020
sin34157deg cos34157092825 - 030210 097615 000694
038926 091599 007962 099208
032320 093608 001060 099025
Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)
Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix
Faktor 1 2
1 94868 31622
2 -31622 94868
Il
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung
Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig
von a=1843deg
526 Bestimmung der Faktorwerte
(1) Variablenauswanl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitaumlten
Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte
Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt
(3c)Z=PmiddotA
Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY
(12)Z AT1p AAT
Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt
(13)ZArl=pE
Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten
(3c) wird von rechts mit A multipliziert
ZmiddotA=PmiddotAmiddotA (15)
Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar
ZAmiddot(A At1=P(A A) (A Atl (16)
Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt
P=ZA(AAt l (17)
In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren
In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term
AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte
Abbildung 540 Koeffizientenmatrix der Faktorwerte
Faktor 1 2
Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression
Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die
xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf
SjDa p E=P ist ergibt sich
Seite 271 zu (14)
P=ZAT
304 Faktorenanalyse
Abbildung 541 Standardisierte Ausgangsdatenmatrix Z
45ampt6R4LJL4
Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542
Abbildung 542 Faktorwerte im 6-Produkte-Beispiel
Vorgehensweise 305
Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel
Du darfst
VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG
E 11 BecelS
U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T
Sanella IIII Holl Butter
-1
bull Rama
-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18
WIRTSCHAFTLICHKEIT
Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen
527 Zusammenfassende Darstellung der Faktorenanalyse
Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy
e Vorgehensweise 307 306 Faktorenanalyse
Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen
sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-
schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy
tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig
wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy
nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy
chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy
analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte
Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht
Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der
Verwendung des Verfahrens offenzulegen
I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _
CQ)l2CQgtQ ~ i
-Q)C t l5~11
0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C
CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O
~ ~ 11 t 3
uj~fi
t Imiddot~ J1 ~SHaa
It c~
c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~
-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi
o~ ~ -gEG)
I ~l c c ~l~ampi
2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E
U~a ]i E
J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy
~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--
----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt
Fallbeispiel 309308 Faktorenanalyse
Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert
531 Problemstellung
In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften
Variable und Objekte des BeispielsAbbildung 545
EigenschaftenMarken M k (k=I Il) xj(j=I IO)
A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado
5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H
I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama
Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist
Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)
Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern
Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse
---
310Faktorenanalyse
532 Ergebnisse
1 Variablenauswahl und Errechnung der Korrelationsmatrix
Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung
548 wiedergegeben
Abbildung 548 Die Korrelationskoeffizienten -_ -
-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy
In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der
Fallbeispiel 311
Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet
Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie
-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -
06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170
-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260
62444 -97126 66229 -83532 -62589
-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545
-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno
Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)
Abbildung 550 Dialogfeld Deskriptive Statistik
312 Faktorenanalyse
2 Bestimmung der Kommunalitilten
Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt
wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend
bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich
von den Startwerten abweichen
Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten
Hauptkomponentenanalyse Hauptachsenanalyse
Variable Korrunuriali- Kommunali- Korrununali- Kommunali-
Ut (Startwerte)
tlt (Endwerte)
tlIl (Startwerte )
tlIl (End werte)
STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR
100000 100000 100000 100000 100000 100000 100000 100000 100000 100000
88619
76855
89167 85324 76043 84012 80223 92668 63297 88786
97414
89018
79497
85847
96501
98810
97132
99166
78019
96445
85325
55717
85754
91075
55819
82330
73903
94796
40402
87851
Fallbeispiel 313
Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy
I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren
Abbildung 552 Dialogfeld Extraktion
Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist
3 Wabl der Extraktionsmetbode
Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen
4 Zabl der Faktoren
Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen
Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet
Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch
17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f
1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden
Erklaumlrte Gesamtvarianz
Anfaumlngliche Eigenwerte
314 Faktorenanalyse
Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy
den sich fUnfFaktoren ergeben
Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien
95) der Varianz erklaumlrt sind
2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)
3 Extrahiere n (zB 3) Faktoren
4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy
renzahl
5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein
6 Extrahiere alle Faktoren die nach der
Vom Computer automatisch verwandt wenn keine andere Spezifikation
Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden
Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden
Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist
Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt
Fallbeispiel 315
Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil
Faktor 1
2 3
4
5
6
7
8
9
10
Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden
Abbildung 555 Scree-Test und Kaiser-Kriterium
Eigen- -=gtcreeplot wert
5
4
3
2
10
o Kaisershy
~ 3 i i 7 i Q
Faktornummer
Gesamt 505188
177106
142700
81935
42961
24709
15928
06190
02943
00340
der Varianz 5051883
1771061
1427002
819349 429611
247085
159275
61902
29434
03398
Kumulierte 5051883
6822944
8249946
9069295
9498905
9745991
9905266
9967168
9996602
10000000
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
290 Faktorenanalyse
Abbildung 528 Die Komponenten der Gesamtvarianz bei einer 2-Faktorloumlsung
2 a j1 =07
2 2 8 j2 = 01 siRest= 02
Kommunalitat H =08 (erllt1arte Varianz)
Das heiszligt aber nichts anderes als daszlig fuumlr die Faktorenanalyse das Fundamenshytaltheorem in Gleichung (7) durch eine nicht erklaumlrte Komponente zu ergaumlnzen ist Waumlhlt man fur diesen Restterm der potentielle Meszligfehler und die spezifische Vashyrianz beschreibt das Symbol U dann ergibt sich fuumlr (7)
R AmiddotA+U (7a)
Die Korrelationsmatrix R in (7a) spiegelt ebenfalls in identischer Weise die aus den empirischen Daten errechneten Korrelationen wider wobei im Gegensatz zu (7) hier eine explizite Unterscheidung zwischen gemeinsamen Faktoren (die sich in der Matrix A niederschlagen) und spezifischen Faktoren (die durch die Matrix U repraumlsentiert werden) vorgenommen wurde Dabei umfassen die spezifischen Fakshytoren die spezifische Varianz einer Variablen sowie die jeweiligen Meszligfehler Spezifische Faktoren werden haumlufig auch als EinzelrestJaktoren bezeichnet
Ein wichtiges Problem der Faktorenanalyse besteht nun darin die Kommunalishytaumlten zu schaumltzen deren Werte der Anwender ja nicht kennt - er hat nur die Korshyrelationsrnatrix und sucht erst die Faktorladungen Hierbei handelt es sich um ein subjektives Vorab-Urteil des Forschers mit dein er einer Vermutung Ausdruck gibt Setzt er die Kommunalitaumlt beispielsweise auf 08 so legt er damit fest daszlig nach seiner Meinung 80 der Ausgangsvarianz durch gemeinsame Faktoren ershyklaumlrbar sind Um den Schaumltzcharakter deutlich zu machen werden die Kommushynalitaumlten haumlufig als Klammerwerte in die Haupt-Diagonale der Korrelationsmatrix eingesetzt Die so modifizierte Korrelationsmatrix fungiert dann als Ausgangsbasis fllr die oben beschriebene Faktorenextraktion
Hierbei laumlszligt sich ein Zusammenhang zwischen der Anzahl verwendeter Variabshy1en und der Bedeutung einer nahezu korrekten Einschaumltzung der Kommunalitaumlten aufstellen Je groumlszliger die Zahl an Variablen ist desto unwichtiger sind exakt geshyschaumltzte Kommunalitaumlten Schlieszliglich nimmt der prozentuale Anteil der diagonalen Elemente einer Matrix bei einer steigenden Anzahl an unters~chten Variablen ab In einer 2x2-Matrix bilden die diagonalen Elemente noch 50 aller Elemente bei einer IOxlO~Matrix sind dies nur noch 10 (10 diagonale aus insgesamt 100 Eshylementen) bei einer 100xl00-Matrix gerade einmal noch I Eine fehlerhafte Eintragung in einem von 100 Elementen fuumlr eine Variable (im Falle einer
Vorgehensweise 291
100xIOO-Matrix) hat folglich eine deutlich geringer negative Auswirkung als im Falle einer 2x2-MatrixY
In der Schaumltzung der Kommunalitaumlten ist der Anwender des Verfahrens nicht voumlllig frei Vielmehr ergeben sich theoretische Ober- und Untergrenzen fuumlr die jeshy
weiligen Werte die aber hier im einzelnen nicht dargestellt werden sollen 14 Innershyhalb dieser Grenzen existiert jedoch keine eindeutige Loumlsung Vielmehr ist eine Reihe von Schaumltzverfahren entwickelt worden die aber zu unterschiedlichen Ershygebnissen gelangen koumlnnen
Bei praktischen Anwendungen sind i d R jedoch nur zwei Verfahren zur Komshymunalitaumltenbestimmung von Bedeutung die sich wie folgt beschreiben lassen
1 Der Anwender geht von der Uumlberlegung aus daszlig die gesamte Varianz der Ausshygangsvariablen durch die Faktorenanalyse erklaumlrt werden soll und setzt somit die Kommunalitaumlten auf 1 Damit wird durch die Faktorenanalyse keine expli shyzite Kommunalitaumltenschaumltzung vorgenommen
2 Fuumlr die Kommunalitaumlt wird durch den Anwender aufgrund inhaltlicher Uumlberleshygungen ein bestimmter Schaumltzwert vorgegeben In vielen Faumlllen wird dabei der houmlchste quadrierte Korrelationskoeffizient einer Variablen mit den anderen Vashyriablen (das entspricht dem houmlchsten Korrelationskoeffizienten einer Zeile bzw Spalte mit Ausnahme der Hauptdiagonal-Werte) als Vorgabewert herangezoshygen Die Begruumlndung hierfuumlr ist darin zu sehen daszlig die Faktoren gemeinsam (mineestens) den gleichen Erklaumlrungsbeitrag liefern wie die houmlchste Korrelatishyon einer Variablen mit den verbleibenden Variablen ausmacht Dieser Wert ist i d R jedoch zu niedrig da nicht die Beziehungen zu den weiteren Variablen beruumlcksichtigt werden Dies ist der Fall bei Anwendung des multiplen Beshystimmtheitsmaszliges Als relevanter Wertebereich ergibt sich damit
2 2I ~ ~ R j ~ mx rjk
Wir hatten bereits zu Beginn die~es Abschnittes erwaumlhnt daszlig die Bestimmung der Kommunalitaumlten eng mit Wahl des Faktorextraktionsverjahrens verbunden ist Im Rahmen der Faktorenanalyse ist eine Vielzahl von Extraktionsverfahren entwickelt worden wobei zwei Verfahren von besonderer Bedeutung sind deren Unterscheishydung eng mit der oben beschriebenen Vorgehensweise bei der Bestimmung der Kommunalitaumlten zusammenhaumlngt die Hauptkomponentenanalyse und die Hauptshyachsenanalyse
- Die Hauptkomponentenanalyse geht davon aus daszlig die Varianz einer Ausgangsshyvariablen vollstaumlndig durch die Extraktion von Faktoren erklaumlrt werden kann d h sie unterstellt daszlig keine Einzelrestvarianz (= spezifische Varianz + Meszligfehshylervarianz) in den Variablen existiert Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer der Wert 1 vorgegeben wird und die Kommushy
13 Vgl Loehlin J C 1998 S 154 14
Vgl Uberla K 1972 S 155 ff
292 Faktorenanalyse
nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird
- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit
Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy
15formationsverlust deklariert wird
Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen
Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy
15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt
Vorgehensweise 293
tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder
Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren
Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen
Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren
Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist
Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf
Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden
Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel
Kommunalltlten
Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325
Extraktionsmelhode Hauptachsen-Faktorenanalyse
bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix
294 Faktorenanalyse
Abbildung 530 Faktorladungen im 6-Produkte-Beispiel
Faktoranmatrixmiddot
Faktor
1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608
Extraktionsmethode Hauptachsen-Faktorenanalyse
a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt
Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert
Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel
Reproduzierte Korrelationen
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT
KALORIEN
VITAMIN
HALTBARK
PREIS
96845 71193 96034 11035 04241
71193 52552b
70480
12709
07717
96034 70480 95292b
08461 01722
11035
12709 08461 99056b
8325
04241 07717 01722 98325 98070b
Residuun1 UNGEFETi
KALORIEN
VITAMIN
HALTBARK
PREIS
-00017 00101
-00141 00144
-00017
-00083 01001
- 01005
00101 -00083
-00036 00640
-00141 01061
-00636
00010
00144 -01005 00640 00010
ExtrakHonsmethode Hauptllchsenfaktorenanalyse
a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005
b Reproduzierte Kommunalltaumlten
Vorgehensweise 295
Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen
Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R
524 Zahl der Faktoren
(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix
(2) Extraktion der Faktoren
(6) Bestimmung der Faktorwerte
Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff
Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-
q N
trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N
Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden
Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy
296 Faktorenanalyse
Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre
Abbildung 532 Bestimmung der Eigenwerte
Faktorenmatrix
Faktor
1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)
Eigenwerte 25068 19112
Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil
Kom munalltaumlten
Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807
- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren
V orgehensweise 297
Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung
Abbildung 534 Scree-Test im 6-Produkte-Beispiel
Eigen- Screeplot wert 30
25
20
15
Kaiser-Kriterium
10 1 Elbow5
00 2 3 4 5
Faktomummer
298 Faktorenanalyse
525 Faktorinterpretation
Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)
Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt
(1) Variablenauswalll und Errechnung der Korrelationsmalrix
(2) Extraktion der Faktoran
(3) Bestimmung der Kommunalltaumllen
(6) Bestimmung derFaktorwerte _______---11
middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull
geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht
Abbildung 535 Faktorladungen im 6-Produkte-Beispiel
Preis Haltbarkeit
Extraktionsmethode Hauptachsen-Faktorenanalyse
Vorgehensweise 299
Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist
Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig
Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16
Abbildung 536 Unrotierte Faktorladungen
F
F
Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung
Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f
300 Faktorenanalyse
536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy
tert
Abbildung 537 Rotierte Faktorladungen
F (Ausgangssituation)2
11 F2 (rotiert)
F1
-- shy
(Ausgangssituation)
11
F1 (rotiert)
SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen
1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen
(rechtwinkligen) Rotation
2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren
Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die
vorgenenswelse j U 1
Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind
Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel
Faktor
1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt
Haltbarkeit
72152 bull 07020
07962 I 99208 Preis 01060 99025
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung
Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen
A bull =A T mit TC~SI7 - sina ] sma cosa
Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links
A T A 094331 - 028039 098357 003229
[C0s341570 - sin34 157 ]070669 016156 072152 007020
sin34157deg cos34157092825 - 030210 097615 000694
038926 091599 007962 099208
032320 093608 001060 099025
Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)
Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix
Faktor 1 2
1 94868 31622
2 -31622 94868
Il
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung
Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig
von a=1843deg
526 Bestimmung der Faktorwerte
(1) Variablenauswanl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitaumlten
Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte
Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt
(3c)Z=PmiddotA
Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY
(12)Z AT1p AAT
Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt
(13)ZArl=pE
Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten
(3c) wird von rechts mit A multipliziert
ZmiddotA=PmiddotAmiddotA (15)
Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar
ZAmiddot(A At1=P(A A) (A Atl (16)
Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt
P=ZA(AAt l (17)
In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren
In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term
AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte
Abbildung 540 Koeffizientenmatrix der Faktorwerte
Faktor 1 2
Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression
Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die
xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf
SjDa p E=P ist ergibt sich
Seite 271 zu (14)
P=ZAT
304 Faktorenanalyse
Abbildung 541 Standardisierte Ausgangsdatenmatrix Z
45ampt6R4LJL4
Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542
Abbildung 542 Faktorwerte im 6-Produkte-Beispiel
Vorgehensweise 305
Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel
Du darfst
VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG
E 11 BecelS
U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T
Sanella IIII Holl Butter
-1
bull Rama
-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18
WIRTSCHAFTLICHKEIT
Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen
527 Zusammenfassende Darstellung der Faktorenanalyse
Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy
e Vorgehensweise 307 306 Faktorenanalyse
Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen
sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-
schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy
tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig
wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy
nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy
chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy
analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte
Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht
Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der
Verwendung des Verfahrens offenzulegen
I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _
CQ)l2CQgtQ ~ i
-Q)C t l5~11
0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C
CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O
~ ~ 11 t 3
uj~fi
t Imiddot~ J1 ~SHaa
It c~
c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~
-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi
o~ ~ -gEG)
I ~l c c ~l~ampi
2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E
U~a ]i E
J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy
~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--
----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt
Fallbeispiel 309308 Faktorenanalyse
Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert
531 Problemstellung
In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften
Variable und Objekte des BeispielsAbbildung 545
EigenschaftenMarken M k (k=I Il) xj(j=I IO)
A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado
5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H
I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama
Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist
Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)
Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern
Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse
---
310Faktorenanalyse
532 Ergebnisse
1 Variablenauswahl und Errechnung der Korrelationsmatrix
Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung
548 wiedergegeben
Abbildung 548 Die Korrelationskoeffizienten -_ -
-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy
In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der
Fallbeispiel 311
Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet
Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie
-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -
06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170
-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260
62444 -97126 66229 -83532 -62589
-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545
-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno
Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)
Abbildung 550 Dialogfeld Deskriptive Statistik
312 Faktorenanalyse
2 Bestimmung der Kommunalitilten
Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt
wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend
bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich
von den Startwerten abweichen
Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten
Hauptkomponentenanalyse Hauptachsenanalyse
Variable Korrunuriali- Kommunali- Korrununali- Kommunali-
Ut (Startwerte)
tlt (Endwerte)
tlIl (Startwerte )
tlIl (End werte)
STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR
100000 100000 100000 100000 100000 100000 100000 100000 100000 100000
88619
76855
89167 85324 76043 84012 80223 92668 63297 88786
97414
89018
79497
85847
96501
98810
97132
99166
78019
96445
85325
55717
85754
91075
55819
82330
73903
94796
40402
87851
Fallbeispiel 313
Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy
I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren
Abbildung 552 Dialogfeld Extraktion
Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist
3 Wabl der Extraktionsmetbode
Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen
4 Zabl der Faktoren
Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen
Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet
Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch
17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f
1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden
Erklaumlrte Gesamtvarianz
Anfaumlngliche Eigenwerte
314 Faktorenanalyse
Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy
den sich fUnfFaktoren ergeben
Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien
95) der Varianz erklaumlrt sind
2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)
3 Extrahiere n (zB 3) Faktoren
4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy
renzahl
5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein
6 Extrahiere alle Faktoren die nach der
Vom Computer automatisch verwandt wenn keine andere Spezifikation
Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden
Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden
Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist
Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt
Fallbeispiel 315
Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil
Faktor 1
2 3
4
5
6
7
8
9
10
Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden
Abbildung 555 Scree-Test und Kaiser-Kriterium
Eigen- -=gtcreeplot wert
5
4
3
2
10
o Kaisershy
~ 3 i i 7 i Q
Faktornummer
Gesamt 505188
177106
142700
81935
42961
24709
15928
06190
02943
00340
der Varianz 5051883
1771061
1427002
819349 429611
247085
159275
61902
29434
03398
Kumulierte 5051883
6822944
8249946
9069295
9498905
9745991
9905266
9967168
9996602
10000000
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
292 Faktorenanalyse
nalitaumlt von I auch immer dann vollstaumlndig reproduziert wird wenn ebenso viele Faktoren wie Variable extrahiert werden Werden weniger Faktoren als Variable extrahiert so ergeben sich auch bei der Hauptkomponentenanalyse im Ergebnis Kommunalitaumltenwerte von kleiner I wobei der nicht erklaumlrte Varianzanteil (1 - Kommunalitaumlt) jedoch nicht als Einzelrestvarianz sondern als durch die Faktoren nicht reproduzierter Varianzanteil und damit als (bewuszligt in Kauf geshynommener) Informationsverlust deklariert wird
- Die Hauptachsenanayse hingegen unterstellt daszlig sich die Varianz einer Variashyblen immer in die Komponenten Kommunalitaumlt und Einzelrestvarianz aufteilt Ziel der Hauptachsenanalyse ist es lediglich die Varianzen der Variablen in Houmlshyhe der Kommunalitaumlten zu erklaumlren Das bedeutet daszlig als Startwert bei der Kommunalitaumltenschaumltzung immer Werte kleiner 1 vorgegeben werden Alshylerdings besitzt der Anwender hier eine Eingriffsmoumlglichkeit
Entweder besitzt der Anwender aufgrund inhaltlicher Oberlegungen Informashytionen daruumlber wie groszlig die wahren Werte der Kommunalitaumlt sind oder er uumlshyberlaumlszligt es dem Iterationsprozeszlig der Hauptachsenanalyse die Endwerte der Kommunalitaumlt zu schaumltzen wobei als Kriterium Konvergenz der Iterationen herangezogen wird Gibt der Anwender die Kommunalitaumltenwerte vor so wershyden diese immer in identischer Weise erzeugt wenn ebenso viele Faktoren wie Variablen extrahiert werden Werden hingegen weniger Faktoren als Variable extrahiert so ergeben sich auch bei Vorgabe der Kommunalitaumlten im Ergebnis Kommunalitaumltenwerte die kleiner sind als die Vorgaben wobei die Differenz zu den iVorgaben auch hier als nicht reproduzierter Varianzanteil und damit als Inshy
15formationsverlust deklariert wird
Obwohl sich Hauptkomponenten- und Hauptachsenanalyse in ihrer Rechentechnik nicht unterscheiden (beides sind iterative Verfahren) sondern sogar als identisch zu bezeichnen sind so machen die obigen Betrachtungen jedoch deutlich daszlig beishyde Verfahren von vollkommen unterschiedlichen theoretischen Modellen ausgeshyhen
Das Ziel der Hauptkomponentenanalyse liegt in der moumlglichst umfassenden Reshyproduktion der Datenstruktur durch moumlglichst wenige Faktoren Deshalb wird auch keine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz vorshygenommen Damit nimmt die Hauptkomponentenanalyse auch keine kausale Intershypretation der Faktoren vor wie sie in Abschnitt 51 als charakteristisch tUr die Faktorenanalyse aufgezeigt wurde In vielen Lehrbuumlchern wird deshalb die Hauptshykomponentenanalyse haumlufig auch als ein eigenstaumlndiges Analyseveifahren (neben der Faktorenanalyse) behandelt Demgegenuumlber liegt das Ziel der Hauptachsenshyanalyse in der Erklaumlrung der Varianz der Variablen durch hypothetische Groumlszligen (Faktoren) und es ist zwingend eine Unterscheidung zwischen Kommunalitaumlten und Einzelrestvarianz erforderlich Korrelationen werden hier also kausal interpreshy
15 An dieser Stelle wird bereits deutlich daszlig es sich bei der Hauptkomponenten- und der Hauptachsenanalyse um idenJische Verfahren handelt da die Hauptachsenanalyse bei einer Vorgabe der Kommunalitaumltenwerte von 1 die Hauptkomponentenanalyse als Speshyzialfall enthaumllt
Vorgehensweise 293
tiert Diese Unterschiede schlagen sich nicht in der Rechentechnik sondern in der Interpretation der Faktoren nieder
Bei der Hauptkomponentenanalyse lautet die Frage bei der Interpretation der Fakshytoren
Wie lassen sich die aufeinen Faktor hoch ladenden Variablen durch einen Sammelbegriff (Komponente) zusammenfassen
Bei der Hauptachsenanalyse lautet die Frage bei der Interpretation der Faktoren
Wie laumlszligt sich die Ursache bezeichnen die fiJr die hohen Ladungen der Variablen aufdiesen Faktor verantwortlich ist
Die Entscheidung daruumlber ob eine Faktorenanalyse mit Hilfe der Hauptkomposhynenten- oder der Hauptachsenanalyse durchgefiihrt werden soll wird damit allein durch sach-inhaltliche Uumlberlegungen bestimmt Wir unterstellen im folgenden daszlig tUr unser Beispiel die Frage der hypothetischen Erklaumlrungsgroumlszligen beim Margashyrinekaufvon Interesse ist und zeigen im folgenden die Vorgehensweise der Hauptshyachsenanalyse bei iterativer Kommunalitaumltenschaumltzung auf
Kehren wir zu unserem Ausgangsbeispiel in Abbildung 54 und Abbildung 510 zuruumlck so zeigt Abbildung 529 die Anfangswerte der Kommunalitaumlten die von SPSS im Rahmen der Hauptachsenanalyse (bei iterativer Kommunalitaumltenschaumltshyzung) als Startwerte vorgegeben werden
Abbildung 529 Startwerte der Kommunalitaumlten im 6-Produkte-Beispiel
Kommunalltlten
Anfl9ich UNGtFETT 93103 KALORIEN 54117 VITAMIN 92857 HALTBARK 97381 PREIS 97325
Extraktionsmelhode Hauptachsen-Faktorenanalyse
bull SPSS verwendet als Startwerte tUr die iterative Bestimmung der Kommunalitaumlten das multiple Bestimmtheitsmaszlig das den gemeinsamen Varianzanteil einer Variabshylen mit allen uumlbrigen Variablen angibt Setzt man diese Werte in die Korrelationsshymatrix der Abbildung 510 anstelle der Einsen in die Hauptdiagonale ein und fuhrt auf dieser Basis eine Faktorextraktion mit Hilfe der Hauptachsenanalyse durch (auf die Darstellung der einzelnen Iterationsschritte sei hier verzichtet) so ergibt sich bei (zunaumlchst willkuumlrlicher) Vorgabe von zwei zu extrahierenden Faktoren die in Abbildung 530 dargestellte Faktorladungsmatrix
294 Faktorenanalyse
Abbildung 530 Faktorladungen im 6-Produkte-Beispiel
Faktoranmatrixmiddot
Faktor
1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608
Extraktionsmethode Hauptachsen-Faktorenanalyse
a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt
Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert
Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel
Reproduzierte Korrelationen
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT
KALORIEN
VITAMIN
HALTBARK
PREIS
96845 71193 96034 11035 04241
71193 52552b
70480
12709
07717
96034 70480 95292b
08461 01722
11035
12709 08461 99056b
8325
04241 07717 01722 98325 98070b
Residuun1 UNGEFETi
KALORIEN
VITAMIN
HALTBARK
PREIS
-00017 00101
-00141 00144
-00017
-00083 01001
- 01005
00101 -00083
-00036 00640
-00141 01061
-00636
00010
00144 -01005 00640 00010
ExtrakHonsmethode Hauptllchsenfaktorenanalyse
a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005
b Reproduzierte Kommunalltaumlten
Vorgehensweise 295
Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen
Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R
524 Zahl der Faktoren
(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix
(2) Extraktion der Faktoren
(6) Bestimmung der Faktorwerte
Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff
Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-
q N
trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N
Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden
Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy
296 Faktorenanalyse
Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre
Abbildung 532 Bestimmung der Eigenwerte
Faktorenmatrix
Faktor
1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)
Eigenwerte 25068 19112
Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil
Kom munalltaumlten
Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807
- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren
V orgehensweise 297
Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung
Abbildung 534 Scree-Test im 6-Produkte-Beispiel
Eigen- Screeplot wert 30
25
20
15
Kaiser-Kriterium
10 1 Elbow5
00 2 3 4 5
Faktomummer
298 Faktorenanalyse
525 Faktorinterpretation
Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)
Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt
(1) Variablenauswalll und Errechnung der Korrelationsmalrix
(2) Extraktion der Faktoran
(3) Bestimmung der Kommunalltaumllen
(6) Bestimmung derFaktorwerte _______---11
middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull
geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht
Abbildung 535 Faktorladungen im 6-Produkte-Beispiel
Preis Haltbarkeit
Extraktionsmethode Hauptachsen-Faktorenanalyse
Vorgehensweise 299
Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist
Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig
Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16
Abbildung 536 Unrotierte Faktorladungen
F
F
Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung
Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f
300 Faktorenanalyse
536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy
tert
Abbildung 537 Rotierte Faktorladungen
F (Ausgangssituation)2
11 F2 (rotiert)
F1
-- shy
(Ausgangssituation)
11
F1 (rotiert)
SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen
1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen
(rechtwinkligen) Rotation
2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren
Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die
vorgenenswelse j U 1
Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind
Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel
Faktor
1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt
Haltbarkeit
72152 bull 07020
07962 I 99208 Preis 01060 99025
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung
Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen
A bull =A T mit TC~SI7 - sina ] sma cosa
Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links
A T A 094331 - 028039 098357 003229
[C0s341570 - sin34 157 ]070669 016156 072152 007020
sin34157deg cos34157092825 - 030210 097615 000694
038926 091599 007962 099208
032320 093608 001060 099025
Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)
Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix
Faktor 1 2
1 94868 31622
2 -31622 94868
Il
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung
Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig
von a=1843deg
526 Bestimmung der Faktorwerte
(1) Variablenauswanl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitaumlten
Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte
Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt
(3c)Z=PmiddotA
Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY
(12)Z AT1p AAT
Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt
(13)ZArl=pE
Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten
(3c) wird von rechts mit A multipliziert
ZmiddotA=PmiddotAmiddotA (15)
Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar
ZAmiddot(A At1=P(A A) (A Atl (16)
Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt
P=ZA(AAt l (17)
In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren
In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term
AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte
Abbildung 540 Koeffizientenmatrix der Faktorwerte
Faktor 1 2
Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression
Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die
xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf
SjDa p E=P ist ergibt sich
Seite 271 zu (14)
P=ZAT
304 Faktorenanalyse
Abbildung 541 Standardisierte Ausgangsdatenmatrix Z
45ampt6R4LJL4
Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542
Abbildung 542 Faktorwerte im 6-Produkte-Beispiel
Vorgehensweise 305
Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel
Du darfst
VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG
E 11 BecelS
U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T
Sanella IIII Holl Butter
-1
bull Rama
-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18
WIRTSCHAFTLICHKEIT
Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen
527 Zusammenfassende Darstellung der Faktorenanalyse
Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy
e Vorgehensweise 307 306 Faktorenanalyse
Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen
sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-
schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy
tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig
wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy
nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy
chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy
analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte
Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht
Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der
Verwendung des Verfahrens offenzulegen
I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _
CQ)l2CQgtQ ~ i
-Q)C t l5~11
0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C
CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O
~ ~ 11 t 3
uj~fi
t Imiddot~ J1 ~SHaa
It c~
c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~
-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi
o~ ~ -gEG)
I ~l c c ~l~ampi
2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E
U~a ]i E
J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy
~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--
----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt
Fallbeispiel 309308 Faktorenanalyse
Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert
531 Problemstellung
In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften
Variable und Objekte des BeispielsAbbildung 545
EigenschaftenMarken M k (k=I Il) xj(j=I IO)
A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado
5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H
I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama
Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist
Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)
Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern
Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse
---
310Faktorenanalyse
532 Ergebnisse
1 Variablenauswahl und Errechnung der Korrelationsmatrix
Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung
548 wiedergegeben
Abbildung 548 Die Korrelationskoeffizienten -_ -
-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy
In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der
Fallbeispiel 311
Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet
Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie
-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -
06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170
-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260
62444 -97126 66229 -83532 -62589
-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545
-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno
Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)
Abbildung 550 Dialogfeld Deskriptive Statistik
312 Faktorenanalyse
2 Bestimmung der Kommunalitilten
Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt
wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend
bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich
von den Startwerten abweichen
Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten
Hauptkomponentenanalyse Hauptachsenanalyse
Variable Korrunuriali- Kommunali- Korrununali- Kommunali-
Ut (Startwerte)
tlt (Endwerte)
tlIl (Startwerte )
tlIl (End werte)
STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR
100000 100000 100000 100000 100000 100000 100000 100000 100000 100000
88619
76855
89167 85324 76043 84012 80223 92668 63297 88786
97414
89018
79497
85847
96501
98810
97132
99166
78019
96445
85325
55717
85754
91075
55819
82330
73903
94796
40402
87851
Fallbeispiel 313
Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy
I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren
Abbildung 552 Dialogfeld Extraktion
Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist
3 Wabl der Extraktionsmetbode
Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen
4 Zabl der Faktoren
Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen
Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet
Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch
17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f
1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden
Erklaumlrte Gesamtvarianz
Anfaumlngliche Eigenwerte
314 Faktorenanalyse
Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy
den sich fUnfFaktoren ergeben
Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien
95) der Varianz erklaumlrt sind
2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)
3 Extrahiere n (zB 3) Faktoren
4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy
renzahl
5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein
6 Extrahiere alle Faktoren die nach der
Vom Computer automatisch verwandt wenn keine andere Spezifikation
Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden
Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden
Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist
Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt
Fallbeispiel 315
Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil
Faktor 1
2 3
4
5
6
7
8
9
10
Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden
Abbildung 555 Scree-Test und Kaiser-Kriterium
Eigen- -=gtcreeplot wert
5
4
3
2
10
o Kaisershy
~ 3 i i 7 i Q
Faktornummer
Gesamt 505188
177106
142700
81935
42961
24709
15928
06190
02943
00340
der Varianz 5051883
1771061
1427002
819349 429611
247085
159275
61902
29434
03398
Kumulierte 5051883
6822944
8249946
9069295
9498905
9745991
9905266
9967168
9996602
10000000
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
294 Faktorenanalyse
Abbildung 530 Faktorladungen im 6-Produkte-Beispiel
Faktoranmatrixmiddot
Faktor
1 2 UNcEFtTI 94331 -28039 KALORiEN 70669 -16156 VITAMiN 92825 -30210 HALTBARK 38926 91599 PREIS 32320 93608
Extraktionsmethode Hauptachsen-Faktorenanalyse
a 2 Faktoren extrahiert Es werden 7 Iterationen benoumltigt
Multipliziert man die Faktorladungsmatrix mit ihrer Transponierten so ergibt sich (gemaumlszlig dem Fundamentaltheorem der Faktorenanalyse in Formel (7raquo die in darshygestellte (reproduzierte) Korrelationsmatrix Abbildung 531 enthaumllt im oberen Teil mit der Uumlberschrift Reproduzierte Korrelation in der Hauptdiagonalen die Endshywerte der iterativ geschaumltzten Kommunalitaumlten bei zwei Faktoren Die nichtshydiagonal-Elemente geben die durch die Faktorenstruktur reproduzierten Korreshylationen wieder In der unteren Abbildung mit der Uumlberschrift Residuum werden die Differenzwerte zwischen den urspruumlnglichen (Abbildung 510) und den reproshyduzierten Korrelationen ausgewiesen Dabei wird deutlich daszlig in unserem Beishyspiel keiner der Differenzwerte groumlszliger als 005 ist so daszlig die auf der Basis der Faktorladungen ermittelte Korrelationsmatrix der urspruumlnglichen Korrelashytionsmatrix sehr aumlhnlich ist sie also sehr gut reproduziert
Abbildung 531 Die reproduzierte Korrelationsmatrix im 6-Produkte-Beispiel
Reproduzierte Korrelationen
UNGEFETT KALORIEN VITAMIN HALTBARK PREIS Reproduzierte Korre atlon UNGEFETT
KALORIEN
VITAMIN
HALTBARK
PREIS
96845 71193 96034 11035 04241
71193 52552b
70480
12709
07717
96034 70480 95292b
08461 01722
11035
12709 08461 99056b
8325
04241 07717 01722 98325 98070b
Residuun1 UNGEFETi
KALORIEN
VITAMIN
HALTBARK
PREIS
-00017 00101
-00141 00144
-00017
-00083 01001
- 01005
00101 -00083
-00036 00640
-00141 01061
-00636
00010
00144 -01005 00640 00010
ExtrakHonsmethode Hauptllchsenfaktorenanalyse
a Residuen werden zwischen beobachteten und reproduziel1en Korrelationen berecMet E gibt 0 (0) nichtrEidundante Residuen mit Absolutwel1en gt 005
b Reproduzierte Kommunalltaumlten
Vorgehensweise 295
Das aber bedeutet nichts anderes als daszlig sich die beiden gefundenen Faktoren ohshyne groszligen Inforrnationsverlust zur Beschreibung der fuumlnf Ausgangsvariablen eigshynen
Wegen der unterstellten spezifischen Varianz und des damit verbundenen Proshyblems der Kommunalitaumltenschaumltzung ist es klar daszlig durch die Rechenregel R = Amiddot A die Ausgangs-Korrelationsmatrix R nicht identisch reproduziert wershyden kann Dies gilt auch filr die Kommunalitaumlten Aus diesem Grunde kennshyzeichnen wir die reproduzierte Korrelationsmatrix als R
524 Zahl der Faktoren
(1) Variablenauswatll und Errechnung der KorrelaUonsmatrix
(2) Extraktion der Faktoren
(6) Bestimmung der Faktorwerte
Im vorangegangenen Abschnitt hatten wir uns willshykuumlrlich filr zwei Faktoren entschieden Generell ist zu bemerken daszlig zur Bestimmung der Faktorenzahl keine eindeutigen Vorschriften existieren so daszlig hier der subjektive Eingriff des Anwenders erforderlich ist Alshylerdings lassen sich auch statistische Kriterien hershyanziehen von denen insbesondere die folgenden als bedeutsam anzusehen sind - Kaiser-Kriterium Danach ist die Zahl der zu extrashyhierenden Faktoren gleich der Zahl der Faktoren mit Eigenwerten groumlszliger eins Die Eigenwerte (Eigenvashylues) werden berechnet als Summe der quadrierten Faktorladungen eines Faktors uumlber alle Variablen Sie sind ein Maszligstab filr die durch den jeweiligen Faktor erklaumlrte Varianz der Beobachtungswerte Der Begriff
Eigenwert ist deutlich vom erklaumlrten Varianzanteil zu trennen Letzterer beshyschreibt den Varianzerklaumlrungsanteil der durch die Summe der quadrierten Lashydungen aller Faktoren im Hinblick auf eine Variable erreicht wird (theoretischer oberer Grenzwert Kommunalitaumlt La ) waumlhrend der Eigenwert den Varianz bei-
q N
trag eines Faktors im Hinblick auf die Varianz aller Variablen beschreibt (La ) j N
Abbildung 532 zeigt nochmals die Faktorladungsmatrix aus Abbildung 530 auf wobei in Klammem jeweils die quadrierten Faktorladungen stehen Addiert man die Ladungsquadrate je Zeile so ergeben sich die Kommunalitaumlten der Varishyablen (vgl Abbildung 533) Von der Eigenschaft Anteil ungesaumlttigter Fettsaumlure werden folglich (08898 + 007786 = 09684) 9684 der Varianz durch die zwei extrahierten Faktoren erklaumlrt Die spaltenweise Summation erbringt die Eigenwerte der Faktoren die in Abbildung 532 in der untersten Zeile abgebildet werden
Die Begruumlndung filr die Verwendung des Kaiser-Kriteriums liegt darin daszlig ein Faktor dessen Varianzerklaumlrungsanteil uumlber alle Variablen kleiner als eins ist weshyniger Varianz erklaumlrt als eine einzelne Variable denn die Varianz einer standardishysierten Variable betraumlgt ja gerade L In unserem Beispiel fuumlhrt das Kaisershy
296 Faktorenanalyse
Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre
Abbildung 532 Bestimmung der Eigenwerte
Faktorenmatrix
Faktor
1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)
Eigenwerte 25068 19112
Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil
Kom munalltaumlten
Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807
- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren
V orgehensweise 297
Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung
Abbildung 534 Scree-Test im 6-Produkte-Beispiel
Eigen- Screeplot wert 30
25
20
15
Kaiser-Kriterium
10 1 Elbow5
00 2 3 4 5
Faktomummer
298 Faktorenanalyse
525 Faktorinterpretation
Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)
Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt
(1) Variablenauswalll und Errechnung der Korrelationsmalrix
(2) Extraktion der Faktoran
(3) Bestimmung der Kommunalltaumllen
(6) Bestimmung derFaktorwerte _______---11
middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull
geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht
Abbildung 535 Faktorladungen im 6-Produkte-Beispiel
Preis Haltbarkeit
Extraktionsmethode Hauptachsen-Faktorenanalyse
Vorgehensweise 299
Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist
Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig
Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16
Abbildung 536 Unrotierte Faktorladungen
F
F
Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung
Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f
300 Faktorenanalyse
536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy
tert
Abbildung 537 Rotierte Faktorladungen
F (Ausgangssituation)2
11 F2 (rotiert)
F1
-- shy
(Ausgangssituation)
11
F1 (rotiert)
SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen
1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen
(rechtwinkligen) Rotation
2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren
Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die
vorgenenswelse j U 1
Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind
Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel
Faktor
1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt
Haltbarkeit
72152 bull 07020
07962 I 99208 Preis 01060 99025
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung
Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen
A bull =A T mit TC~SI7 - sina ] sma cosa
Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links
A T A 094331 - 028039 098357 003229
[C0s341570 - sin34 157 ]070669 016156 072152 007020
sin34157deg cos34157092825 - 030210 097615 000694
038926 091599 007962 099208
032320 093608 001060 099025
Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)
Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix
Faktor 1 2
1 94868 31622
2 -31622 94868
Il
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung
Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig
von a=1843deg
526 Bestimmung der Faktorwerte
(1) Variablenauswanl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitaumlten
Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte
Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt
(3c)Z=PmiddotA
Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY
(12)Z AT1p AAT
Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt
(13)ZArl=pE
Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten
(3c) wird von rechts mit A multipliziert
ZmiddotA=PmiddotAmiddotA (15)
Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar
ZAmiddot(A At1=P(A A) (A Atl (16)
Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt
P=ZA(AAt l (17)
In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren
In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term
AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte
Abbildung 540 Koeffizientenmatrix der Faktorwerte
Faktor 1 2
Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression
Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die
xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf
SjDa p E=P ist ergibt sich
Seite 271 zu (14)
P=ZAT
304 Faktorenanalyse
Abbildung 541 Standardisierte Ausgangsdatenmatrix Z
45ampt6R4LJL4
Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542
Abbildung 542 Faktorwerte im 6-Produkte-Beispiel
Vorgehensweise 305
Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel
Du darfst
VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG
E 11 BecelS
U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T
Sanella IIII Holl Butter
-1
bull Rama
-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18
WIRTSCHAFTLICHKEIT
Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen
527 Zusammenfassende Darstellung der Faktorenanalyse
Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy
e Vorgehensweise 307 306 Faktorenanalyse
Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen
sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-
schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy
tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig
wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy
nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy
chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy
analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte
Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht
Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der
Verwendung des Verfahrens offenzulegen
I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _
CQ)l2CQgtQ ~ i
-Q)C t l5~11
0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C
CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O
~ ~ 11 t 3
uj~fi
t Imiddot~ J1 ~SHaa
It c~
c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~
-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi
o~ ~ -gEG)
I ~l c c ~l~ampi
2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E
U~a ]i E
J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy
~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--
----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt
Fallbeispiel 309308 Faktorenanalyse
Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert
531 Problemstellung
In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften
Variable und Objekte des BeispielsAbbildung 545
EigenschaftenMarken M k (k=I Il) xj(j=I IO)
A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado
5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H
I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama
Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist
Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)
Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern
Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse
---
310Faktorenanalyse
532 Ergebnisse
1 Variablenauswahl und Errechnung der Korrelationsmatrix
Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung
548 wiedergegeben
Abbildung 548 Die Korrelationskoeffizienten -_ -
-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy
In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der
Fallbeispiel 311
Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet
Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie
-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -
06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170
-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260
62444 -97126 66229 -83532 -62589
-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545
-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno
Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)
Abbildung 550 Dialogfeld Deskriptive Statistik
312 Faktorenanalyse
2 Bestimmung der Kommunalitilten
Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt
wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend
bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich
von den Startwerten abweichen
Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten
Hauptkomponentenanalyse Hauptachsenanalyse
Variable Korrunuriali- Kommunali- Korrununali- Kommunali-
Ut (Startwerte)
tlt (Endwerte)
tlIl (Startwerte )
tlIl (End werte)
STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR
100000 100000 100000 100000 100000 100000 100000 100000 100000 100000
88619
76855
89167 85324 76043 84012 80223 92668 63297 88786
97414
89018
79497
85847
96501
98810
97132
99166
78019
96445
85325
55717
85754
91075
55819
82330
73903
94796
40402
87851
Fallbeispiel 313
Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy
I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren
Abbildung 552 Dialogfeld Extraktion
Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist
3 Wabl der Extraktionsmetbode
Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen
4 Zabl der Faktoren
Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen
Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet
Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch
17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f
1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden
Erklaumlrte Gesamtvarianz
Anfaumlngliche Eigenwerte
314 Faktorenanalyse
Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy
den sich fUnfFaktoren ergeben
Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien
95) der Varianz erklaumlrt sind
2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)
3 Extrahiere n (zB 3) Faktoren
4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy
renzahl
5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein
6 Extrahiere alle Faktoren die nach der
Vom Computer automatisch verwandt wenn keine andere Spezifikation
Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden
Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden
Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist
Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt
Fallbeispiel 315
Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil
Faktor 1
2 3
4
5
6
7
8
9
10
Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden
Abbildung 555 Scree-Test und Kaiser-Kriterium
Eigen- -=gtcreeplot wert
5
4
3
2
10
o Kaisershy
~ 3 i i 7 i Q
Faktornummer
Gesamt 505188
177106
142700
81935
42961
24709
15928
06190
02943
00340
der Varianz 5051883
1771061
1427002
819349 429611
247085
159275
61902
29434
03398
Kumulierte 5051883
6822944
8249946
9069295
9498905
9745991
9905266
9967168
9996602
10000000
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
296 Faktorenanalyse
Kriterium zu der Extraktion von zwei Faktoren da bei der Extraktion eines dritten Faktors der entsprechende Eigenwert bereits kleiner 04 waumlre
Abbildung 532 Bestimmung der Eigenwerte
Faktorenmatrix
Faktor
1 2 UNGEFETT 094331 (08898) -028039 (00786) KALORIEN 070669 (04994) -016156 (00261) VITAMIN 092825 (08616) -030210 (00913) HALTBARK 038926 (01515) 091599 (08390) PREIS 032320 (01045) 093608 (087E)~)
Eigenwerte 25068 19112
Abbildung 533 Kommunalitaumlten als erklaumlrter Varianzanteil
Kom munalltaumlten
Extraktion UNGEFETT 9684 KALORIEN 5255 VITAMIN 9529 HALTBARK 9906 PREIS 9807
- Scree-Test Beim Scree-Test werden die Eigenwerte in einem Koordinatensyshystem nach abnehmender Wertefolge angeordnet Sodann werden die Punkte im Koordinatensystem durch Geraden verbunden Ausgehend von den sich asympshytotisch der Abzisse annaumlhernden Punkten entsteht an der Stelle an der die Difshyferenz der Eigenwerte zwischen zwei Faktoren am groumlszligten ist ein Knick (auch Elbow genannt) Der erste Punkt links von diesem Knick bestimmt die Anzahl der zu extrahierenden Faktoren Der Hintergrund dieser Vorgehensweise ist darshyin zu sehen daszlig die Faktoren mit den kleinsten Eigenwerten fuumlr Erklaumlrungszweshycke als unbrauchbar (Scree=Geroumlll) angesehen werden und deshalb auch nicht extrahiert werden Das Verfahren liefert allerdings nicht immer eindeutige Loumlshysungen da Situationen denkbar sind in denen sich aufgrund zT aumlhnlicher Difshyferenzen der Eigenwerte kein eindeutiger Knick ermitteln laumlszligt Abbildung 534 zeigt den Scree-Test fuumlr das 6-Produkte-Beispiel wonach hier zwei Faktoren zu extrahieren waumlren
V orgehensweise 297
Obwohl es dem Forscher prinzipiell selbst uumlberlassen bleibt welches Kriterium er bei der Entscheidung uumlber die Zahl zu extrahierender Faktoren zugrunde legt kommt in empirischen Untersuchungen haumlufig das Kaiser-Kriterium zur Anwendung
Abbildung 534 Scree-Test im 6-Produkte-Beispiel
Eigen- Screeplot wert 30
25
20
15
Kaiser-Kriterium
10 1 Elbow5
00 2 3 4 5
Faktomummer
298 Faktorenanalyse
525 Faktorinterpretation
Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)
Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt
(1) Variablenauswalll und Errechnung der Korrelationsmalrix
(2) Extraktion der Faktoran
(3) Bestimmung der Kommunalltaumllen
(6) Bestimmung derFaktorwerte _______---11
middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull
geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht
Abbildung 535 Faktorladungen im 6-Produkte-Beispiel
Preis Haltbarkeit
Extraktionsmethode Hauptachsen-Faktorenanalyse
Vorgehensweise 299
Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist
Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig
Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16
Abbildung 536 Unrotierte Faktorladungen
F
F
Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung
Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f
300 Faktorenanalyse
536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy
tert
Abbildung 537 Rotierte Faktorladungen
F (Ausgangssituation)2
11 F2 (rotiert)
F1
-- shy
(Ausgangssituation)
11
F1 (rotiert)
SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen
1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen
(rechtwinkligen) Rotation
2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren
Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die
vorgenenswelse j U 1
Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind
Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel
Faktor
1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt
Haltbarkeit
72152 bull 07020
07962 I 99208 Preis 01060 99025
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung
Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen
A bull =A T mit TC~SI7 - sina ] sma cosa
Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links
A T A 094331 - 028039 098357 003229
[C0s341570 - sin34 157 ]070669 016156 072152 007020
sin34157deg cos34157092825 - 030210 097615 000694
038926 091599 007962 099208
032320 093608 001060 099025
Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)
Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix
Faktor 1 2
1 94868 31622
2 -31622 94868
Il
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung
Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig
von a=1843deg
526 Bestimmung der Faktorwerte
(1) Variablenauswanl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitaumlten
Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte
Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt
(3c)Z=PmiddotA
Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY
(12)Z AT1p AAT
Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt
(13)ZArl=pE
Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten
(3c) wird von rechts mit A multipliziert
ZmiddotA=PmiddotAmiddotA (15)
Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar
ZAmiddot(A At1=P(A A) (A Atl (16)
Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt
P=ZA(AAt l (17)
In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren
In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term
AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte
Abbildung 540 Koeffizientenmatrix der Faktorwerte
Faktor 1 2
Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression
Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die
xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf
SjDa p E=P ist ergibt sich
Seite 271 zu (14)
P=ZAT
304 Faktorenanalyse
Abbildung 541 Standardisierte Ausgangsdatenmatrix Z
45ampt6R4LJL4
Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542
Abbildung 542 Faktorwerte im 6-Produkte-Beispiel
Vorgehensweise 305
Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel
Du darfst
VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG
E 11 BecelS
U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T
Sanella IIII Holl Butter
-1
bull Rama
-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18
WIRTSCHAFTLICHKEIT
Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen
527 Zusammenfassende Darstellung der Faktorenanalyse
Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy
e Vorgehensweise 307 306 Faktorenanalyse
Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen
sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-
schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy
tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig
wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy
nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy
chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy
analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte
Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht
Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der
Verwendung des Verfahrens offenzulegen
I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _
CQ)l2CQgtQ ~ i
-Q)C t l5~11
0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C
CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O
~ ~ 11 t 3
uj~fi
t Imiddot~ J1 ~SHaa
It c~
c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~
-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi
o~ ~ -gEG)
I ~l c c ~l~ampi
2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E
U~a ]i E
J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy
~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--
----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt
Fallbeispiel 309308 Faktorenanalyse
Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert
531 Problemstellung
In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften
Variable und Objekte des BeispielsAbbildung 545
EigenschaftenMarken M k (k=I Il) xj(j=I IO)
A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado
5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H
I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama
Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist
Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)
Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern
Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse
---
310Faktorenanalyse
532 Ergebnisse
1 Variablenauswahl und Errechnung der Korrelationsmatrix
Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung
548 wiedergegeben
Abbildung 548 Die Korrelationskoeffizienten -_ -
-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy
In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der
Fallbeispiel 311
Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet
Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie
-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -
06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170
-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260
62444 -97126 66229 -83532 -62589
-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545
-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno
Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)
Abbildung 550 Dialogfeld Deskriptive Statistik
312 Faktorenanalyse
2 Bestimmung der Kommunalitilten
Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt
wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend
bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich
von den Startwerten abweichen
Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten
Hauptkomponentenanalyse Hauptachsenanalyse
Variable Korrunuriali- Kommunali- Korrununali- Kommunali-
Ut (Startwerte)
tlt (Endwerte)
tlIl (Startwerte )
tlIl (End werte)
STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR
100000 100000 100000 100000 100000 100000 100000 100000 100000 100000
88619
76855
89167 85324 76043 84012 80223 92668 63297 88786
97414
89018
79497
85847
96501
98810
97132
99166
78019
96445
85325
55717
85754
91075
55819
82330
73903
94796
40402
87851
Fallbeispiel 313
Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy
I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren
Abbildung 552 Dialogfeld Extraktion
Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist
3 Wabl der Extraktionsmetbode
Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen
4 Zabl der Faktoren
Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen
Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet
Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch
17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f
1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden
Erklaumlrte Gesamtvarianz
Anfaumlngliche Eigenwerte
314 Faktorenanalyse
Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy
den sich fUnfFaktoren ergeben
Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien
95) der Varianz erklaumlrt sind
2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)
3 Extrahiere n (zB 3) Faktoren
4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy
renzahl
5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein
6 Extrahiere alle Faktoren die nach der
Vom Computer automatisch verwandt wenn keine andere Spezifikation
Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden
Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden
Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist
Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt
Fallbeispiel 315
Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil
Faktor 1
2 3
4
5
6
7
8
9
10
Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden
Abbildung 555 Scree-Test und Kaiser-Kriterium
Eigen- -=gtcreeplot wert
5
4
3
2
10
o Kaisershy
~ 3 i i 7 i Q
Faktornummer
Gesamt 505188
177106
142700
81935
42961
24709
15928
06190
02943
00340
der Varianz 5051883
1771061
1427002
819349 429611
247085
159275
61902
29434
03398
Kumulierte 5051883
6822944
8249946
9069295
9498905
9745991
9905266
9967168
9996602
10000000
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
298 Faktorenanalyse
525 Faktorinterpretation
Ist die Zahl der Faktoren bestimmt so muszlig anshyschlieszligend versucht werden die Faktoren die zunaumlchst rein abstrakte Groumlszligen (Vektoren) darstellen zu intershypretieren Dazu bedient man sich als Interpretationshilshyfe der Faktorladungen die rur unser Beispiel nochmals in Abbildung 535 wiedergegeben sind (vgl auch Abbildung 530)
Es zeigt sich daszlig der Faktor 1 besonders stark mit den Groumlszligen
- Anteil ungesaumlttigter Fettsaumluren - Kaloriengehalt - Vitamingehalt
(1) Variablenauswalll und Errechnung der Korrelationsmalrix
(2) Extraktion der Faktoran
(3) Bestimmung der Kommunalltaumllen
(6) Bestimmung derFaktorwerte _______---11
middotmiddotl korreliert Da hier eine Hauptachsenanalyse durchshybull
geruhrt wurde 1st danach zu fragen welche Ursache sich hinter diesem Zusammenhang verbirgt Hier sei unterstellt daszlig letztendlich der Gesundheitsaspekt rur das Beurteilungsverhalten der Befragten verantwortlich war und damit die Faktorladungen bestimmt hat Wir bezeichnen den ersten Faktor deshalb als Gesundheit Fuumlr die Variablen x4 und x5 sei unterstellt daszlig der Wirtshyschaftlichkeitsaspekt bei der Beurteilung im Vordergrund stand und der Faktor wird deshalb als Wirtschaftlichkeit charakterisiert An dieser Stelle wird besonshyders deutlich daszlig die Interpretation der Faktoren eine hohe Sachkenntnis des Anshywenders bezuumlglich des konkreten Untersuchungsobjektes erfordert Weiterhin sei nochmals darauf hingewiesen daszlig im Gegensatz zur Hauptachsenanalyse bei Anshywendung einer Hauptkomponentenanalyse die Interpretation der Faktoren der Sushyche nach einem Sammelbegriff rur die auf einen Faktor hoch ladenden Variablen entspricht
Abbildung 535 Faktorladungen im 6-Produkte-Beispiel
Preis Haltbarkeit
Extraktionsmethode Hauptachsen-Faktorenanalyse
Vorgehensweise 299
Die Faktorladungsmatrix in Abbildung 535 weist eine sogenannte Einjachstruktur auf d h die Variablen laden immer nur auf einem Faktor hoch und auf allen andeshyren Faktoren (in diesem 2-Faktorfall aufjeweils dem anderen Faktor) niedrig Bei groumlszligeren Felduntersuchungen ist dies jedoch haumlufig nicht gegeben und es faumlllt dann nicht leicht die jeweiligen Faktoren zu interpretieren Hier besteht nur die Moumlglichkeit das Faktonnuster offenzulegen so daszlig der jeweils interessierte Vershywender der Analyseergebnisse Eigeninterpretationen vornehmen kann Das bedeushytet allerdings auch daszlig gerade die Faktorinterpretation subjektive Beurteishylungsspielraumlume offenlaumlszligt Das gilt besonders dann wenn eine Interpretation weshygen der inhaltlich nicht konsistenten Ladungen schwierig ist
Der Anwender muszlig dabei haumlufig entscheiden ab welcher Ladungshoumlhe er eine Variable einem Faktor zuordnet Dazu sind gewisse Regeln (Konventionen) entshywickelt worden wobei in der praktischen Anwendung hohe Ladungen ab 05 angenommen werden Dabei ist allerdings darauf zu achten daszlig eine Variable wenn sie auf mehreren Faktoren Ladungen ~ 05 aufweist bei jedem dieser Faktoshyren zur Interpretation herangezogen werden muszlig
Laden mehrere Variable auf mehrere Faktoren gleich hoch dann ist es haumlufig unmoumlglich unmittelbar eine sinnvolle Faktorinterpretation zu erreichen (Abbilshydung 536) 16
Abbildung 536 Unrotierte Faktorladungen
F
F
Es laumlszligt sich mathematisch nachweisen daszlig die Aussagekraft einer Hauptachsen analyse durch Drehung (Rotation) des Koordinatenkreuzes in seinem Ursprung nicht veraumlndert wird Aus diesem Grunde wird zur Interpretationserleichterung haumlufig eine Rotation durchgefUhrt Dreht man das Koordinatenkreuz in Abbildung
Zur Beurteilung der Faktorladungsstruktur sowie der Faktorinterpretation vgl element MlLitfin Treichmann M-H 2000 S 285 f
300 Faktorenanalyse
536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy
tert
Abbildung 537 Rotierte Faktorladungen
F (Ausgangssituation)2
11 F2 (rotiert)
F1
-- shy
(Ausgangssituation)
11
F1 (rotiert)
SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen
1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen
(rechtwinkligen) Rotation
2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren
Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die
vorgenenswelse j U 1
Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind
Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel
Faktor
1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt
Haltbarkeit
72152 bull 07020
07962 I 99208 Preis 01060 99025
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung
Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen
A bull =A T mit TC~SI7 - sina ] sma cosa
Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links
A T A 094331 - 028039 098357 003229
[C0s341570 - sin34 157 ]070669 016156 072152 007020
sin34157deg cos34157092825 - 030210 097615 000694
038926 091599 007962 099208
032320 093608 001060 099025
Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)
Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix
Faktor 1 2
1 94868 31622
2 -31622 94868
Il
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung
Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig
von a=1843deg
526 Bestimmung der Faktorwerte
(1) Variablenauswanl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitaumlten
Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte
Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt
(3c)Z=PmiddotA
Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY
(12)Z AT1p AAT
Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt
(13)ZArl=pE
Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten
(3c) wird von rechts mit A multipliziert
ZmiddotA=PmiddotAmiddotA (15)
Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar
ZAmiddot(A At1=P(A A) (A Atl (16)
Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt
P=ZA(AAt l (17)
In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren
In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term
AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte
Abbildung 540 Koeffizientenmatrix der Faktorwerte
Faktor 1 2
Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression
Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die
xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf
SjDa p E=P ist ergibt sich
Seite 271 zu (14)
P=ZAT
304 Faktorenanalyse
Abbildung 541 Standardisierte Ausgangsdatenmatrix Z
45ampt6R4LJL4
Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542
Abbildung 542 Faktorwerte im 6-Produkte-Beispiel
Vorgehensweise 305
Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel
Du darfst
VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG
E 11 BecelS
U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T
Sanella IIII Holl Butter
-1
bull Rama
-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18
WIRTSCHAFTLICHKEIT
Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen
527 Zusammenfassende Darstellung der Faktorenanalyse
Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy
e Vorgehensweise 307 306 Faktorenanalyse
Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen
sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-
schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy
tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig
wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy
nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy
chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy
analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte
Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht
Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der
Verwendung des Verfahrens offenzulegen
I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _
CQ)l2CQgtQ ~ i
-Q)C t l5~11
0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C
CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O
~ ~ 11 t 3
uj~fi
t Imiddot~ J1 ~SHaa
It c~
c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~
-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi
o~ ~ -gEG)
I ~l c c ~l~ampi
2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E
U~a ]i E
J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy
~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--
----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt
Fallbeispiel 309308 Faktorenanalyse
Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert
531 Problemstellung
In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften
Variable und Objekte des BeispielsAbbildung 545
EigenschaftenMarken M k (k=I Il) xj(j=I IO)
A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado
5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H
I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama
Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist
Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)
Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern
Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse
---
310Faktorenanalyse
532 Ergebnisse
1 Variablenauswahl und Errechnung der Korrelationsmatrix
Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung
548 wiedergegeben
Abbildung 548 Die Korrelationskoeffizienten -_ -
-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy
In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der
Fallbeispiel 311
Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet
Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie
-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -
06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170
-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260
62444 -97126 66229 -83532 -62589
-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545
-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno
Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)
Abbildung 550 Dialogfeld Deskriptive Statistik
312 Faktorenanalyse
2 Bestimmung der Kommunalitilten
Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt
wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend
bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich
von den Startwerten abweichen
Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten
Hauptkomponentenanalyse Hauptachsenanalyse
Variable Korrunuriali- Kommunali- Korrununali- Kommunali-
Ut (Startwerte)
tlt (Endwerte)
tlIl (Startwerte )
tlIl (End werte)
STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR
100000 100000 100000 100000 100000 100000 100000 100000 100000 100000
88619
76855
89167 85324 76043 84012 80223 92668 63297 88786
97414
89018
79497
85847
96501
98810
97132
99166
78019
96445
85325
55717
85754
91075
55819
82330
73903
94796
40402
87851
Fallbeispiel 313
Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy
I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren
Abbildung 552 Dialogfeld Extraktion
Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist
3 Wabl der Extraktionsmetbode
Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen
4 Zabl der Faktoren
Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen
Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet
Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch
17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f
1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden
Erklaumlrte Gesamtvarianz
Anfaumlngliche Eigenwerte
314 Faktorenanalyse
Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy
den sich fUnfFaktoren ergeben
Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien
95) der Varianz erklaumlrt sind
2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)
3 Extrahiere n (zB 3) Faktoren
4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy
renzahl
5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein
6 Extrahiere alle Faktoren die nach der
Vom Computer automatisch verwandt wenn keine andere Spezifikation
Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden
Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden
Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist
Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt
Fallbeispiel 315
Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil
Faktor 1
2 3
4
5
6
7
8
9
10
Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden
Abbildung 555 Scree-Test und Kaiser-Kriterium
Eigen- -=gtcreeplot wert
5
4
3
2
10
o Kaisershy
~ 3 i i 7 i Q
Faktornummer
Gesamt 505188
177106
142700
81935
42961
24709
15928
06190
02943
00340
der Varianz 5051883
1771061
1427002
819349 429611
247085
159275
61902
29434
03398
Kumulierte 5051883
6822944
8249946
9069295
9498905
9745991
9905266
9967168
9996602
10000000
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
300 Faktorenanalyse
536 in seinem Ursprung so laumlszligt sich beispielsweise die Konstellation aus Abbildung 537 erreichen Jetzt laumldt das obere Variablenbuumlndel vor allem aufFakshytor 2 und das untere auf Faktor I Damit wird die Interpretation erheblich erleichshy
tert
Abbildung 537 Rotierte Faktorladungen
F (Ausgangssituation)2
11 F2 (rotiert)
F1
-- shy
(Ausgangssituation)
11
F1 (rotiert)
SPSS unterstuumltzt verschiedene Moumlglichkeiten zur Rotation des Koordinatenkreushyzes wobei grundsaumltzlich zwei Kategorien unterschieden werden koumlnnen
1 Sofern angenommen werden kann daszlig die Faktoren untereinander nicht korshyrelieren verbleiben die Faktorachsen waumlhrend der Drehung in einem rechten Winkel zueinander Es handelt sich hierbei um Methoden der orthogonalen
(rechtwinkligen) Rotation
2 Die Achsen werden in einem schiefen Winkel zueinander rotiert falls eine Korrelation zwischen den rotierten Achsen bzw Faktoren angenommen wird Hierbei spricht man von Methoden der obliquen (schiefwinkligen) Rotation Da allerdings die Unabhaumlngigkeitspraumlmisse der Faktoren (im statistischen Sinshyne) aufgegeben wird waumlre dann eine erneute Faktorenanalyse notwendig Empirische Untersuchungen haben allerdings gezeigt daszlig diese haumlufig zu kaum noch interpretierbaren Ergebnissen fuumlhren
Abbildung 538 zeigt das Ergebnis der rechtwinkligen Varimax-Rotation rur unser BeispieL Hierbei handelt es sich um eine sehr haumlufig angewendete Methode Die
vorgenenswelse j U 1
Ergebnisse zeigen daszlig die Faktorladungen auf die jeweiligen Faktoren jeweils noch houmlher geworden sind
Abbildung 538 Rotierte Varimax-Faktorladungsmatrix im 6-Produkte-Beispiel
Faktor
1 2 Anteil Ungesaumlttigter Fettsaumluren 98357 03229 Vitamingehalt 97615 00694 Kaloriengehalt
Haltbarkeit
72152 bull 07020
07962 I 99208 Preis 01060 99025
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung
Um die Rotation nachvollziehen zu koumlnnen sollte sich der Leser die Formel fuumlr eine orthogonale Transformation um einen Winkel a nach links vergegenwaumlrtigen
A bull =A T mit TC~SI7 - sina ] sma cosa
Im obigen Beispiel handelt es sich um eine Rotation um 1843deg nach rechts bzw um 34157deg nach links
A T A 094331 - 028039 098357 003229
[C0s341570 - sin34 157 ]070669 016156 072152 007020
sin34157deg cos34157092825 - 030210 097615 000694
038926 091599 007962 099208
032320 093608 001060 099025
Im SPSS-Output laumlszligt sich der Rotationswinkel anhand der Faktor Transformatishyonsmatrix bestimmen (vgl Abbildung 539)
Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix
Faktor 1 2
1 94868 31622
2 -31622 94868
Il
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung
Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig
von a=1843deg
526 Bestimmung der Faktorwerte
(1) Variablenauswanl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitaumlten
Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte
Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt
(3c)Z=PmiddotA
Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY
(12)Z AT1p AAT
Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt
(13)ZArl=pE
Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten
(3c) wird von rechts mit A multipliziert
ZmiddotA=PmiddotAmiddotA (15)
Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar
ZAmiddot(A At1=P(A A) (A Atl (16)
Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt
P=ZA(AAt l (17)
In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren
In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term
AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte
Abbildung 540 Koeffizientenmatrix der Faktorwerte
Faktor 1 2
Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression
Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die
xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf
SjDa p E=P ist ergibt sich
Seite 271 zu (14)
P=ZAT
304 Faktorenanalyse
Abbildung 541 Standardisierte Ausgangsdatenmatrix Z
45ampt6R4LJL4
Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542
Abbildung 542 Faktorwerte im 6-Produkte-Beispiel
Vorgehensweise 305
Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel
Du darfst
VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG
E 11 BecelS
U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T
Sanella IIII Holl Butter
-1
bull Rama
-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18
WIRTSCHAFTLICHKEIT
Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen
527 Zusammenfassende Darstellung der Faktorenanalyse
Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy
e Vorgehensweise 307 306 Faktorenanalyse
Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen
sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-
schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy
tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig
wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy
nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy
chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy
analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte
Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht
Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der
Verwendung des Verfahrens offenzulegen
I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _
CQ)l2CQgtQ ~ i
-Q)C t l5~11
0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C
CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O
~ ~ 11 t 3
uj~fi
t Imiddot~ J1 ~SHaa
It c~
c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~
-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi
o~ ~ -gEG)
I ~l c c ~l~ampi
2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E
U~a ]i E
J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy
~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--
----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt
Fallbeispiel 309308 Faktorenanalyse
Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert
531 Problemstellung
In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften
Variable und Objekte des BeispielsAbbildung 545
EigenschaftenMarken M k (k=I Il) xj(j=I IO)
A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado
5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H
I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama
Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist
Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)
Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern
Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse
---
310Faktorenanalyse
532 Ergebnisse
1 Variablenauswahl und Errechnung der Korrelationsmatrix
Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung
548 wiedergegeben
Abbildung 548 Die Korrelationskoeffizienten -_ -
-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy
In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der
Fallbeispiel 311
Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet
Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie
-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -
06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170
-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260
62444 -97126 66229 -83532 -62589
-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545
-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno
Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)
Abbildung 550 Dialogfeld Deskriptive Statistik
312 Faktorenanalyse
2 Bestimmung der Kommunalitilten
Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt
wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend
bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich
von den Startwerten abweichen
Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten
Hauptkomponentenanalyse Hauptachsenanalyse
Variable Korrunuriali- Kommunali- Korrununali- Kommunali-
Ut (Startwerte)
tlt (Endwerte)
tlIl (Startwerte )
tlIl (End werte)
STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR
100000 100000 100000 100000 100000 100000 100000 100000 100000 100000
88619
76855
89167 85324 76043 84012 80223 92668 63297 88786
97414
89018
79497
85847
96501
98810
97132
99166
78019
96445
85325
55717
85754
91075
55819
82330
73903
94796
40402
87851
Fallbeispiel 313
Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy
I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren
Abbildung 552 Dialogfeld Extraktion
Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist
3 Wabl der Extraktionsmetbode
Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen
4 Zabl der Faktoren
Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen
Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet
Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch
17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f
1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden
Erklaumlrte Gesamtvarianz
Anfaumlngliche Eigenwerte
314 Faktorenanalyse
Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy
den sich fUnfFaktoren ergeben
Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien
95) der Varianz erklaumlrt sind
2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)
3 Extrahiere n (zB 3) Faktoren
4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy
renzahl
5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein
6 Extrahiere alle Faktoren die nach der
Vom Computer automatisch verwandt wenn keine andere Spezifikation
Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden
Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden
Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist
Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt
Fallbeispiel 315
Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil
Faktor 1
2 3
4
5
6
7
8
9
10
Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden
Abbildung 555 Scree-Test und Kaiser-Kriterium
Eigen- -=gtcreeplot wert
5
4
3
2
10
o Kaisershy
~ 3 i i 7 i Q
Faktornummer
Gesamt 505188
177106
142700
81935
42961
24709
15928
06190
02943
00340
der Varianz 5051883
1771061
1427002
819349 429611
247085
159275
61902
29434
03398
Kumulierte 5051883
6822944
8249946
9069295
9498905
9745991
9905266
9967168
9996602
10000000
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
Vorgehensweise 303 302 Faktorenanalyse ~ Abbildung 539 Faktor Transfonnationsmatrix
Faktor 1 2
1 94868 31622
2 -31622 94868
Il
Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-NormaJisierung
Fuumlr das Bogenmaszlig 0~868 gilt filr den Cosinus ein entsprechendes Winkelmaszlig
von a=1843deg
526 Bestimmung der Faktorwerte
(1) Variablenauswanl und Errechnung der Korrelationsmatrix
(2) Extraktion der Faktoren
(3) Bestimmung der Kommunalitaumlten
Fuumlr eine Vielzahl von Fragestellungen ist es von groshyszligem Interesse nicht nur die Variablen auf eine gerinshygere Anzahl von Faktoren zu reduzieren sondern dashynach zu erfahren welche Werte die Objekte (Marken) nun hinsichtlich der extrahierten Faktoren annehmen Man benoumltigt also nicht nur die Faktoren selbst sonshydern auch die Auspraumlgung der Faktoren bei den Objekshyten bzw Personen Dieses bezeichnet man als das Problem der Bestimmung der Faktorwerte
Wie oben erlaumlutert ist es das Ziel der Faktorenshyanalyse die standardisierte Ausgangsdatenmatrix Z als Linearkombination von Faktoren darzustellen Es galt
(3c)Z=PmiddotA
Wir haben uns bisher mit der Bestimmung von A (Fakshytorladungen) beschaumlftigt Da Z gegeben ist ist die Gleichung (3c) nach den geshysuchten Faktorwerten P aufzuloumlsen Bei AUfloumlsunr nach P ergibt sich durch Multishyplikation von rechts mit der inversen Matrix (AY
(12)Z AT1p AAT
Da A -(A r 1 definitionsgemaumlszlig die Einheitsmatrix E ergibt folgt
(13)ZArl=pE
Fuumlr das in der Regel nicht quadratische Faktormuster A (es sollen ja gerade weshyniger Faktoren als Variable gefunden werden) ist eine Inversion nicht moumlglich Deshalb koumlnnte in bestimmten Faumlllen folgende Vorgehensweise eine Loumlsung bieshyten
(3c) wird von rechts mit A multipliziert
ZmiddotA=PmiddotAmiddotA (15)
Matrix (A A) ist definitionsgemaumlszlig quadratisch und somit invertierbar
ZAmiddot(A At1=P(A A) (A Atl (16)
Da (A A) (A A t 1 definitionsgemaumlszlig eine Einheitsmatrix ergibt gilt
P=ZA(AAt l (17)
In bestimmten Faumlllen koumlnnen sich bei der Loumlsung dieser Gleichung aber ebenfalls Schwierigkeiten ergeben Man benoumltigt dann Schaumltzverfahren zur Loumlsung dieses Problems Je nach Wahl des Schaumltzverfahrens kann daher die Loumlsung variieren
In vielen Faumlllen wird zur Schaumltzung der Faktorwerte auf die Regressionsanalyse (vgL Kapitell) zuruumlckgegriffen Fuumlr unser Beispiel ergab sich fuumlr den Term
AAmiddotArl die in Abbildung 540 aufgefuumlhrte Koeffizientenmatrix der Faktorwerte
Abbildung 540 Koeffizientenmatrix der Faktorwerte
Faktor 1 2
Anteil ungesaumlttigter Fettsaumluren 55098 -04914 Kaloriengehalt 01489 -01014 Vitamingehalt 42220 00081 Haltbarkeit 26113 67344 Preis -28131 33084 Extraktionsmethode Hauptachsen-Faktorenanalyse Rotationsmethode Varimax mit Kaiser-Normalisierung Methode fuumlr Faktorwerte Regression
Die standardisierte Ausgangsdatenmatrix Z multipliziert mit den Regressionsshykoeffizienten ergibt dann die in Abbildung 542 aufgefuumlhrten Faktorwerte Die
xkj-xstandardisierte Datenmatrix Z errechnet sich gemaumlszlig der Formel Zkj=__J auf
SjDa p E=P ist ergibt sich
Seite 271 zu (14)
P=ZAT
304 Faktorenanalyse
Abbildung 541 Standardisierte Ausgangsdatenmatrix Z
45ampt6R4LJL4
Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542
Abbildung 542 Faktorwerte im 6-Produkte-Beispiel
Vorgehensweise 305
Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel
Du darfst
VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG
E 11 BecelS
U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T
Sanella IIII Holl Butter
-1
bull Rama
-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18
WIRTSCHAFTLICHKEIT
Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen
527 Zusammenfassende Darstellung der Faktorenanalyse
Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy
e Vorgehensweise 307 306 Faktorenanalyse
Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen
sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-
schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy
tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig
wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy
nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy
chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy
analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte
Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht
Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der
Verwendung des Verfahrens offenzulegen
I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _
CQ)l2CQgtQ ~ i
-Q)C t l5~11
0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C
CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O
~ ~ 11 t 3
uj~fi
t Imiddot~ J1 ~SHaa
It c~
c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~
-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi
o~ ~ -gEG)
I ~l c c ~l~ampi
2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E
U~a ]i E
J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy
~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--
----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt
Fallbeispiel 309308 Faktorenanalyse
Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert
531 Problemstellung
In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften
Variable und Objekte des BeispielsAbbildung 545
EigenschaftenMarken M k (k=I Il) xj(j=I IO)
A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado
5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H
I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama
Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist
Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)
Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern
Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse
---
310Faktorenanalyse
532 Ergebnisse
1 Variablenauswahl und Errechnung der Korrelationsmatrix
Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung
548 wiedergegeben
Abbildung 548 Die Korrelationskoeffizienten -_ -
-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy
In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der
Fallbeispiel 311
Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet
Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie
-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -
06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170
-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260
62444 -97126 66229 -83532 -62589
-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545
-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno
Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)
Abbildung 550 Dialogfeld Deskriptive Statistik
312 Faktorenanalyse
2 Bestimmung der Kommunalitilten
Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt
wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend
bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich
von den Startwerten abweichen
Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten
Hauptkomponentenanalyse Hauptachsenanalyse
Variable Korrunuriali- Kommunali- Korrununali- Kommunali-
Ut (Startwerte)
tlt (Endwerte)
tlIl (Startwerte )
tlIl (End werte)
STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR
100000 100000 100000 100000 100000 100000 100000 100000 100000 100000
88619
76855
89167 85324 76043 84012 80223 92668 63297 88786
97414
89018
79497
85847
96501
98810
97132
99166
78019
96445
85325
55717
85754
91075
55819
82330
73903
94796
40402
87851
Fallbeispiel 313
Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy
I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren
Abbildung 552 Dialogfeld Extraktion
Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist
3 Wabl der Extraktionsmetbode
Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen
4 Zabl der Faktoren
Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen
Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet
Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch
17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f
1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden
Erklaumlrte Gesamtvarianz
Anfaumlngliche Eigenwerte
314 Faktorenanalyse
Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy
den sich fUnfFaktoren ergeben
Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien
95) der Varianz erklaumlrt sind
2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)
3 Extrahiere n (zB 3) Faktoren
4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy
renzahl
5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein
6 Extrahiere alle Faktoren die nach der
Vom Computer automatisch verwandt wenn keine andere Spezifikation
Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden
Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden
Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist
Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt
Fallbeispiel 315
Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil
Faktor 1
2 3
4
5
6
7
8
9
10
Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden
Abbildung 555 Scree-Test und Kaiser-Kriterium
Eigen- -=gtcreeplot wert
5
4
3
2
10
o Kaisershy
~ 3 i i 7 i Q
Faktornummer
Gesamt 505188
177106
142700
81935
42961
24709
15928
06190
02943
00340
der Varianz 5051883
1771061
1427002
819349 429611
247085
159275
61902
29434
03398
Kumulierte 5051883
6822944
8249946
9069295
9498905
9745991
9905266
9967168
9996602
10000000
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
304 Faktorenanalyse
Abbildung 541 Standardisierte Ausgangsdatenmatrix Z
45ampt6R4LJL4
Die Multiplikation der Matrix (6x5 in Abbildung 541 mit der Matrix (5x2] in Abbildung 540 ergibt sich zu der Faktorwerte-Matrix [6x2] in Abbildung 542
Abbildung 542 Faktorwerte im 6-Produkte-Beispiel
Vorgehensweise 305
Abbildung 543 Faktorwerte-Plot und rotierte Faktorladungen im 6-Produkte-Beispiel
Du darfst
VITAMINGEHALTrl FETTSAumlUREN KALORIENGEHALTG
E 11 BecelS
U N WeihnachlsbulterCl 0 H PREIS E -HALTBARKEIT I T
Sanella IIII Holl Butter
-1
bull Rama
-15 -09 -03 03 09 15-18 -12 -06 0 06 12 18
WIRTSCHAFTLICHKEIT
Die Faktorwerte lassen sich graphisch verdeutlichen und liefern damit eine Vishysualisienmg der beurteilten Margarinemarken im zweidimensionalen Faktorenshyraum (Abbildung 543) Gleichzeitig lassen sich in diese Darstellung unter Ruumlckshygriff auf die (rotierte) Faktorladungsmatrix (Abbildung 538) auch die Positionen der Faktoren uumlbertragen Damit erhaumllt der Anwender gleichzeitig einen optischen Anhaltspunkt dafuumlr wie stark die Achsen des Koordinatensystems (Faktoren) mit den Variablen in Verbindung stehen
527 Zusammenfassende Darstellung der Faktorenanalyse
Wie im einzelnen dargestellt sind zur Durchfilhrung einer Faktorenanalyse fUnf grundlegende Schritte notwendig um die Variablen einer Datenmatrix auf die den Daten zugrundeliegenden hypothetischen Faktoren zuruumlckzufilhren (Abbildung 544) wobei die Kantenliingen in Relation zueinander stehen In der Ausgangsdashytenmatrix X wird analog zum Beispiel davon ausgegangen daszlig die Zahl der Variashyblen (5) kleiner ist als die Zahl der Objekte (6) Die Korrelationsmatrix ist dagegen definitionsgemaumlszlig quadratisch Aus der Darstellung wird noch einmal deutlich welshy
e Vorgehensweise 307 306 Faktorenanalyse
Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen
sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-
schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy
tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig
wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy
nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy
chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy
analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte
Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht
Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der
Verwendung des Verfahrens offenzulegen
I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _
CQ)l2CQgtQ ~ i
-Q)C t l5~11
0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C
CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O
~ ~ 11 t 3
uj~fi
t Imiddot~ J1 ~SHaa
It c~
c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~
-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi
o~ ~ -gEG)
I ~l c c ~l~ampi
2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E
U~a ]i E
J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy
~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--
----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt
Fallbeispiel 309308 Faktorenanalyse
Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert
531 Problemstellung
In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften
Variable und Objekte des BeispielsAbbildung 545
EigenschaftenMarken M k (k=I Il) xj(j=I IO)
A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado
5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H
I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama
Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist
Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)
Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern
Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse
---
310Faktorenanalyse
532 Ergebnisse
1 Variablenauswahl und Errechnung der Korrelationsmatrix
Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung
548 wiedergegeben
Abbildung 548 Die Korrelationskoeffizienten -_ -
-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy
In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der
Fallbeispiel 311
Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet
Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie
-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -
06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170
-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260
62444 -97126 66229 -83532 -62589
-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545
-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno
Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)
Abbildung 550 Dialogfeld Deskriptive Statistik
312 Faktorenanalyse
2 Bestimmung der Kommunalitilten
Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt
wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend
bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich
von den Startwerten abweichen
Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten
Hauptkomponentenanalyse Hauptachsenanalyse
Variable Korrunuriali- Kommunali- Korrununali- Kommunali-
Ut (Startwerte)
tlt (Endwerte)
tlIl (Startwerte )
tlIl (End werte)
STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR
100000 100000 100000 100000 100000 100000 100000 100000 100000 100000
88619
76855
89167 85324 76043 84012 80223 92668 63297 88786
97414
89018
79497
85847
96501
98810
97132
99166
78019
96445
85325
55717
85754
91075
55819
82330
73903
94796
40402
87851
Fallbeispiel 313
Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy
I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren
Abbildung 552 Dialogfeld Extraktion
Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist
3 Wabl der Extraktionsmetbode
Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen
4 Zabl der Faktoren
Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen
Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet
Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch
17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f
1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden
Erklaumlrte Gesamtvarianz
Anfaumlngliche Eigenwerte
314 Faktorenanalyse
Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy
den sich fUnfFaktoren ergeben
Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien
95) der Varianz erklaumlrt sind
2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)
3 Extrahiere n (zB 3) Faktoren
4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy
renzahl
5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein
6 Extrahiere alle Faktoren die nach der
Vom Computer automatisch verwandt wenn keine andere Spezifikation
Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden
Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden
Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist
Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt
Fallbeispiel 315
Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil
Faktor 1
2 3
4
5
6
7
8
9
10
Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden
Abbildung 555 Scree-Test und Kaiser-Kriterium
Eigen- -=gtcreeplot wert
5
4
3
2
10
o Kaisershy
~ 3 i i 7 i Q
Faktornummer
Gesamt 505188
177106
142700
81935
42961
24709
15928
06190
02943
00340
der Varianz 5051883
1771061
1427002
819349 429611
247085
159275
61902
29434
03398
Kumulierte 5051883
6822944
8249946
9069295
9498905
9745991
9905266
9967168
9996602
10000000
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
e Vorgehensweise 307 306 Faktorenanalyse
Abbildung 544 Die R~chenschritte der Faktorenanalyse che Begriffe welchen Rechenoperationen bzw Rechenergebnissen zuzuordnen
sindZusammenfassend laumlszligt sich noch einmal festhalten Bei der Ermittlung der Fakshytorenwerte aus den Ausgangsdaten sind zwei verschiedene Arten von~ Rechen-
schritten notwendig _ solche die eindeutig festgelegt sind (die Entwicklung der standardisierten Dashy
tenmatrix und der Korrelationsmatrix aus der Datenmatrix) _ solche wo der Verwender des Verfahrens subjektiv eingreifen kann und muszlig
wo das Ergebnis also von seinen Entscheidungen abhaumlngt(zB die Kommushy
nalitaumltenschaumltzung) Geht man davon aus daszlig die erhobenen Daten das fuumlr die Korrelationsanalyse notwendige Skalenniveau besitzen d h sind sie mindestens intervallskaliert dann sind lediglich die ersten beiden Schritte von X nach Z und Z nach R manishypulationsjrei Alle anderen notwendigen Rechenschritte die in Abbildung 544 durch Pfeile gekennzeichnet sind sind subjektiven Maszlignahmen des Untersushy
chenden zugaumlnglich und erfordern die Eingriffe In den gaumlngigen Computerprogrammen fuumlr die DurchfUhrung einer Faktorenshy
analyse wird dieses Problem i d Rso geloumlst daszlig dem Anwender des Verfahrens fuumlr die einzelnen Entscheidungsprobleme Standardloumlsungen angeboten werden Der Anwender muszlig nur eingreifen wenn er eine andere Loumlsung anstrebt beishyspielsweise statt des automatisch angewendeten Kaiser-Kriteriums eine bestimmte Anzahl an zu extrahierenden Faktoren vorgeben moumlchte
Gerade diese Vorgehensweise ist jedoch immer dann houmlchst problematisch wenn dem Anwender die Bedeutung der einzelnen Schritte im Verfahren nicht klar ist und er das ausgedruckte Ergebnis als die Loumlsung ansieht
Um diesen Fehler vermeiden zu helfen und die Aussagekraft faktoranalytischer Untersuchungen beurteilen zu koumlnnen wird im folgenden eine Faktoranalyse anshyhand eines komplexeren konkreten Beispiels vorgestellt Um die einzelnen Reshychenschritte nachpruumlfen zu koumlnnen sind im Anhang die Ausgangsdatenmatrix soshywie die Mittelwerte uumlber die Befragten abgedruckt- Es werden verschiedene Loumlshysungen bei den einzelnen Teilproblemen im Rechengang der Faktoranalyse vorgeshystellt und kommentiert um so den moumlglichen Manipulationsspielraum bei der
Verwendung des Verfahrens offenzulegen
I I C I Ilaquo I _ Cj ca c e CIgt E~Q~lt ca ca l ~ CIgtQC 0 0 0 21$ ccouml1 c CIgt c- cagt CI)gt c ca 001 d Q ~ Cauml = CI) CIgt c CI) 0 -- _ c ~ ~ ICIgt jN caf O~~~og~ CIgt 0 _
CQ)l2CQgtQ ~ i
-Q)C t l5~11
0 C~ 32 es CIgt aCIgt~l l ampi ~ij Clgt2 0slt CIgt ~~f ~ h ~c ampi cg ~91l ca~ii)~eampi ~-g CIgt I CIgt2 ggt~ ~lt~EE ~i3 c CIgtiij ampi~c C
CIgt Qj 2 CIgt E CIgt CI) CIgtgt cl 2 ca- c ~~ a E CgtN 00 CIgt 0 OCI) _ CgtNl2 G)----------------------------------------------------------------shy Cgt~Ce15middotL ampi ij uj C cP e11 0~ ~o ~~ ~ cU aumli Q OOIgt Q) 9 c ~ 9J~~ l O
~ ~ 11 t 3
uj~fi
t Imiddot~ J1 ~SHaa
It c~
c Q)Cii c 00 Q) l ~f 9 ampi~ l5 c2 -5~C 0522lt ~ c gt ggt2J9 middot-LLl a~1ouml c2 c ~ ~ ~ C ~ = - ca CIgt (ij~CIgt CIgt- gj e- CIgt CIgti5bull Qj c ~ 1_ CIgt ~ I)lt ~ 000_ oc c E --------~-------------- Q ~~ -------------------shy ~~
-5 eOQ)Qaumli~i ii oc 25 5c c~ l ampi ]2laquoJ~tiCcctl0 cugtgt ~~~ --------1middot1 i sectsi~lt001 c ca calCIgtca ~8ampiLL ~iij sect CIgtl~CIgt c Egi
o~ ~ -gEG)
I ~l c c ~l~ampi
2~C~ sectg~ t C)fti6 ~~ 1ftI~ U) c 1~ij = CIgt cc ClE CI) c CIgt E ~C aumli Sl o~~~ ~~ -------------------------------- ~ ~ ~ ~o CIgt ~sct eEc0- E
U~a ]i E
J~~amp~ -~~ occC lCl) CIgt E ~ ~-5~ c couml ~~~~ijCl)CCIgtICI)ouml ~ijo ~ai~8N_8~ Elmiddotl Q) cN o~ll~~ i5~~~ ------------------------------------T-------------------shy
~161 ~~QQ~~~ ampi~~~~ 1$Cu cCO~ Nmiddot2l ~ aumli c~ 1 ~E ~ ~~ ampi~s g~2~82 I j)(=~lt ampi g-cc~ c C~I CIgt bull j iiNEc c Cgt~ CIgt Elmiddot1o CIgt CIgt CIgt ii lC CIgt SC sect CIgtgt_ojg iiCauml2c ca JlI N CI) 2 Cgta 8 l CI) ~ E 1ii E 2 2 ~ -U)--j-____--
----------------------_-----------------shy~ aic Cal c~ I Q)~CgtCIgt l CIgt ~ CIgt ampi2ic cc-~ ctI~ c ~- Cgt c 2-O~ 001 Cgt CIgt~ ampi CI)~CIgt ampi ----1~~agt~25 c~ ampiC~ ~ CIgt ~~~CIgtl~ ~~21ii~~ ~~~xxlt~o-JII~ Clgtca~-~ ilE~a E1iiE~~2 lt
Fallbeispiel 309308 Faktorenanalyse
Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert
531 Problemstellung
In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften
Variable und Objekte des BeispielsAbbildung 545
EigenschaftenMarken M k (k=I Il) xj(j=I IO)
A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado
5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H
I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama
Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist
Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)
Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern
Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse
---
310Faktorenanalyse
532 Ergebnisse
1 Variablenauswahl und Errechnung der Korrelationsmatrix
Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung
548 wiedergegeben
Abbildung 548 Die Korrelationskoeffizienten -_ -
-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy
In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der
Fallbeispiel 311
Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet
Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie
-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -
06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170
-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260
62444 -97126 66229 -83532 -62589
-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545
-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno
Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)
Abbildung 550 Dialogfeld Deskriptive Statistik
312 Faktorenanalyse
2 Bestimmung der Kommunalitilten
Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt
wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend
bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich
von den Startwerten abweichen
Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten
Hauptkomponentenanalyse Hauptachsenanalyse
Variable Korrunuriali- Kommunali- Korrununali- Kommunali-
Ut (Startwerte)
tlt (Endwerte)
tlIl (Startwerte )
tlIl (End werte)
STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR
100000 100000 100000 100000 100000 100000 100000 100000 100000 100000
88619
76855
89167 85324 76043 84012 80223 92668 63297 88786
97414
89018
79497
85847
96501
98810
97132
99166
78019
96445
85325
55717
85754
91075
55819
82330
73903
94796
40402
87851
Fallbeispiel 313
Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy
I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren
Abbildung 552 Dialogfeld Extraktion
Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist
3 Wabl der Extraktionsmetbode
Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen
4 Zabl der Faktoren
Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen
Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet
Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch
17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f
1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden
Erklaumlrte Gesamtvarianz
Anfaumlngliche Eigenwerte
314 Faktorenanalyse
Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy
den sich fUnfFaktoren ergeben
Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien
95) der Varianz erklaumlrt sind
2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)
3 Extrahiere n (zB 3) Faktoren
4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy
renzahl
5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein
6 Extrahiere alle Faktoren die nach der
Vom Computer automatisch verwandt wenn keine andere Spezifikation
Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden
Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden
Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist
Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt
Fallbeispiel 315
Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil
Faktor 1
2 3
4
5
6
7
8
9
10
Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden
Abbildung 555 Scree-Test und Kaiser-Kriterium
Eigen- -=gtcreeplot wert
5
4
3
2
10
o Kaisershy
~ 3 i i 7 i Q
Faktornummer
Gesamt 505188
177106
142700
81935
42961
24709
15928
06190
02943
00340
der Varianz 5051883
1771061
1427002
819349 429611
247085
159275
61902
29434
03398
Kumulierte 5051883
6822944
8249946
9069295
9498905
9745991
9905266
9967168
9996602
10000000
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
Fallbeispiel 309308 Faktorenanalyse
Der dabei anschlieszligend erzeugte Ergebnisausdruck wird im folgenden entsprechend bull53 Fallbeispiel der Analyseschritte des Kapitels 52 nachvollzogen und kommentiert
531 Problemstellung
In einer empirischen Erhebung wurden elf Emulsionsfette (Butter und Margarine) im Hinblick auf bestimmte Eigenschaften beurteilt Im einzelnen handelte es sich um die in Abbildung 545 angefuumlhrten Marken und Eigenschaften
Variable und Objekte des BeispielsAbbildung 545
EigenschaftenMarken M k (k=I Il) xj(j=I IO)
A StreichfaumlhigkeitI Sanella B Preis2 Homa C Haltbarkeit3 SB 0 Anteil ungesaumlttigter Fettsaumluren 4 Oelicado
5 Holl Marktenbutter Back- und Brateignung 6 Weihnachtsbutter E Geschmack7 Du darfst F Kaloriengehalt8 Becel G Anteil tierischer Fette 9 Botteram H
I Vitarningehalt10 Flora K Natuumlrlichkeit11 Rama
Abbildung 547 Dialogfeld Faktorenanalyse Es wurden 18 Personen bezuumlglich ihrer Einschaumltzung der 10 Marken befragt und anshyschlieszligend die Einzelurteile auf Markenebene uumlber Mittelwertbildung verdichtet Die durchschnittlichen Eigenschaftsurteile gehen pro Marke im folgenden als Datenmatshyrix in die Faktorenanalyse ein (vgl die Datenmatix in Abbildung 546) Da die Proshybanden alle Marken beurteilt haben kann nicht ausgeschlossen werden daszlig die Beshyurteilung der Marken voneinander abhaumlngen obwohl dies fuumlr die weitere Analyse unterstellt wird Bei empirischen Untersuchungen ist jedoch darauf zu achten daszlig die Annahme unabhaumlngiger Beurteilungen auch tatsaumlchlich erfuumlllt ist
Es sollte auf Basis dieser Befragung gepruumlft werden ob die zehn Eigenschaften alshyle unabhaumlngig voneinander zur (subjektiven) Beurteilung der Marken notwendig washyren oder ob bestimmte komplexere Faktoren eine hinreichend genaue Beurteilung geben In einem zweiten Schritt sollten die Marken entsprechend der Faktorenshyauspraumlgung positioniert werdenUm mit Hilfe des Programmes SPSS eine Faktorenshyanalyse durchfuumlhren zu koumlnnen wurde zunaumlchst das Verfahre~ der Faktorenanalyse aus dem MenUpunkt Dimensionsreduktion ausgewaumlhlt (vgl Abbildung 546)
Die untersuchten Variablen aus der Quellvariablenliste wurden danach in das Feld Variablen uumlbertragen (vgl Abbildung 547) und ausgewaumlhlte Voreinstellungen des Programmes SPSS wurden veraumlndert um die Aussagekraft des Outputs zu steigern
Abbildung 546 Dateneditor mit Auswahl des Analyseverfahrens Faktorenanalyse
---
310Faktorenanalyse
532 Ergebnisse
1 Variablenauswahl und Errechnung der Korrelationsmatrix
Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung
548 wiedergegeben
Abbildung 548 Die Korrelationskoeffizienten -_ -
-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy
In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der
Fallbeispiel 311
Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet
Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie
-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -
06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170
-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260
62444 -97126 66229 -83532 -62589
-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545
-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno
Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)
Abbildung 550 Dialogfeld Deskriptive Statistik
312 Faktorenanalyse
2 Bestimmung der Kommunalitilten
Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt
wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend
bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich
von den Startwerten abweichen
Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten
Hauptkomponentenanalyse Hauptachsenanalyse
Variable Korrunuriali- Kommunali- Korrununali- Kommunali-
Ut (Startwerte)
tlt (Endwerte)
tlIl (Startwerte )
tlIl (End werte)
STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR
100000 100000 100000 100000 100000 100000 100000 100000 100000 100000
88619
76855
89167 85324 76043 84012 80223 92668 63297 88786
97414
89018
79497
85847
96501
98810
97132
99166
78019
96445
85325
55717
85754
91075
55819
82330
73903
94796
40402
87851
Fallbeispiel 313
Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy
I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren
Abbildung 552 Dialogfeld Extraktion
Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist
3 Wabl der Extraktionsmetbode
Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen
4 Zabl der Faktoren
Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen
Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet
Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch
17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f
1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden
Erklaumlrte Gesamtvarianz
Anfaumlngliche Eigenwerte
314 Faktorenanalyse
Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy
den sich fUnfFaktoren ergeben
Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien
95) der Varianz erklaumlrt sind
2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)
3 Extrahiere n (zB 3) Faktoren
4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy
renzahl
5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein
6 Extrahiere alle Faktoren die nach der
Vom Computer automatisch verwandt wenn keine andere Spezifikation
Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden
Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden
Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist
Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt
Fallbeispiel 315
Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil
Faktor 1
2 3
4
5
6
7
8
9
10
Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden
Abbildung 555 Scree-Test und Kaiser-Kriterium
Eigen- -=gtcreeplot wert
5
4
3
2
10
o Kaisershy
~ 3 i i 7 i Q
Faktornummer
Gesamt 505188
177106
142700
81935
42961
24709
15928
06190
02943
00340
der Varianz 5051883
1771061
1427002
819349 429611
247085
159275
61902
29434
03398
Kumulierte 5051883
6822944
8249946
9069295
9498905
9745991
9905266
9967168
9996602
10000000
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
---
310Faktorenanalyse
532 Ergebnisse
1 Variablenauswahl und Errechnung der Korrelationsmatrix
Im ersten Schritt wird zunaumlchst die Datenmatrix standardisiert und in eine Korreshylationsmatrix uumlberfUhrt Dieser Schritt erfolgt manipulationsfrei d h es ist keine (subjektive) Entscheidung des Forschers erforderlich und er besitzt somit auch keine Eingriffsmoumlglichkeit Die Korrelationsmatrix der Margarinestudie ist in Abbildung
548 wiedergegeben
Abbildung 548 Die Korrelationskoeffizienten -_ -
-~I~ I ~ -66041-18589 -_79821shy -472351-76286-30614 = 3481533627 1084387996 28197- -38528100000 40694 0489608853-89955 -50802~shy 31659 03207_50281100000 5880338628 _11325 _ 0549421183100000 -14500_31859 1603087996 -20350-21866-30354_4175410000021163 44121middot89955 2186633627 45295 i5917888559100000 72025_30914 08653 06494 I -41754 51762ar und~ung 100000---shy 66559 7601481204 36665_47235 40894 -11325 I -30354- 10000051782~ 59176 87548100000 53309-78266 04896 -56603 I -21866 812048004045295 -shy 4557753309 100000_79821 28197 middot50261 I -20350 36665~WMiIWFtI 4337321866 10000087546 45577_18589 -10643 03207 I 16030 7601472025I 44121-66041J 34815 I -50802 I _14508--shy
In Abschnitt 5212 wurde ausfUhrlich dargelegt daszlig die Art und Weise der Beshyfragung die Struktur der Befragten sowie die Verteilungen der Variablen in der Ershyhebungsgesamtheit zu einer Verzerrung der Ergebnisse der Faktorenanalyse fUhren koumlnnen Diese Verzerrungen schlagen sich in der Korrelationsmatrix nieder und folglich kann die Eignung der Daten anband der Korrelationsmatrix uumlberpruumlft wershyden Bereits die Korrelationsmatrix macht deutlich daszlig in der vorliegenden Studie relativ haumlufig geringe Korrelationswerte auftreten (vgl zB die Variable Ungesaumltshytigte Fettsaumluren) und manche Korrelationen sogar nahe bei Null liegen (zB die Korrelation zwischen Backeignung und Preis) Bereits daraus laumlszligt sich schlieszligen daszlig diese Variablen fuumlr fakooranalytische Zwecke wenig geeignet sind Die in Abshyschnitt 5212 behandelten pruumlfkriterien bestaumltigen in der Summe diese Vermutung Beispielhaft sei hier jedoch nur das Kaiser_Meyer-Olkin-Kriterium naumlher betrachtet das flir die Korrelationsmatrix insgesamt nur einen Wert von 0437 erbrachte und damit die Korrelationsmatrix als untragbar fuumlr die Faktorenanalyse deklariert Welche Variablen dabei fuumlr dieses Ergebnis verantwortlich sind macht Abbildung 549 deutlich Das variablenspezifische Kaiser-Meyer-Olkin-Kriterium (MSAshyKriterium) ist auf der Hauptdiagonalen der Anti_Image-Korrelations-Matrix abgetrashygen und weist nur die Variablen Natuumlrlichkeit und Haltbarkeit als klaumlglich bzw ziemlich gut fuumlr faktoranalytische Zwecke aus Es ist deshalb angezeigt Vashyriable aus der Analyse sukzessive auszuschlieszligen (beginnend mit der Variablen Vishytamingehalt) bis alle variablespezifischen MSA-Kriterien groumlszliger als 05 sind In unserem Fall wuumlrde dieser Prozeszlig dazu fuumlhren daszlig insgesamt acht Variable aus der
Fallbeispiel 311
Analyse herausgenommen werden muumlszligten Aus didaktischen Gruumlnden wird hier jeshydoch auf den Ausschluszlig von Variablen verzichtet
Abbildung 549 Anti-Image-Korrelations-Matrix der Margarinestudie
-s_ -shy shy - shy-shy 78416-10512 -11143 61460 -84225 84398 33961 45777 33981 -62569 63545 -
06188 76538 61519 -56963 -29977 55128 -2670536966 -02622 Ha_ 13670 49691 -14387 -03962-10512 08166 74145 -10522 -41957 -14926 _ shy 76536 48550 48223 -22160 -15505 22193 -41600-11143 -10522 01675 eft1szligS aoblgnung -44676 37170
-84225 61460 61519 -41957 46223 266700 -66320 -66693 66260
62444 -97126 66229 -83532 -62589
-56983 13670 -22160 -88320 366600 46028-29977 49691 -15505 -66693 62444 48466 -53696 -52367 -AnttlllIiI Fttt 55728 -14367 66260 -97126 -7102622193 -83696 45227 5764083545
-75416 46028-26705 -14926 01675 -44876 66229 -71028 27607 -85216 84396 -03962 -41600 37170 -63532 -52367 57840 -65216 56052- 02822 ltIchshybull tMll_~nuno
Um im Rahmen der SPSS-Anwendung die beiden Eignungskriterien der Korrelatishyonskoeffizienten und die Anti-Image-Matrix zu erhalten sind im Dialogfeld Deshyskriptive Statistik die beiden Felder Koeffizienten der Korrelation und AntishyImage-Matrix auszuwaumlhlen Neben den in dieser Fallstudie vorgestellten Anwenshydungsmoumlglichkeiten der deskriptiven Statistik koumlnnen hier weitere Korrelationsausshywertungen selektiert werden (vgl Abbildung 550)
Abbildung 550 Dialogfeld Deskriptive Statistik
312 Faktorenanalyse
2 Bestimmung der Kommunalitilten
Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt
wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend
bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich
von den Startwerten abweichen
Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten
Hauptkomponentenanalyse Hauptachsenanalyse
Variable Korrunuriali- Kommunali- Korrununali- Kommunali-
Ut (Startwerte)
tlt (Endwerte)
tlIl (Startwerte )
tlIl (End werte)
STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR
100000 100000 100000 100000 100000 100000 100000 100000 100000 100000
88619
76855
89167 85324 76043 84012 80223 92668 63297 88786
97414
89018
79497
85847
96501
98810
97132
99166
78019
96445
85325
55717
85754
91075
55819
82330
73903
94796
40402
87851
Fallbeispiel 313
Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy
I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren
Abbildung 552 Dialogfeld Extraktion
Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist
3 Wabl der Extraktionsmetbode
Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen
4 Zabl der Faktoren
Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen
Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet
Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch
17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f
1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden
Erklaumlrte Gesamtvarianz
Anfaumlngliche Eigenwerte
314 Faktorenanalyse
Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy
den sich fUnfFaktoren ergeben
Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien
95) der Varianz erklaumlrt sind
2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)
3 Extrahiere n (zB 3) Faktoren
4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy
renzahl
5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein
6 Extrahiere alle Faktoren die nach der
Vom Computer automatisch verwandt wenn keine andere Spezifikation
Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden
Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden
Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist
Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt
Fallbeispiel 315
Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil
Faktor 1
2 3
4
5
6
7
8
9
10
Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden
Abbildung 555 Scree-Test und Kaiser-Kriterium
Eigen- -=gtcreeplot wert
5
4
3
2
10
o Kaisershy
~ 3 i i 7 i Q
Faktornummer
Gesamt 505188
177106
142700
81935
42961
24709
15928
06190
02943
00340
der Varianz 5051883
1771061
1427002
819349 429611
247085
159275
61902
29434
03398
Kumulierte 5051883
6822944
8249946
9069295
9498905
9745991
9905266
9967168
9996602
10000000
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
312 Faktorenanalyse
2 Bestimmung der Kommunalitilten
Bei diesem Schritt erfolgt der erste Eingriff des Anwenders in den Ablauf der Fakto renanalyse da eine Schaumltzung der Kommunalitaumlten also des Anteils der durch die gemeinsamen Faktoren zu erklaumlrenden Varianz der Variablen vorgenommen werden muszlig Wir wollen hier beide Verfahrensweisen die in Abschnitt 523 vorgestellt
wurden vergleichen Das Ergebnis der zwei Schaumltzverfahren ist in Abbildung 551 dargesteUtWaumlhrend
bei der Hauptkomponentenanalyse die Startwerte der Kommunalitaumltenschaumltzung immer auf eins festgelegt werden wird bei der Hauptachsenanalyse als Startwert immer das multiple Bestimmtheitsmaszlig der Variablen gewaumlhlt Die Analysen fUhren bei Extraktion von drei Faktoren zu den ebenfalls in Abbildung 551 aufgefUhrten Ergebnissen (Endwerten) Es wird deutlich daszlig die Endwerte zum Teil erheblich
von den Startwerten abweichen
Abbildung 551 Vergleich der geschaumltzten Kommunalitaumlten
Hauptkomponentenanalyse Hauptachsenanalyse
Variable Korrunuriali- Kommunali- Korrununali- Kommunali-
Ut (Startwerte)
tlt (Endwerte)
tlIl (Startwerte )
tlIl (End werte)
STREICHF PREIS HALTBARK UNGEFETT BACKEIGN GESCHMAC KALORIEN TlERFETT VITAMIN NATUR
100000 100000 100000 100000 100000 100000 100000 100000 100000 100000
88619
76855
89167 85324 76043 84012 80223 92668 63297 88786
97414
89018
79497
85847
96501
98810
97132
99166
78019
96445
85325
55717
85754
91075
55819
82330
73903
94796
40402
87851
Fallbeispiel 313
Modellen basieren Fuumlr die Margarinestudie sei unterstellt daszlig als Zielsetzung die Suche nach den hinter den Variablen stehenden hypothetischen Gtiinden formuliert wurde und damit die Korrelationen kausal interpretiert werden Im folgenden wird deshalb eine Hauptachsenanalyse angewendet HierfUr ist eine Aumlnderung der SPSS-Voreinstellungen erforderlich In der Dialogbox Faktorenanalyse Extraktion ist im Auswahlfenster Methode aus der sich oumlffnenshyden Liste Hauptachsen-Faktorenanalyse auszuwaumlhlen (vgl Abbildung 552) Neshyben den hier diskutierten zwei Extraktionsmethoden bietet SPSS eine Reihe von Exshytraktionsverfahren zur Auswahl Die Alternativen unterscheiden sich in dem vershywendeten Guumltekriterium das sie benutzen um mit Hilfe der extrahierten Fakoren eishy
I7nen moumlglichst hohen Varianzanteil der Ausgangsvariablen zu erklaumlren
Abbildung 552 Dialogfeld Extraktion
Bei der Hauptkomponentenanalyse liegt das aber nur darin begtiindet daszlig hier weshyniger Faktoren als Variable extrahiert wurden Wuumlrde man bei diesen beiden Verfahshyren ebenfalls 10 Faktoren extrahieren so wuumlrden die Start- und Endwerte der Kornshymunalitaumltenschaumltzung uumlbereinstimmen Bei der mit iterativer Kommunalitaumltenschaumltshyzung durchgefUhrten Hauptachsenanalyse sind die wahren Endwerte der Kommushynalitaumltenschaumltzung unbekannt und werden auf grund der Konvergenz des Iterationsshyprozesses (Konvergenzkriterium) bestimmt Fuumlr die weiteren Betrachtungen sind die Endwerte der Kommunalitaumltenschaumltzung jedoch von entscheidender Bedeutung da der Erklaumlrungswert der gefundenen Faktoren immer auch im Hinblick auf die zu~ grundeliegende Kommunalitaumlt zu beurteilen ist
3 Wabl der Extraktionsmetbode
Es wurde gezeigt daszlig die beiden grundlegenden Faktoranalyseverfahren Hauptshykomponentenanalyse und Hauptachsenanalyse auf unterschiedlichen theoretischen
4 Zabl der Faktoren
Die Zahl der maximal moumlglichen Faktoren entspricht der Zahl der Variablen Dann entspricht jeder Faktor einer Variablen Da aber gerade die Zahl der Faktoren kleiner als die der Variablen sein soll ist zu entscheiden wie viele Faktoren (Zahl der Fakshytorenlt Zahl der Variablen) extrahiert werden sollen
Wie bereits gezeigt existieren zur Loumlsung dieses Problems verschiedene Vorshyschlaumlge ohne daszlig auf eine theoretisch befriedigende Alternative zutiickgegriffen werden kann Beispielhafte Alternative die von SPSS unterstuumltzt werden sind in Abbildung 553 aufgelistet
Unabhaumlngig davon welches Kriterium man zur Extraktion der Faktoren vermiddot wendet ist es zunaumlchst sinnvoll so viele Faktoren zu extrahieren wie Variablen vorhanden sind Dies erfolgt bei Anwendung des Programmes SPSS automatisch
17 Fuumlr eine Erlaumluterung saumlmtlicher Extraktionsmethoden vgl Janssen J 1999 S 453 f
1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden
Erklaumlrte Gesamtvarianz
Anfaumlngliche Eigenwerte
314 Faktorenanalyse
Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy
den sich fUnfFaktoren ergeben
Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien
95) der Varianz erklaumlrt sind
2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)
3 Extrahiere n (zB 3) Faktoren
4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy
renzahl
5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein
6 Extrahiere alle Faktoren die nach der
Vom Computer automatisch verwandt wenn keine andere Spezifikation
Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden
Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden
Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist
Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt
Fallbeispiel 315
Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil
Faktor 1
2 3
4
5
6
7
8
9
10
Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden
Abbildung 555 Scree-Test und Kaiser-Kriterium
Eigen- -=gtcreeplot wert
5
4
3
2
10
o Kaisershy
~ 3 i i 7 i Q
Faktornummer
Gesamt 505188
177106
142700
81935
42961
24709
15928
06190
02943
00340
der Varianz 5051883
1771061
1427002
819349 429611
247085
159275
61902
29434
03398
Kumulierte 5051883
6822944
8249946
9069295
9498905
9745991
9905266
9967168
9996602
10000000
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
1 Extrahiere solange bis x (i d R 1 Kann ex post manuell bestimmt werden
Erklaumlrte Gesamtvarianz
Anfaumlngliche Eigenwerte
314 Faktorenanalyse
Hierbei wird allerdings unabhaumlngig von der gewaumlhlten Extraktionsmethode die anshyllingliche Loumlsung und die Zahl der Faktoren nach der Hauptkomponentenmethode bestimmt Die Anzahl der vorhandenen Variablen die in einem korrelierten Verhaumlltshynis zueinander stehen wird in diesem ersten Auswertungsschritt in eine gleich groszlige Anzahl unkorrelierter Variablen umgewandelt Die eigentliche Faktorenanalyse auf Basis der Hauptachsenmethode hat zu diesem Zeitpunkt folglich noch nicht stattgeshyfunden Abbildung 554 zeigt den entsprechenden SPSS-Ausdruck der automatisiershyten Hauptkomponentenanalyse Nach der Faustregel (95 Varianzerklaumlrung) wuumlrshy
den sich fUnfFaktoren ergeben
Abbildung 553 Ausgewaumlhlte Faktorextraktionskriterien
95) der Varianz erklaumlrt sind
2 Extrahiere nur Faktoren mit Eigenshywerten groumlszliger 1 (Kaiser-Kriterium)
3 Extrahiere n (zB 3) Faktoren
4 Scree-Test Die Faktoren werden nach Eigenwerten in abfallender Reihenshyfolge geordnet An die Faktoren mit den niedrigsten Eigenwerten wird eishyne Gerade angepaszligt Der letzte Punkt auf der Geraden bestimmt die Faktashy
renzahl
5 Zahl der Faktoren soU kleiner als die Haumllfte der Zahl der Variablen sein
6 Extrahiere alle Faktoren die nach der
Vom Computer automatisch verwandt wenn keine andere Spezifikation
Anzahl kann im Dialogfeld Extraktion ex ante manuell eingegeben werden
Erforderlicher Screeplot kann im Diashylogfeld Extraktion ebenfalls angeforshydert werden
Kann ex post manuell bestimmt werden sofern im Dialogfeld Extraktion die eingetragene Zahl zu extrahierender Faktoren nicht kleiner als die Haumllte der Zahl der Variablen ist
Kann nach Einstellung des erwuumlschten Rotationsprinzips ex post manuell beshystimmt
Fallbeispiel 315
Abbildung 554 Extrahierte Faktoren mit Eigenwerten und Varianze~klaumlrungsanteil
Faktor 1
2 3
4
5
6
7
8
9
10
Abbildung 555 zeigt die entsprechende Zahl der Faktoren fUr das Kaiser-Kriterium und den Scree-Test Waumlhrend nach dem Kaiser-Kriterium drei Faktoren zu extrahieshyren waumlren legt der Scree-Test eine Ein-Faktor-Loumlsung nahe Wegen der unterschiedshylichen Ergebnisse der drei Extraktionskriterien muszlig sich der Anwender subjektiv fUr eine der Loumlsungen entscheiden
Abbildung 555 Scree-Test und Kaiser-Kriterium
Eigen- -=gtcreeplot wert
5
4
3
2
10
o Kaisershy
~ 3 i i 7 i Q
Faktornummer
Gesamt 505188
177106
142700
81935
42961
24709
15928
06190
02943
00340
der Varianz 5051883
1771061
1427002
819349 429611
247085
159275
61902
29434
03398
Kumulierte 5051883
6822944
8249946
9069295
9498905
9745991
9905266
9967168
9996602
10000000
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
316 Faktorenanalyse
Im vorliegenden Fallbeispiel wird das Kaiser-Kriterium als Extraktionskriterium vershywendet Dies entspricht der Voreinstellung von SPSS
Um die Guumlte der 3-Faktorenloumlsung zu bestimmen sind weitere SPSS-Outputs naumlshyher zu betrachten (vgl Abbildung 556 bis Abbildung 558) Da es sich hierbei um keine anfaumlngliche Loumlsung (automatisierte Hauptkomponentenmethode) sondern um eine Loumlsung nach Durchfilhrung zahlreicher Iterations schritte handelt ist die zuvor ausgewaumlhlte Extraktionsmethode (Hauptachsenmethode) zur Anwendung gekomshymen
Bei zehn Variablen betraumlgt die Gesamtvarianz wegen der Normierung jeder Einshyzelvarianz auf den Wert von 1 gleich 10 Das bedeutet zB fuumlr den ersten Faktor in Abbildung 556 mit einem Eigenwert von 486417 im Verhaumlltnis zu 10 einen Erklaumlshyrungsanteil von ca 486 der Gesamtvarianz Insgesamt betraumlgt die Summe der drei Eigenwerte 752971 Setzt man diese Summe ins Verhaumlltnis zur Gesamtvarianz von 10 so ergibt sich ein durch die Faktoren erklaumlrter Varianzanteil von 753 (vgl Spalte Kumulierte in Abbildung 556)
Die in der Uumlbersicht ausgewiesenen Varianzerklaumlrungsanteile ( der Varianz) geshyben also an wieviel der jeweilige Faktor an Erklaumlrunganteil in bezug auf alle Ausshygangsvariablen besitzt Diese drei Faktoren erklaumlren zusammen 753 der Ausshygangsvarianz wobei der I Faktor 486 der 2 Faktor 147 und der 3 Faktor 120 der Ausgangsvarianz erklaumlren Der Eigenwert der drei Faktoren (erklaumlrter Teil der Gesamtvarianz eines Faktors) kann in der Spalte Gesamt abgelesen wershyden
Abbildung 556 Eigenwerte und Anteile erklaumlrter Varianz
Erklaumlrte Geaamtvarlanz
Summen von quadrierten Faktorladungen fOr
Faktor
Extraktion
der Gesamt Varianz Kumulierte
1 486417 4864 4864 2 146805 1468 6332 3 1L19749 _1197 ___7530
Extraktionsmethode Hauptachsen-Faktorenanalyse
Abbildung 557 enthaumllt die unrotierte Faktorladungsmatrix wobei die Faktorladunshygen der extrahierten Faktoren nach ihrer Ladungsgroumlszlige sortiert wurden Dabei wird deutlich daszlig die Variablen Anteil tierischer Fette Natuumlrlichkeit Streichflihigshykeit Kaloriengehalt Geschmack und Backeignung offenbar viel mit Faktor I zu tun haben waumlhrend Faktor 2 offenbar mit den Variablen Ungesaumlttigte Fettsaumlushyren Preis und Vitamingehaltf und Faktor 3 vor allem mit Haltbarkeit korreshyliert
Fallbeispiel 317 Abbildung 557 Faktorladungen
Fak10renmatrlx
- Faktor 1 2 3Anteil tierischer Fette 94758 22325 -01469
Natuumlrlichkeit 91885 16537 -08292Sireichfaumlhigkeil -86273 10548 31276Kaloriengehalt 83090 18542 -11935Geschmack 77638 09144 46062Bral- und Backeignung 54555 04984 50802Anteil ungesaumlttigter Fettsaumluren -40207 80846 -30900 Preis 40050 -62446 08261 Vitamingehalt 38346 48337 15273 ~a~e -563]3 ~39~ 6~8 Extraktionsmethode Hauptachsen-F aktorananalyse
Die iterativ geschaumltzten Kommunalitaumlten auf Basis der Hauptachsenanalyse werden in Abbildung 558 widergespiegelt (vgL auch Abbildung 551) Aufflillig ist dabei vor allem daszlig offenbar die Varianzanteile der Variablen Preis Backeignung und Vitamingehalt nur zu einem sehr geringen Teil durch die gefundenen Faktoren ershyklaumlrbar sind Daraus ergibt sich die Konsequenz daszlig diese Variablen tendenziell zu Ergebnisverzerrungen fuumlhren und von daher aus der Analyse ausgeschlossen werden sollten Dabei handelt es sich aber gerade um diejenigen Variablen die bereits nach dem Kaiser-Meyer-Olkin-Kriterium (vgl Abbildung 549) aus der Analyse auszushyschlieszligen waren Aus didaktischen Gruumlnden wird hier allerdings wiederum auf den Ausschluszlig von Variablen verzichtet
Abbildung 558 Kommunalitaumlten
Kommunalllllten
I Slrafchfaumlnigkeit Preis
Extraktion 85325 55717
Haltbarkeit 85754 Anteil ungesaumlttigter Fettsaumluren 91075
Brat- und Backeignung 55819 GeSChmack 82330 Kaloriengehaft 73903 Anteil tierischer Fette 94796 Vilamingehalt 40402NetOrlichkeij 87851 Extraktionsmethode Hauptachsen-Faktorenanalyse
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
318 Faktorenanalyse
Um aus den unendlich viele~ Moumlglichkeiten der Positionierung eines Koordishynatenkreuzes die beste d h interpretationsfaumlhigste bestimmen zu koumlnnen wird das oben ennittelte Faktorenmuster rotiert
Die rechtwinklige Rotation kann im zwei-dimensionalen (wie im drei-dimenshysionalen) Fall grundsaumltzlich auch graphisch erfolgen indem der Untersuchende vershysucht das Koordinatenkreuz so zu drehen daszlig moumlglichst viele Punkte im Koordinashytenkreuz (Faktorladungen) auf einer der beiden Achsen liegen Im Mehr-als-dreishyFaktoren-Fall ist es allerdings notwendig die Rotation analytisch vorzunehmen SPSS stellt hierfuumlr unterschiedliche Moumlglichkeiten der Rotation zur Verfuumlgung die bei Auswahl der Dialogbox Rotation erscheinen (vgl Abbildung 559)
Bei der hier angewendeten Varimax-Rotationsmethode handelt es sich um eine orshythogonale Rotation Die Faktorachsen verbleiben folglich bei der Rotation in einem rechten Winkel zueinander was unterstellt daszlig die Achsen bzw Faktoren nicht unshytereinander korrelieren Da die Rotation der Faktoren zwar die Faktorladungen nicht aber die Kommunalitaumlten des Modells veraumlndert ist die unrotierte Loumlsung primaumlr fuumlr die Auswahl der Anzahl an Faktoren und fuumlr die Guumltebeurteilung der Faktorloumlsung geeignet Eine Interpretation der ennittelten Faktoren ist auf Basis eines unrotierten Modells allerdings nicht empfehlenswert da sich durch Anwendung einer Rotatishyonsmethode die Verteilung des erklaumlrten Varianzanteils einer Variable auf die Faktoshy
ren veraumlndert
Abbildung 559 Dialogfeld Rotation
Die analytische Loumlsung von SPSS auf der Basis des Varimax-Kriteriums beim vorshyliegenden Beispiel zeigt Abbildung 560
hIlbeispiel JIY
Abbildung 560 Varimax-rotierte Faktormatrix
Rotierte Faktorenmatrix a
Faktor
1 2 3 Geschmack 84729 17468 -27365 Anteil tierischer Feite 73476 63626 -05711 Brat- und Backeignung 69978 -01333 26139 Vitamingehalt 55369 12349 28669 Haltbarkeit 12616 90249 16474 Strelchfahigkelt 36302 81410 24230 Natuumlrlichkeit 65040 67002 08109 Kaloriengehalt 57633 63728 02717 Anteil ungesattigter Fettsauren
12951 07381 94262
Preis 06852 23296 70584
Extraktionsmethode HauptachsenmiddotFaktorenanalyse Rotationsmethode Varlmax mit KaisermiddotNormalisierung
a Die Rotation ist in 7 Iterationen konvergiert
Vergleicht man die Loumlsung der rotierten Faktorladungen mit den unrotierten (Abbilshydung 557) dann zeigt sich eine erhebliche Veraumlnderung Nach Rotation laden zT andere Variable auf bestimmte Faktoren im Vergleich zur nicht rotierten Faktorshyladungsmatrix
5 Faktorinterpretation
Welche Interpretation laumlszligt diese Rotation zu Dazu wurden die jeweils positiv oder negativ hochladenden Variablen auf die jeweiligen Faktoren unterstrichen Zur Vershyanschaulichung ist es haumlufig sinnvoll die hochladenden Variablen - wie in Abbildung 561 dargestellt- mit einem + oder - (positive oder negative Korrelation) in bezug auf den jeweiligen Faktor zu kennzeichnen
Dabei wird deutlich daszlig Faktor 2 durch hohe Ladungen der Variablen Haltbarshykeit Streichflihigkeit Natuumlrlichkeit Kalonengehalt und Tierfette gekennshyzeichnet ist wobei die beiden erst genannten Variablen negativ auf den Faktor laden Versucht man nun eine Interpretation des zweiten Faktors vorzunehmen so muszlig inan sich bewuszligt sein daszlig hier eine Hauptachsenanalyse vorgenommen wurde d h es ist also nach hinter den Variablen stehenden Beurreilungsdimensionen gefragt Die negativen und positiven Ladungen sind damit erklaumlrbar daszlig bei natuumlrlichen Produkten meist der Anteil tierischer Fette der Kaloriengehalt und damit die Natuumlrlichkeit in einem gegensetzlichen Verhaumlltnis zu Haltbarkeit und Streichshyflihigkeit stehen Das bedeutet daszlig zB eine hohe Haltbarkeit und Streichfaumlhigshykeil meist mit geringem Anteil tierischer Fette Kaloriengehalt und damit Nashytuumlrlichkeit einhergeht Die Korrelationen zwischen diesen Variablen laumlszligt sich desshyhalb auf die Beurteilungsdimension Naturbelassenheit zuruumlckfUhren
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
Geschmack Tierfette Backeignung Vitamine Haltbarkeit Streichfaumlhigkeit Natuumlrlichkeit Kalorien Unges Fettsaumluren Preis
+ + + +
+ +
+
+ +
+
320 Faktorenanalyse
Abbildung 5(1 Schematische Darstellung der rotierten Faktorladungen
Der Leser moumlge selber versuchen unseren Interpretationsvorschlag fuumlr die beiden uumlbrigen Faktoren nachzuvollziehen Dabei wird schnell deutlich werden welche Schwierigkeiten eine gewissenhafte und sorgfaumlltige Interpretation (entsprechend dem theoretischen Modell des angewandten Verfahrens) bereiten kann
Haumlufig ist es allerdings notwendig die Daten detaillierter zu analysieren um die Ergebnisse einer Rotation richtig zu deuten Gerade beim Rotationsproblem eroumlffnen sich erhebliche Manipulationsspielraumlume Damit eroumlffnet die Faktorenanalyse auch
Spielraumlume rur Miszligbrauch
6 Bestimmung der Faktorwerte
Nach Extraktion der drei Faktoren interessiert haumlufig auch wie die verschiedenen Marken anhand dieser drei Faktoren beurteilt wurden Auf dieser Basis lassen sich beispielsweise Produktpositionierungen vornehmen Auch dazu sind Schaumltzungen notwendig Empirische Untersuchungen haben gezeigt daszlig je nach verwendeter Schaumltzmethode die Ergebnisse erheblich variieren koumlnnen In der Regel erfolgt die Schaumltzung der Faktorwerte die streng von den Faktorladungen zu trennen sind shywie auch in SPSS _ durch eine multiple Regressionsrechnung SPSS bietet drei Vershyfahren zur Schaumltzung von Faktorwerten an die zu unterschiedlichen Werten fUhren Zur Einstellung der gewuumlnschten Schaumltzmethode ist das Dialogfeld Werte auszushy
waumlhlen (vgl Abbildung 562)
Fallbeispiel 321
Abbildung 562 Dfalogfeld Werte
Abbildung 563 Die Faktorwerte in der Datenmatrix
Alle drei zur Verrugung stehenden Schaumltzverfahren ruhren zu standardisierten Fakshytorwerten mit einem Mittelwert von 0 und einer Standardabweichung von I Durch die Auswahl der hier verwendeten Methode Regression koumlnnen die zu ermittelnshyden Faktorwerte korrelieren obwohl- wie im Fall der Hauptachsenanalyse - die Fakshytoren orthogonal geschaumltzt wurden Die zur Ermittlung der Faktorwerte erforderlishychen Regressionskoefjizienten werden bei SPSS unter der Uumlberschrift Koeffizienshytenmatrix der Faktorwerte abgedruckt Hierbei handelt es sich nicht um die Faktorshy
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
Fallbeispiel 323l 322 Faktorenanalyse
werte sondern um die Gewichtungsfaktoren die mit den standardisierten Ausgangsshydaten multipliziert werden muumlssen um die entguumlltigen Faktorwerte zu errechnen Der Datenmatrix werden die Faktorwerte der einzelnen Faumllle bei SPSS als neue Vashyriablen (facl_l fac2_I und fac3_1) angehaumlngt (vgl Abbildung 563)
Fuumlr den Fall daszlig ftr bestimmte Variable einzelne Probanden keine Aussagen geshy
macht haben (Problem der missing values) gilt
(1) Die Fallzahl verringert sich ftr die entsprechende Variable (2) Fuumlr diesen Fall koumlnnen keine Faktorwerte berechnet werden
Da in unsere Analyse nicht die Aussagen der einzelnen Probanden eingingen (vgl dazu Kapiel 51) sondern filr die elf Marken die Mittelwerte uumlber alle Probanden
waren diese Effekte nicht relevant Stellt man die Faktorwerte der beiden ersten Faktoren graphisch dar (auf die Darshy
stellung des 3 Faktors wird aus Anschauungsgruumlnden verzichtet da dies eine dreishydimensionale Abbildung erfordern wuumlrde) so ergeben sich folgende Proshy
duktpositionen fUr die elf Aufstrichfette (Abbildung 564)
Abbildung 564 Graphische Darstellung der Faktorwerte
FaktoIWerteplot GesundheitlNaturbelassenheit
WeihnachlSbutter
125 Holl Butter G Du darfst E S bull OSlicadoBecel BottenamU SBN D 0 H E
SenellaI T Flor
-125 H bullbull Rama
oma
175-175 -105 -035 035 105
21-14 -07 0 07 14-21
NATURBELASSENHEIT
bezug auf die beiden Faktoren an (Faktorwerte) Produkt 3 (SB) hat beispielsweise die Koordinaten 0189-1970 (vgl die Werte in Abbildung 563) Bei einer 2shyfaktoriellen Loumlsung gibt diese Position an daszlig offenbar die Befragten die ja die urshyspruumlnglichen zehn Variablen bewertet hatten bei einer Buumlndelung der zehn Varishyablen zu zwei unabhaumlngigen Faktoren Produkt 3 in bezug auf Faktor I (Gesundheit) positiv und Faktor 2 (Naturbelassenheit) relativ negativ bewerten Entsprechendes gilt fuumlr die Bewertung (Positionierung) der uumlbrigen zehn Marken
Als Ergebnis zeigt sich daszlig zB die Marken HOMAtI und tlRAMA ebenso wie die Buttersorten (HolI Butter Weihnachtsbutter und Delicado Sahnebutter) im Vershygleich zu den uumlbrigen Produkten eine Extremposition einnehmen
Bei der inhaltlichen Interpretation der Faktorwerte ist darauf zu achten daszlig sie aufgrund der Standardisierung der Ausgangsdatenmatrix ebenfalls standardisierte Groumlszligen darstellen d h sie besitzen einen Mittelwert von 0 und eine Varianz von l Fuumlr die Interpretation der Faktorwerte bedeutet das folgendes
- Ein negativer Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten unterdurchschnittlich ausshygepraumlgt ist
- Ein Faktorwert von 0 besagt daszlig ein Produkt (Objekt) in bezug auf diesen Faktor eine dem Durchschnitt entsprechende Auspraumlgung besitzt
- Ein positiver Faktorwert besagt daszlig ein Produkt (Objekt) in bezug auf diesen Fakshytor im Vergleich zu allen anderen betrachteten Objekten uumlberdurchschnittlich ausshygepraumlgt ist
Damit sind zB die Koordinatenwerte der Marke SB mit 0189-1970 wie folgt zu interpretieren Bei SB wird die Gesundheit (Faktor 1) im Vergleich zu den uumlbrigen Marken als uumlberdurchschnittlich stark ausgepraumlgt angesehen waumlhrend die Naturshybelassenheit (Faktor 2) als nur unterdurchschnittlich stark ausgepraumlgt eingeschaumltzt wird Dabei ist zu beachten daszlig die Faktorwerte unter Verwendung aller Faktorshyladungen aus der rotierten Faktorladungsmatrix (Abbildung 560) berechnet werden Somit haben auch kleine Faktorladungen einen Einfluszlig auf die Groumlszlige der Faktorshywerte Das bedeutet in unserem Beispiel daszlig insbesondere die Faktorwerte bei Fakshytor I der einen Generalfaktor darstellt (d h durchgaumlngig vergleichbar hohe Ladungshyen aufweist) nicht nur durch die in Abbildung 560 unterstrichenen Werte bestimmt werden sondern auch alle anderen Variablen einen Einfluszlig - wenn z T auch nur einen geringen - auf die Bestimmung der Faktorwerte ausuumlben
Solche Informationen lassen sich zB fUr Marktsegmentierungsstudien verwenden indem durch die Faktorenanalyse Marktnischen aufgedeckt werden koumlnnen So finshydet sich zB im Bereich links unten (geringe Gesundheit und geringe Naturbelassenshyheit) kein Produkt Stellt sich heraus daszlig diese Kombination von Merkmalen fuumlr Emulsionsfette von ausreichend vielen Nachfragern gewuumlnscht wird so kann diese Marktnische durch ein neues Produkt mit eben diesen Eigenschaften geschlossen werden
Die Achsen stellen in Abbildung 564 die beiden ersten extrahierten Faktoren dar und die Punkte im Koordinatenkreuz geben die jeweiligen Positionen der Marken in
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
324 Faktorenanalyse
533 SPSS-Kommandos
Neben der Moumlglichkeit die oben aufgezeigte explorative Faktorenanalyse menugeshystUtzt durchzufuumlhren kann die Auswertung ebenfalls mit der nachfolgenden Syntashyxdatei gerechnet werden Die entsprechende Datei ist auf der Supportdiskette enthalshy
ten
Abbildung 565 SPSS-Kommandos zur Faktorenanalyse
Faktorenan~lyse
DATENDEFINITION --------------shyDATA LIST FlXEDstreichf Preis Haltbark ungefett Backeign GeschmaC Kalorien
Tierfett vitamin Natur 1-50(3) Marke 53-60(A)
BEGIN DATA4500 4000 4375 3875 3250 3750 4000 2000 4625 4125 SANELLA 5167 4250 3833 3833 2167 3750 3273 1857 3750 3417 HOMA 5059 3824 4765 343B 4235 4471 3765 1923 3529 3529 SB
4500 4000 4200 3900 3700 3900 3600 1500 3500 3700 RAMA
END DATA
PROZEDUR ~~~~~-~auPtachsenanalySe (PA21 fuumlr den Margarinemarkt FACTOR variables ~ Streichf to Natur
ANALYSIS = allIFORMAT sort I PRINT allIPLOT = eigen rotation (1 2)
EXTRACTION = pa2ROTATION =varimax SAVE REG (allfakw)SUBTITLE Ausgabe der Faktorwerte fuumlr alle Margarinemarken
FORMATS fakw1 to fakw3 (fB5JLIST VARIABLES = fakwl to fakw3 Marke
Literaturhinweise 325
54 Anwendungsempfehlungen
541 Probleme bei der Anwendung der Faktorenanalyse
5411 Unvollstaumlndig beantwortete Frageboumlgen Das Missing Value-Problem
bullBeim praktischen Einsatz der Faktorenanalyse steht der Anwender haumlufig vor dem Problem daszlig die Frageboumlgen nicht alle vollstaumlndig ausgefuumlllt sind Um die fehlenden Werte (missing values) im Programm handhaben zu koumlnnen bietet SPSS drei Optioshynen an Zur Auswahl einer der Alternativen ist die Dialogbox Optionen zu oumlffnen (vgl Abbildung 566)
Folgende Optionen stehen dem Anwender konkret zur Auswahl
1 Die Werte werden fallweise ausgeschlossen (Listenweiser Fallausschluszlig) d h sobald ein fehlender Wert bei einer Variablen auftritt wird der gesamte Frashygebogen aus der weiteren Analyse ausgeschlossen Dadurch wird die Fallzahl haumlufig erheblich reduziert
Abbildung 566 Das Dialogfeld Optionen
i I
2 Die Werte werden variablenweise ausgeschlossen (Faarweiser Fallausschluszlig1 d h bei Fehlen eines Wertes wird nicht der gesamte Fragebogen eliminiert sonshydern lediglich die betroffene Variable Dadurch wird zwar nicht die Fallzahl insshygesamt reduziert aber bei der Durchschnittsbildung liegen pro Variable untershyschiedliche Fallzahlen vor Dadurch kann es zu einer Ungleichgewichtung der Variablen kommen
3 Es erfolgt uumlberhaupt kein Ausschluszlig Fuumlr die fehlenden Werte pro Variable wershyden Durchschnittswerte (Durch Mittelwert ersetzen~ eingefuumlgt
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
__
J~U JCULVl UWUl)
Je nachdem welches Verfahren der Anwender zugrunde legt koumlnnen untershyschiedliche Ergebnisse resultieren so daszlig hier ein weiterer Manipulationsspielraum vorliegt
5412 Starke Streuung der Antworten Das Problem der Durchschnittsbildung
In unserem Fallbeispiel hatte die Befragung eine dreidimensionale Matrix ergeben (Abbildung 567)
18 Personen hatten 11 Objekte (Marken) anhand von 10 Eigenschaften beurteilt Diese dreidimensionale Datenmatrix hatten wir durch Bildung der Durchschnitte oshyber die 18 Personen auf eine zweidimensionale Objekte Variablen-Matrix vershydichtet Diese Durchschnittsbildung verschenkt aber die Informationen uumlber die pershysonenbezogene Streuung der Daten Ist diese Streuung groszlig wird also auch viel Inshyformationspotential verschenkt
Eine Moumlglichkeit die personenbezogene Streuung in den Daten mit in die Analyse einflieszligen zu lassen besteht darin die Beurteilung der jeweiligen Marke ft1r jede Person aufrecht zu erhalten indem jede einzelne Markenbeurteilung durch jede Pershyson als ein Objekt betrachtet wird Die dreidimensionale Matrix in Abbildung 567 wird dann zu einer vergroumlszligerten zweidimensionalen Matrix (Abbildung 568)
Abbildung 567 Der Datenquader
Personen
Variable
Objekte
In diesem Falle werden aus den urspruumlnglich (durchschnittlich) bewerteten 11 Obshyjekten (Marken) 11 x 18 198 Objekte (Da in unserem Fallbeispiel jedoch nicht alle Personen alle Marken beurteilt hatten ergaben sich nur 127 Obj ekte)
Vergleicht man die Ergebnisse des Durchschnittsverfahrens mit dem personenshybezogenen Objektverfahren dann koumlnnen erhebliche Unterschiede in den Ergebshy
nissen der Faktorenanalyse auftreten Abbildung 569 stellt die Ergebnisse bei einer Zweifaktoren-Loumlsung gegenuumlber
Abbildung 568 Die personenbezogene Objektmatrix
I VARIABLEN (Streichfaumlhigkeil usw)
Person 1
( 1) SANELLA Person ~
I Person 18
Person 1
Person 2 (2) HOMA
~1~ bullbull
IPerson 1
Person 2 (11) RAMA
Person 1~
Abbildung 569 Die Faktorladungen im Vergleich
Durchschnittsverfuhren Objektverfahren(N = 11)
(N = 127)
FAKTOR 1 FAKTOR 2 FAKTOR 1 FAKTOR 2 bullSTREICHF -77533 35540 29203PREIS -8849015782 82054 24729HALTBARK -00013-43414 29059 50559UNGEFETT -38055- 13003 80776 15111BACKEIGN -0529049826 -15191 58184GESCHMAC 1128771213 -21740 79836KALORIEN 2080786186 -07113 31326TIERFETT 3012998085 -10660 22904VITAMIN 6122051186 30277 62307NATUR 0399992891 -15978 53825 36232
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
328 Faktorenanalyse
Dabei wird deutlich daszlig sich die Faktorladungen z T erheblich verschoben haben Unterschiede ergeben sich auch in den Positionierungen der Marken anhand der Fakshytorwerte Abbildung 570 zeigt die Durchschnittspositionen der 11 Marken Vershygleicht man die Positionen von Rama und SB aus der Durchschnittspositionierung mit der personenbezogenen Positionierung in Abbildung 571 dann werden die Ershygebnisunterschiede besonders deutlich
Die Vielzahl unterdruumlckter Informationen bei der Mittelwertbildung fuumlhrt uumlber vershyschiedene Faktonnuster letztlich auch zu recht heterogenen Faktorwertstrukturen und damit Positionen Dadurch daszlig sich bei den Analysen unterschiedliche Faktorenshymuster ergeben sind die Positionierungen in letzter Konsequenz nicht mehr vershygleichbar
Abbildung 570 Die zweidimensionale Positionierung beim Durchschnittsverfahren
u+ ~ amp0
16
12
08 F a 04 k t 0 0 -04
-06 2
-12
-16
-20
-24
I
aSB
I
Weihnachtsbutter a a
(1) I Du darfst
(3) a Hall Butter
aDeficado
-24 -20 -16 -12 -06 -04 0 04 06 12 16 20 24 Faktor 1
(1) Ungeftt (6) Haltbarllert (2) llerfett (7) Natur (3) Preis (8) BackeIgnung I (4) SlreiChfaumll1igkel1 (9) Vitamin I (5) Kalorien (10) GesChmack I
Anwendungsempfehlungen 329 Abbildung 571 Die zweidimensionale Positionierung beim Objektverfahren
16
12 I 06 r
F 04 r a k t 0 0 r 2
1
bull
bullbull
bull -12 (4)bull
bull -16
-16 -12 -06 -004
bull SB-Elnzelbewertung - Botteram-Einzelbewertung
bull DurChSChniltabewertung der Margannearten
bull Weihnachtsbutter
bull Holl Butter
(2) bull DeJicado
(4) Sireichfahigkeil (9) Vitamin (5) Kalorien (10) Geschmack
0 004 08 12 16 Faktor 1
(1) Ungefett (6) Haltbarlleit (2) Tierfett (7) Natur (3) Preis
(6) Backeignung
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
331
330 Faktorenanalyse
5413 Entdeckungs- oder Begruumlndungszusammenhang E~ploratorische versus konfirmatorische Faktorenanalyse
Bei einer Vielzahl wissenschaftlicher und praktischer Fragestellungen ist es von Inshyteresse Strukturen in einem empirischen Datensatz zu erkennen Der Anwender hat keine konkreten Vorstellungen uumlber den Zusammenhang zwischen Variablen und es werden lediglich hypothetische Faktoren als verursachend filr empirisch beobachtete Korrelationen zwischen den Variablen angesehen ohne daszlig der Anwendet genaue Kenntnisse uumlber diese Faktoren besitzt In einer solchen Situation bietet die in dieshysem Kapitel beschriebene Faktorenanalyse ein geeignetes Analyseinstrumentarium zur Aufdeckung unbekannter Strukturen Die Faktorenanalyse ist damit im Hinblick auf den methodologischen Standort in den Entdeckungszusammenhang einzuordnen Sie kann deshalb auch als Hypothesengenerierungsinstrument bezeichnet werden und wir sprechen in diesem Fall von einer explorativen Faktorenanalyse Demgegenuumlber existieren bei vielen Anwendungsfaumlllen aber bereits apriori konkrete Vorstellungen uumlber moumlgliche hypothetische Faktoren die hinter empirisch beobachshyteten Korrelationen zwischen Variablen zu vermuten sind Aufgrund theoretischer Voruumlberlegungen werden Hypothesen uumlber die Beziehung zwischen direkt beobachtshybaren Variablen und dahinter stehenden nicht beobachtbaren Faktoren aufgestellt und es ist von Interesse diese Hypothesen an einem empirischen Datensatz zu pruumlshyfen Hier kann die Faktorenanalyse zur Hypothesenpruumljung herangezogen werden Wir befmden uns damit im Begruumlndungszusammenhang In solchen Anwendungsfaumllshylen spricht man von einer konfirmatorischen Faktorenanalyse Die konfirmatorische Faktorenanalyse basiert ebenfalls auf dem Fundamentaltheorem der Faktorenanalyse Die Anwendung einer solchen Faktorenanalyse setzt allerdings voraus daszlig der Anmiddot wender die Beziehungen zwischen beobachteten Variablen und Faktoren aufgrund intensiver theoretischer Uumlberlegungen vor Anwendung der Faktorenanalyse festlegt Die konfirmatorische Faktorenanalyse kann als Spezialfall von Stukturgleichungsashynalysen angesehen werden weshalb hier auf eine Darstellung dieser Analysemethoshyde verzichtet und der interessierte Leser auf die entsprechenden Ausfilhrungen in Kapitel 6 verwiesen wird
542 Empfehlungen zur Durchfuumlhrung einer Faktorenanalyse
Die obigen Ausfi1hrungen haben gezeigt daszlig eine Faktorenanalyse bei gleichen Ausshygangsdaten zu unterschiedlichen Ergebnissen fuumlhren kann je nachdem wie die subjektiv festzulegenden Einfluszliggroumlszligen eingestellt werden Gerade fuumlr denjenigen der neu in diesem Gebiet taumltig werden will moumlgen einige Empfehlungen (Abbildung 572) fi1r die vom Anwender subjektiv festzulegenden Groumlszligen eine erste Hilfestelshylung bedeuten Die Vorschlaumlge sind dabei daran orientiert inwieweit sie sich bei der Fuumllle bereits durchgefUhrter Faktorenanalysen bewaumlhrt haben
Abschlieszligend sei nochmals betont daszlig diese Empfehlungen lediglich an denshyjenigen gerichtet sind der sich neu mit der Faktorenanalyse befaszligt Die Leser die tiefer in die Materie eindringen moumlchten seien vor allem auf das Buch von UumlberIa
Anwendungsempfehlungen
verwiesen Hier finden sich weitere ins Detail gehende ErlaumluterungenEmpfehlungen 18
Abbildung 572
2 Erstellen der Ausgangsdatenmatrix 3 ErreChnen der Korrelationsmatrix 4 KommunaIitaumltenschaumltzung
5 Faktorextraktion
6 Bestimmung der Faktorenzahl 7 Rotation 8 Interpretation
18 VgL Oberla K 1972
- Daten muumlssen metrisch skaliert sein (mindestens Intervallskala)
- Fallzahl sollte mindestens der dreishyfachen Variablenzahl entsprechen mindestens aber der Zahl der Vashyriablen
- Eigene Vorgaben - Iterative Schaumltzung - Hauptachsenanalyse - Hauptkomponentenanalyse - Kaiser-Kriterium - Varimax-Kriterium - Houmlchstens Faktorladungen gt 05
verwenden (Konvention)
und
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
332 Faktorenanalyse -
55 Literaturhinweise
Child D (1973) The Essentials ofFactor Analysis 2 Aufl London ua Carroll J B (1993) Human Cognitive Abilities - A survey of factor-analytic studies
CambridgeClement MlLitfin Trreichmann M-H (2000) Beurteilung der Guumlte von explorativen Fakshy
torenanalysen im Marketing in Wissenschaftliches Studium (WiSt) 5 (2000) S 283-286 Cureton E EDAgostino R B (1983) Factor Analysis - An Applied Approach Hillsdale
New Jersey Dziuban C DlShirkey E C (1974) When is a Correlation Matrix Appropriate for Factor
Analysis in Psychological Bulletin Vol 81(6) S 358-361 Guttmann L (1953) Image Theory for the Structure of Quantitative Variates in
psychometrika 18 S 277-296 Harman H H (1976) Modem Factor Analysis 3 Aufl Chicago Hofstaumltter P R (1974) Faktorenanalyse in Koumlnig R (Hrsg) Handbuch der empirischen
Sozialforschung Bd 3 a 3 Aufl Stuttgart S 204-272 Huumlttner MlSchwerting K (1999) Explorative Faktorenanalyse in Herrmann AI Homburg
C (Hrsg) Marktforschung Wiesbaden S 381-412 Huumlttner M (1979) Informationen fUr Marketing-Entscheidungen Muumlnchen S 329-351 Janssen J (1999) Statistische Datenanalyse mit SPSS fUr Windows eine anwendungsshy
orientierte EinfUhrung in das Basissystem Version 8 und das Modul Exakte Tests 3 Aufl
Berlin ua Kaiser H F (1970) A Second Generation Little Jiffy in psychometrika 35 S 401-415 Kaiser H FlRice J (1974) Little Jiffy Mark IV in Educational and Psychological
Measurement 34 S 111-117 Kim J-OMueller C W (1986) Introduction to Factor Analysis Sage University Paper
Series Number 07-013 13 Aufl Beverly Hills London Loehlin J C (1998) Latent variable models factor path and structural analysis 3 Aufl
New Jersey Norusis M JSPSS Inc (Hrsg) (1992) SPSS for Windows Professional Statistics Release
5 ChicagoOst F (1984) Faktorenanalyse In Fahrrneir LI Hamerle A (Hrsg) Multivariate statistische
Verfahren Berlin ua S 575-662 Plinke W (1985) Erloumlsplanung im industriellen Anlagengeschaumlft Wiesbaden Revenstorf D (1976) Lehrbuch der Faktorenanalyse Stuttgart Stewart DW (1981) The Application and Misapplication of Factor Analysis in Marketing
Research in Journal ofMarketing Research 18 S 51-62 Uumlberla K ( 972) Faktorenanalyse 2 Aufl Berlin ua
6 Strukturgleichungsmodelle
61 Problemstellung 334 611 Grundgedanke von Strukturgleichungsmodellen 334 612 Grundlegende Zusammenhaumlnge der Kausalanalyse 340 6121 Begriff der Kausalitaumlt Kovarianz und Korrelation 340 6122 Die Uumlberpruumlfung kausaler Zusammenhaumlnge im Rahmen von
Strukturgleichungsmodellen mit latenten Variablen 344 613 Ablaufschritte eines Strukturgleichungsmodells 350
62 Vorgehensweise 353 621 Hypothesenbildung 353 622 Pfaddiagramm und Modellspezifikation 354 6221 Erstellung eines Pfaddiagramms 354 6222 Mathematische Spezifikation der Modellstruktur 356 6223 Parameter und Annahmen in Strukturgleichungsmodellen 358 623 Identifizierbarkeit der Modellstruktur 360 624 Schaumltzung der Parameter 362 6241 Spektrum iterativer Schaumltzverfahren 362 6242 Berechnung der Parameterschaumltzer mit Hilfe des
modelltheoretischen Mehrgleichungssystems 365 625 Beurteilung der Schaumltzergebnisse 370 6251 Plausibilitaumltsbetrachtungen der Schaumltzungen 370 6252 Statistische Testkriterien zur Pruumlfung der Zuverlaumlssigkeit der
Schaumltzungen 371 6253 Die Beurteilung der Gesamtstruktur 372 6254 Die Beurteilung der Teilstrukturen 376 626 Modifikation der Modellstruktur 378 6261 Vereinfachung der Modellstruktur 379 6262 Vergroumlszligerung der Modellstruktur 379
63 Fallbeispiel 381 631 Problemstellung 381 6311 Erstellung von Pfaddiagrammen mit Hilfe von AMOS und
Einlesen der Rohdaten 383 6312 Pfaddiagramm fUr das Fallbeispiel 385
top related