analisis faktor (factor analysis) - stat.ipb.ac.id · dalam bentuk matriks: (x ... variabel solusi...
TRANSCRIPT
ANALISIS FAKTOR
(FACTOR ANALYSIS)
PENDAHULUAN
Analisis faktor: mengkaji hubungan internal darigugus variabel
Data: peubah-peubah yang dianalisis berkorelasitinggi didalam grupnya sendiri dan berkorelasi
rendah dengan yang berbeda grup
Tujuan: untuk mempelajari beberapa sifat yangmendasar namun tidak dapat terobservasi
kuantitasnya
Tokoh: Charles Spearman yang mengemukakandalil bahwa korelasi internal dapat diwakilidengan menggunakan sebuah peubah ataufaktor yang dinamakan dengan faktor g.Selanjutnya faktor ini dikenal sebagai faktor
’kepintaran umum’ (general intelegence)
FORMULASI MODEL
FAKTOR
Misal vektor acak X dengan p komponen memiliki
rataan µ dan matriks peragam (covariance) Σ.
Pada umumnya model analisis faktor adalah:
X1 - µ1 = l11F1 + l12F2 + … +l1mFm + ε1
X2 - µ2 = l21F1 + l22F2 + … +l2mFm + ε2
:
:
:
Xp - µp = lp1F1 + lp2F2 + … +lpmFm + εp
FORMULASI MODEL
FAKTOR(lanjutan)
Dalam bentuk matriks:
(X - µ) = L F + ε(px1) (pxm) (mx1) (px1)
Keterangan:
µ = vektor rataan
L = matriks konstanta yang tidak diketahui
nilainya (loading factor)
F = vektor acak
ε = vektor unsur galat (faktor khusus)
FORMULASI MODEL
FAKTOR(lanjutan)
Dengan asumsi:
E(F) = 0, E(ε) = 0
Cov(F) = E(FF’) = I
Cov(ε) = E(ε ε’) = ψ = diag(ψ1,
ψ2,…, ψp)
F dan ε saling bebas
Cov(ε,F) = E(ε,F) = 0
FORMULASI MODEL
FAKTOR(lanjutan)
Struktur peragam dari model faktor
orthogonal:
Cov(X) = LL’ + ψ
atau
var(Xi) = l2i + … + l2im + ψi
cov(Xi,Xk) = li1 lk1 + … + lim lkm
Cov(X,F) = L
atau
cov(Xi,Fj) = lij
FORMULASI MODEL
FAKTOR(lanjutan)
Pembuktian struktur peragam:
.1Cov(X-µ) = cov(L F+ε)
= cov(L F)+cov(ε)+2cov(L F+ε)
= L cov(F) L’+ ψ +2L cov(L F+ε)
= L L’+ ψ
.2Cov(X,F) = cov(L F+ε ; F)
= cov(L F ; F)+cov(ε ; F)
= L cov(F)
= L (korelasi antara X dengan faktor)
FORMULASI MODEL
FAKTOR(lanjutan)
Komunalitas ke-i merupakan bagian
dari ragam peubah ke-i yang dapat
dijelaskan oleh m faktor umum.
hi2 = li1
2 + li22 + … + lim
2
dan
σii = hi2 + ψi ; I = 1,2, …,p
PERMASALAHAN
Ada tiga hal penting yang menjadi pokok
permasalahan dalam analisis faktor,
yaitu:
Mengidentifikasi struktur
Menduga parameter (loading faktor dan
ragam sistematik
Interpretasi faktor
PENDUGAAN PARAMETER
Metode
Metode non-iteratif Metode iteratif
Metode kemungkinan maksimum Metode kuadrat terkecil tak terboboti Metode komponen utama iteratif Harris Metode analisis faktor alpha
Metode komponen utama Metode faktor utama Analisis Citra Analisis faktor kanonik non-iteratif
KONSEP PENDUGAAN
Metode Komponen UtamaMisalkan R adalah matriks korelasi contoh
berukuran pxp, karena matriks R simetrik dandefinit positif maka bisa dituliskan sebagai
berikut:
R = ΓΛ Γ’
dengan:
Λ= diag(λ1,λ2,…λp) dan λ1>λ2>…>λp>0 adalahakar ciri dari matriks R, serta Γ Γ’= Γ’ Γ =Ip
Γ= matriks orthogonal pxp yang kolom-kolomnyaadalah vektor ciri matriks R yaitu,T1,T2,…,Tp yang berpadanan dengan vektor
ciri λ1,λ2,…,λp
Metode Komponen Utama (lanjutan)
Misalkan k adalah banyaknya komponen
utama yang dipilih, maka matriks L^
didefinisikan sebagai berikut:(pxp)
L^ = |√λ1Γ1|√λ2Γ2|…|√λkΓk|
R didekati dengan L^ L^ ‘=Σki=1λiΓiΓi’
dimana Γi adalah kolom ke-i pada matriks
Γ
Metode Komponen Utama (lanjutan)
Matriks diagonal ragam
khusus ψ diduga
dengan ψ^, yaitu
matriks diagonal yang
unsurnya diambil dari
R= L^ L^ ‘
2
2
2
2
1
100
010
0...01
ˆ
ph
h
h
.
.
.
Metode Komponen Utama (lanjutan)
Ukuran kebaikan suai dari model faktoradalah sebagai berikut:
RMS_overall = √(1/p(1-p))Σip
=1Σjp
=1resij2
Semakin kecil nilai RMS_overallmengindikasikan kebaikan suai yangtinggi. Model terbaik berdasarkan kriteriaini adalah jika diperoleh RMS-overall <0.05 dengan banyaknya faktor bersama
yang paling sedikit.
ILUSTRASI
Data harga saham terdiri dari
n=100 harga mingguan dengan p=5
saham. Dengan menggunakan metode
AKU didapatkan dua komponen
utama. Secara spesifik penduga
loading faktor adalah koefisien
komponen utama (vektor ciri dari R)
dibandingkan dengan akar kuadrat
dari akar ciri yang bersesuaian.
Tabel pendugaan loading faktor,komunalitas
dan total proporsi keragaman yang dijelaskan
dari setiap faktor untuk m=1 dan m=2
Variabel
Solusi satu
faktor
Solusi dua faktor
.1Allied
Chemical
.2DuPont
.3Union
Carbide
.4Exxon
.5Texaco
0.783
0.773
0.794
0.713
0.712
0.39
0.40
0.37
0.49
0.49
0.783
0.773
0.794
0.713
0.712
-0.217
-0.458
-0.234
0.472
0.524
0.34
0.19
0.31
0.27
0.22
Total proporsi
kumulatif
keragaman
yang dapat
dijelaskan
0.571 0.571 0.733
1F2~
1~ii h
1F 2F 2~1~
ii h
Proporsi untuk total keragaman dengan menggunakan solusi dua faktor lebih besar daripada hanya menggunakan satu faktor.
Faktor pertama merepresentasikan kondisi ekonomi secara umum dan dapat disebut faktor pasar. Faktor kedua merupakan kontras antra saham perusahaan kimia dengan saham perusahaan minyak (pada faktor perusahaan kimia memiliki loading negatif yang relatif besar dan perusahaan minyak memiliki loading positif yang relatif besar). Dengan demikian faktor kedua dapat disebut faktor industri karena sebagai pembeda harga saham di industri yang berbeda.
Komunalitas
Dengan m=2,
Matriks residual untuk solusi 2 faktor
adalah
66.0)217.0()783.0(~~~ 222
12
2
11
2 ih
0232.0017.0012.0017.0
232.00019.0055.0069.0
017.0019.00122.0164.0
012.0055.0122.00127.0
017.0069.0164.0127.00
~'~~
LLR
Metode Kemungkinanan Maksimum
Metode kemungkinan maksimum (MKM)mengasumsikan bahwa matriks ragam-peragam atau
matriks korelasi semua peubah bersifat non-singular.
Fungsi kepekatan bagi S adalah:
L(S)=c
dengan c adalah konstanta. Sehingga log-likelihood dariL dan ψ, jika Σ = LL’ + ψ adalah:
Penduga kemungkinan maksimum bagi L dan ψdiperoleh dengan memaksimumkan persamaan diatasdengan kendala k(k-1)/2 persyaratan keunikan
(Johnson&Wichern,1998).
)(2
1
2
1
2
1
2
1 1 Strnpnn
eS
|]})'(|ln})'[({2
1ln 11 SLLSLLtr
nc
Penentuan banyaknya faktor bersama
Uji Nisbah Kemungkinan (likelihood ratio
test)
Hipotesis nol yang diuji pada uji nisbah
kemungkinan ini adalah:
H0: Σ = LL’+ψ, r(L)=k diketahui
Misalkan , dan = + adalah
penduga kemungkinan maksimum bagi
L, ψ dan Σ, jika H0 benar, maka nilai
maksimum untuk log dari fungsi
kemungkinannya adalah:
L
L
^
L
Uji Nisbah Kemungkinan (likelihood ratio test): (lanjutan)
SSSStrn
cLH
11* ln2
1ln
0
pn
c2
1*
L
LH0ln2ln2 Statistik uji nisbah kemungkinan yaitu
Menyebar khi-kuadrat dengan kpkpdb 22
1
Jadi, hipotesis nol ditolak jika kpkpdbH
L
L
20
21;
2ln2
Penentuan banyaknya faktor bersama(lanjutan)
Akaike’s information Criterion(AIC)
Statistik AIC untuk model dengan k
faktor didefinisikan sebagai berikut:
AIC(k)=-2ln L(k)+[2p(k+1)-k(k-1)]
Model berfaktor k dengan k adalah
nilai yang berpadanan dengan AIC (k)
yang paling kecil dianggap sebagai
model terbaik
Data harga saham dianalisa kembali dengan
menggunakan metode maksimum likelihood
dengan tetap memakai dua model faktor
Komunalitas dengan menggunakan metode
maksimum likelihood adalah:
Matriks residualnya adalah:
50.0)189.0()684.0(ˆˆˆ 222
2
2
1
2 iiih
0000.0004.0000.0004,0
000.00031.0004.0024.0
004.0031.00003.0004.0
000.0004.0003.00005.0
004.0024.0004.0005.00
'ˆˆ LLR
Tabel pendugaan faktor loading, komunalitas,
ragam khusus dan total proporsi keragaman
contoh yang dapat dijelaskan
Variabel Maksimum likelihood Komponen utama
Penduga faktor Penduga faktor
.1Allied
Chemical
.2DuPont
.3Union
Karbide
.4Exxon
.5Texaco
0.684
0.694
0.681
0.621
0.792
0.189
0.517
0.248
-0.073
-0.442
0.50
0.25
0.47
0.61
0.18
0.783
0.773
0.794
0.713
0.712
-0.217
-0.458
-0.234
0.412
0.524
0.34
0.19
0.31
0.27
0.22
Total proporsi
kumulatif
keragaman
contaoh yang
dapat dijelaskan
0.485 0.598 0.571 0.733
2~1~
ii h2~
1~ii h
Interpretasi
Elemen matriks residual pada maximum
likelihood lebih kecil dari pada matriks
residual pemfaktoran komponen utama.
Total proporsi kumulatif keragaman pada
faktor komponen utama lebih besar
dibandingkan faktor maximum likelihood.
Maka tidak mengherankan bila kriteria
pemfaktoran komponen utama lebih dipilih.
Loading yang didapatkan dari analisis
faktor komponen utama berhubungan
dengan komponen utama yang
mengoptimumkan keragaman.
Lanjutan …
Pada solusi maximum likelihood semua
variabel pada faktor pertama memiliki loading
yang positif dan relatif besar. Faktor tersebut
disebut faktor pasar. Faktor loading yang
kedua memiliki tanda yang konsisten dengan
kontras atau faktor industri, tapi magnitudo-
nya relatif kecil dibeberapa kasus. Mungkin
dapat diidentifikasikan bahwa faktor ini adalah
pembandingan antara DuPont dan Texaco
ROTASI FAKTOR
Dipergunakan untuk memudahkan interpretasi
Merupakan transformasi ortogonal dari loading factors
L*= LT
dimana TT’=T’T=I
Beberapa jenis transformasi yaitu, varimax, oblique, quartimax, dan
lain-lain
ROTASI FAKTOR(lanjutan)
Rotasi Varimax
Merupakan rotasi yang paling sering
dipergunakan pada aplikasi. Merupakan
transformasi ortogonal yang diperoleh
dengan cara memaksimumkan:
k
j
p
i
p
i i
ij
i
ij
h
l
ph
l
p1 1
2
1
222* 11
ROTASI FAKTOR(lanjutan)
Rotasi Oblique
Digunakan apabila transformasi
ortogonal terhadap matriks loading
faktor menghasilkan faktor yang
masih sulit diinterpretasikan.
ROTASI FAKTOR(lanjutan)
Rotasi quartimax
Transformasi ortogonal dengan tujuan
memperoleh
yang memaksimumkan j
ij
i
l4*
L Adalah matriks loading faktor yang ingin ditransformasi menggunakan matriks
ortogonal
menjadi LL*
sehingga
j j i
ijij
ij
ij
i
ij
i
lPk
lPk
lPk
lPk
2*4*2*4* 1111
Mencapai maximum.
Data harga saham dianalisa kembali dengan
menggunakan metode maksimum likelihood
dengan tetap memakai dua model faktor
Komunalitas dengan menggunakan metode
maksimum likelihood adalah:
Matriks residualnya adalah:
50.0)189.0()684.0(ˆˆˆ 222
2
2
1
2 iiih
0000.0004.0000.0004,0
000.00031.0004.0024.0
004.0031.00003.0004.0
000.0004.0003.00005.0
004.0024.0004.0005.00
'ˆˆ LLR
Tabel pendugaan faktor loading, komunalitas,
ragam khusus dan total proporsi keragaman
contoh yang dapat dijelaskan
Variabel Maksimum likelihood Komponen utama
Penduga
faktor
Penduga faktor
.1Allied
Chemical
.2DuPont
.3Union
Karbide
.4Exxon
.5Texaco
0.684
0.694
0.681
0.621
0.792
0.189
0.517
0.248
-0.073
-0.442
0.50
0.25
0.47
0.61
0.18
0.783
0.773
0.794
0.713
0.712
-0.217
-0.458
-0.234
0.412
0.524
0.34
0.19
0.31
0.27
0.22
Total proporsi
kumulatif
keragaman
contaoh yang
dapat dijelaskan
0.485 0.598 0.571 0.733
2~1~
ii h2~1~
ii h
1F 2F 1F 2F
Interpretasi
Elemen matriks residual pada maximum
likelihood lebih kecil dari pada matriks
residual pemfaktoran komponen utama.
Total proporsi kumulatif keragaman pada
faktor komponen utama lebih besar
dibandingkan faktor maximum likelihood.
Maka tidak mengherankan bila kriteria
pemfaktoran komponen utama lebih dipilih.
Loading yang didapatkan dari analisis
faktor komponen utama berhubungan
dengan komponen utama yang
mengoptimumkan keragaman.
Lanjutan …
Pada solusi maximum likelihood semua
variabel pada faktor pertama memiliki loading
yang positif dan relatif besar. Faktor tersebut
disebut faktor pasar. Faktor loading yang
kedua memiliki tanda yang konsisten dengan
kontras atau faktor industri, tapi magnitudo-
nya relatif kecil dibeberapa kasus. Mungkin
dapat diidentifikasikan bahwa faktor ini adalah
pembandingan antara DuPont dan Texaco