p12 analisis variansi (anova)
DESCRIPTION
Penjelasan mengenai uji analisis anova untuk anak kuliahTRANSCRIPT
1
1
Vembri Noor Helia, ST., MT.
Penyebaran Data atau Variasi :
Variansi
Variansi (variance 2s atau 2 ), adalah ukuran yang menunjukkan rata-rata kuadrat penyimpangan data dari nilai rata-rata data (mean value). Variansi dihitung sebagai berikut
)1/()(1
22
nxxsn
ii ,
dimana (n-1) adalah derajat kebebasan (degree of freedom) dari sejumlah n data setelah berkurang satu karena telah digunakan untuk menghitung nilai rata-rata x . Dari perhitungan tersebut, dapat diturunkan cara perhitungan lain yang dinilai lebih mudah untuk penghitungan secara manual sebagai berikut
)1/(/)(11
22
nnxxsn
ii
n
ii .
2
Ada cara perhitungan lain yang dilakukan dengan melihat perbedaan setiap pasang data seperti pada persamaan berikut
)1(2/)(1 1
22
nnxxsn
i
n
jji .
Dengan cara ini, tidak terlihat adanya perhitungan nilai rata-rata (lokasi pemusatan data). Penggunaan (n-1) sebagai ganti n menghasilkan estimasi tidak bias untuk variansi populasi. Jika digunakan nilai rata-rata yang bukan berasal dari data (misalkan diketahui ), maka derajat
kebebasannya (degree of freedom) tetap berjumlah n, dan variansi dihitung
sebagai berikut nxsn
ii /)(
1
22
.
3
Simpangan baku Simpangan baku atau standard deviation (s atau ) menunjukkan rata-rata penyimpangan data dari nilai rata-ratanya, atau akar
kuadrat dari variansi )1/()(1
2
nxxsn
ii atau
nxsn
ii /)(
1
2
. Dalam distribusi normal, rata-rata
menunjukkan parameter lokasi, sedangkan deaviasi standar menunjukkan parameter skala (sebagai kluster data-data observasi). Statistik ini memiliki bias yang besarnya dapat dilihat
sebagai faktor koreksi )34/()1(44 nnc (lihat tabel pada
buku pengendalian kualitas).
4
Koefisien variasi Koefisien variasi (coefficeint of variation, CV) diberikan oleh persamaan berikut (biasanya dinyatakan dalam %)
xsCV / . Statistik ini penting, karena menghasilkan skala yang memiliki nilai nol yang mutlak dan digunakan untuk membandingkan variasi antara dua variabel yang berbeda dimensi
Rentang Rentang atau range (R) adalah ukuran yang menunjukkan selisih antara data terbesar dengan data terkecil pada sebuah kelompok data. Nilai simpangan baku dapat diestimasi dengan menggunakan rata-rata rentang R yang dikonversikan sebagai
2/ˆ dRs , dimana 2d (ditentukan oleh ukuran sampel).
n 2 3 4 5 6 7 8 9 10
2d 1.128 1.693 2.059 2.326 2.534 2.704 2.847 2.970 3.078
5
Perhatikan contoh berikut: Diperoleh data nilai hasil penjualan dua jenis produk di beberapa outlet untuk perioda bulan yang lalu dan bulan ini sebagai berikut:
Produk A Produk B
Outlet Bulan lalu Bulan ini Bulan lalu Bulan ini
East 89.7 87.3 84.7 86.3 West 81.4 79.7 86.1 79.3 North 84.5 85.1 83.2 82.6 South 84.8 81.7 91.9 89.1
(dalam Rp. 000.000,-)
Rata-rata hasil penjualan produk A (84.28), dan produk B (85.40)
Rata-rata hasil penjualan bulan lalu (85.79), dan bulan ini (83.89)
Rata-rata hasil penjualan outlet East (87), West (81.63), North (83.85), dan South (86.88)
6
2
Dari data-data tersebut muncul pertanyaan berikut: Apakah ada perbedaan nilai penjualan dilihat dari faktor-faktor jenis produk, perioda waktu penjualan atau lokasi penjualan (outlet)? Apakah ada pengaruh bersama (interaksi) dari faktor-faktor tersebut sehingga terdapat variasi pada nilai penjualan?
7 8
• ANOVA (ANalysis Of VAriance)
adalah metoda statistika untuk menentukan keberadaan (existence) perbedaan (differences) dari beberapa rata-rata populasi.
9
ANOVA dirancang untuk mendeteksi perbedaan dari rata-rata populasi karena adanya perbedaan perlakukan (treatments) tertentu.
ANOVA adalah pengujian terpadu (joint test)
▪ Kesamaan beberapa rata-rata populasi diuji secara bersamaan atau simultan.
ANOVA menguji kesamaan beberapa rata-rata populasi dengan mengevaluasi dua estimator variansi populasi (karenanya disebut analysis of variance).
10
Diperlukan r sampel random independen dimana setiap sampel berkaitan dengan sebuah perlakuan tertentu.
Total observasi yang diperlukan adalah
n = n1+ n2+ n3+ ...+nr.
Sehingga rata-rata sampel: x1, x2 , x3 , ... , xr
Rata-rata sampel ini digunakan untuk menghitung estimator variansi populasi. Jika rata-rata populasi sama maka variansi diantara rata-rata sampel tersebut kecil.
Variansi sampel : s12, s2
2, s32, ...,sr
2
Variansi sampel ini digunakan untuk menentukan pooled estimator dari variansi populasi.
11
• Asumsikan sampling random independen dari setiap populasi.
• Asumsikan pula bahwa populasi tersebut: Berdistribusi normal,
memiliki rata-rata i (dapat sama atau berbeda),
dengan variansi yang sama, i2.
1 2 3
Population 1 Population 2 Population 3
Statistik uji:
F(r-1, n-r) =Estimasi variansi dari rata-rata sampel
Estimasi variansi dari seluruh observasi
Statistik uji dalam analisis variansi dilandasi oleh rasio dua estimator
variansi dengan (r-1) degrees of freedom untuk pembilang dan (n-r)
degrees of freedom untuk penyebut.
Uji hipotesis:
H0: 1 = 2 = 3 = 4 = ... r
H1: tidak semua i (i = 1, ..., r) sama
12
3
x
x
x
Jika hipotesis awal benar:
Diharapkan bahwa rata-rata sampel hampir
bernilai sama, karenya diharapkan juga bahwa
variasi diantara rata-rata sampel (between
sample) kecil, relatif terhadap variasi pada rata-
rata sampel tertentu (within sample).
Jika hipotesisi awal benar, pembilang pada
statistik uji kecil, relatif terhadap pembilang:
F(r-1, n-r)=Estimate of variance based on means from r samples
Estimate of variance based on all sample observations
H0:
13
x xx
Jika hipotesis awal salah:
is equal to but not to ,
is equal to but not to ,
is equal to but not to , or
, , and are all unequal.
Dalam kondisi tersebut diinginkan variansi diantara rata-rata sampel (between
sample) besar relatif terhadap variasi disekitar rata-rata sampel individual (within
sample).
Jika hipotesis awal tidak dapat diterima, statistik uji pembilang besar relatif
terhadap penyebut:
F(r-1, n-r)=Estimate of variance based on means from r samples
Estimate of variance based on all sample observations
14
15
•Dari 4 populasi, diambil sampel random n1 + n2 + n3 + n4 = 54. Statistik
uji :F(4-1, 54-4)= F(3,50) = Estimate of variance based on means from 4 samples
Estimate of variance based on all 54 sample observations
543210
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0F(3,50)
f (F)
FDistributionwith3 and 50 Degrees of Freedom
2.79
a=0.05
Area penerimaan (untuk a=0.05) adalah F
2.79, dan area penolakan F > 2.79. Jika
statustik uji kurang dari 2.79 maka hipotesis
awal diterima, dan disimpulkan rata-rata 4
populasi sama. Sebaliknya jika statistik uji
lebih besar dari 2.79, hipotesis awal ditolak,
artinya rata-rata ke-4 populasi tidak sama.
Randomly chosen groups of customers were served different types of coffee and asked to rate the
coffee on a scale of 0 to 100: 21 were served pure Brazilian coffee, 20 were served pure Colombian
coffee, and 22 were served pure African-grown coffee.
The resulting test statistic was F = 2.02
berbeda). signifikan secara(tidak sama dianggap populasi
rata-rata ketiga artinya ditolak,dapat tidak 0
H
15.360,2
02.2
15.360,2363,13)-(,1-
:adalah 0.05=untuk kritis Batas
3=r
63=22+20+21=n 22=3
n 20=2
n 21=1
n
equal means threeallNot :1
H321
:0
H
FF
FFrnr
F
a
543210
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0F
f( F)
F Distribution with 2 and 60 Degrees of Freedom
a=0.05
Test Statistic=2.02 F(2,60)=3.15
16
Rata-rata total , x, adalah rata-rata dari n = n1+ n2+ n3+...+ nr observasi dari
seluruh r sampel.
i. -ke populasi dari sampel dalam j-ke dataadalah ij
dimaan x
1 =1 ij
x1
=
:points) data (all totalrata-Rata
1 ij
x
=
:r)1,2,3,...,=(i i sampel rata-Rata
i
ni
n
in
j
r
ii
x
in
in
ji
x
r
ixn
17 18
Jika rata-rata r populasi berbeda (paling
tidak dua populasi), maka variasi data di
sekitar rata-rata populasi tersebut (within
sample variation) akan kecil relatif
terhadap variasi rata-rata r sampel di
sekitar rata-rata total (between sample
variation).
Distance from data point to its sample mean
Distance from sample mean to grand mean
1050
x3=2
x2=11.5
x1=6
x=6.909
Treatment (j) Sample point(j) Value(xij)i=1 Triangle 1 4Triangle 2 5Triangle 3 7Triangle 4 8
Mean of Triangles 6i=2 Square 1 10Square 2 11Square 3 12Square 4 13
Mean of Squares 11.5i=3 Circle 1 1Circle 2 2Circle 3 3
Mean of Circles 2Grand mean of all data points 6.909
4
e x xij ij i
t x xi i
Prinsip ANOVA (hipotesis awal):
Jika rata-rata populasi tidak sama, rata-rata error (within
sample) kecil dibandingkan dengan rata-rata treatment
(between sample) .
19
Error deviation adalah perbedaan antara sebuah data dengan rata-rata sampelnya,
dan dinyatakan dengan e
Treatment deviation adalah perbedaan antara sebuah rata-rata sampel dengan
rata-rata total dan dinyatakan dengan ti
Untuk data x24=13, rata-rata sampel 2 = 11.5, dan
rata-rata total 6.909, maka:
e x x
t x x
Tot t e
Tot x x
24 24 2 13 11 5 1 5
2 2 11 5 6 909 4 591
24 2 24 1 5 4 591 6 091
24 24 13 6 909 6 091
. .
. . .
. . .
. .
or
1050
x2=11.5x=6.909
x24=13
Total deviation:
Tot24=x24-x=6.091
Treatment deviation:
t2=x2-x=4.591
Error deviation:
e24=x24-x2=1.5
Deviasi total (Totij) adalah berbedaan antara data (xij) dan rata-rata total (x):
Totij=xij - x
Untuk setiap data xij: Tot = t + e, artinya:
Deviasi total = Deviasi karena Treatment + Deviasi karena Error
20
2)(2
2)(2)(=2+ 2
:deviasiKuadrat
atas. dipersamaan darin dikeluarkadapat )( sample rata-Rata
)()()(=+
:error deviasidan treatmentdeviasijumlah adalah totalDeviasi
xij
xij
Tot
ix
ijxx
ix
ije
it
ix
ijTotx
ijx
ix
ijxx
ix
ije
it
Error Deviasi +Treatment Deviasi = Total Deviasi
21
1 1
2)(
1
2)(
in=
1 1
2)(
1 1
2+
1
2
1 1
2
r
i
jn
ji
xij
xr
i
xi
xr
i
jn
j
xij
x
r
i
jn
jij
er
ii
ti
nr
i
jn
jij
Tot
deviasikuadrat Jumlah
The Sum of Squares Principle
Jumlah kuadrat total (SST) adalah jumlah dari (i) jumlah kuadrat karena
treatment (SSTr)dan (ii) jumlah kuadrat error (SSE).
SST = SSTr + SSE
22
SST
SSTr SSE
SST mengukur variasi total semua data individual terhadap rata-rata total (grand
mean).
SSTr mengukur variasi yang dapat dijelaskan (explained variation) antara rata-rata
sampel terhadap rata-rata total. Variasi ini dijelaskan karena adanya perlakukan
(treatment) tertentu (between groups of data points).
SSE mengukur variais yang tidak dapat dijelaskan (unexplained variation) dalam
setiap sampel (within each group).
23
The number of degrees of freedom associated with SST is (n - 1).
n total observasi pada semua sampel
The number of degrees of freedom associated with SSTR is (r - 1).
r jumlah rata-rata sampel
The number of degrees of freedom associated with SSE is (n-r).
n total observasi pada semua sampel dan r jumlah rata-rata sampel
The degrees of freedom bersifat aditif, sehingga:
df(total) = df(treatment) + df(error)(n - 1) = (r - 1) + (n - r)
24
5
Penghitungan nilai variansi dilakukan dengan membagi jumlah kuadrat
deviasi dengan jumlah degrees of freedom, disebut sebagai mean squared
deviations .
Mean square treatment (MSTR):
Mean square error (MSE):
Mean square total (MST):
(Note: MST MSTR + MSE).
MSTRSSTR
r
( )1
MSESSE
n r
( )
MSTSST
n
( )1
25
E MSE
E MSTRni i
r
i
( )
dan
( )( ) jika hipotesisi awal benar
> jika hipotesisi awal salah
dimana rata-rata populasi i dan adalah rata-rata r populasi
2
22
1
2
2
Ekspektasi rata-rata kuadrat kesalahan (mean square error (MSE) adalah variansi populasi secara
umum (asumsikan kesamaan variansi), ekspektasi jumlah kuadrat variasi treatment (MSTR)
adalah variansi populasi secara umum plus sebuah komponen variasi rata-rata sampel secara
individual dengan rata-rata total.
Jika hipotesis awal benar, maka rata-rata setiap populasi adalah sama sehingga komponen
kedua dari E(MSTR) adalah nol, dan E(MSTR) adalah variansi populasi secara umum σ2.
26
Jika hipotesis ANOVA benar bahwa r rata-rata populasi sama, population
means are equal, MSTR dan MSE independent unbiased estimators untuk
variansi populasi 2.
Sebaliknya, jika hipotesis tersebut salah maka MSTR akan lebih besar dari
MSE, atau
Rasio MSTR terhadap MSE dapat digunakan sebagai indikator
kesamaan (atau ketidaksamaan) r rata-rata populasi.
Rasio (MSTR/MSE) akan mendekati satu jika hipotesis tersebut benar, dan
lebih besar dari satu jika ada kecenderungan hipotesis tersebut salah. Uji
dengan ANOVA adalah menguji apakah rasio (MSTR/MSE) sama dengan
satu , atau lebih besar dari satu.
27
Rasio (MSTR/MSE) mengikuti distribusi F dengan degrees of freedom
(r-1) untuk pembilang dan (n-r) untuk penyebut.
Statistik uji untuk analisis variansi:
( - , - )FMSTR
MSEr n r1
28
( )2
ni
( )2
Critical p oint ( = 0.01): 8.65
H0
may be rejected at the 0.01 level
of significance.
SSE xij
xi
j
nj
i
r
SSTR xi
x
i
r
MSTRSSTR
r
MSESSTR
n r
FMSTR
MSE
1
17
1
1
159 9
1
159 9
3 179 95
17
82 125
2 8
79 95
2 12537 62
.
.
( ).
.
( , )
.
.. .
a
Treatment (i) i j Value (x ij ) (x ij -xi ) (x ij -xi )2
Triangle 1 1 4 -2 4
Triangle 1 2 5 -1 1
Triangle 1 3 7 1 1
Triangle 1 4 8 2 4
Square 2 1 10 -1.5 2.25
Square 2 2 11 -0.5 0.25
Square 2 3 12 0.5 0.25
Square 2 4 13 1.5 2.25
Circle 3 1 1 -1 1
Circle 3 2 2 0 0
Circle 3 3 3 1 1
73 0 17
Treatment (xi -x) (xi -x)2
ni (x i -x)2
Triangle -0.909 0.826281 3.305124
Square 4.591 21.077281 84.309124
Circle -4.909 124.098281 72.294843
159.909091
29
Source of
Variation
Sum of
Squares
Degrees of
Freedom Mean Square F Ratio
Treatment SSTR=159.9 (r-1)=2 MSTR=79.95 37.62
Error SSE=17.0 (n-r)=8 MSE=2.125
Total SST=176.9 (n-1)=10 MST=17.69
100
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0F(2,8)
f(F
)
F Distribution for 2 and 8 Degrees of Freedom
8.65
0.01
Computed test statistic=37.62
Tabel ANOVA menyimpulkan
perhitungan-perhitungan.
Karena satistik uji lebih besar dari nilai
kritis untuk a=0.01, hipotesis awal
ditolak, artinya rata-rata triangles,
squares, dan circles tidak sama.
30
6
Treat Value
1 41 51 71 82 102 112 122 133 13 23 3
MTB > Oneway 'Value' 'Treat'.
One-Way Analysis of Variance
Analysis of Variance on Value Source DF SS MS F pTreat 2 159.91 79.95 37.63 0.000Error 8 17.00 2.12Total 10 176.91
The MINITAB output includes not only the ANOVA table and the test statistic,
but it also gives a p-value corresponding to the calculated F-ratio. In this
instance the p-value is approximately 0, so the null hypothesis can be rejected
at any common level of significance.
31
The EXCEL output is created by selecting ANOVA: SINGLE FACTOR option
from the DATA ANALYSIS toolkit. The critical F value is based on a = 0.01.
The p-value is very small, so again the null hypothesis can be rejected at any
common level of significance.
Anova: Single Factor
SUMMARY
Groups Count Sum Average Variance
TRIANGLE 4 24 6 3.333333333
SQUARE 4 46 11.5 1.666666667
CIRCLE 3 6 2 1
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 159.9090909 2 79.95454545 37.62566845 8.52698E-05 8.64906724
Within Groups 17 8 2.125
Total 176.9090909 10
32
Data ANOVA
Do Not Reject H0 Stop
Reject H0
Rata-rata sampel adalah estimator unbiased untuk rata-rata populasi.
Mean square error (MSE) adalah estimator unbiased untuk variansi populasi.
Further
Analysis
Confidence Intervals
for Population Means
Tukey Pairwise
Comparisons Test
33
Duncan’s multiple range test
Sebuah rentang (1-α) 100% untuk rata-rata populasi ke-i:
dimana tα/2 adalah nilai distribusi t dengan (n-r) degree of freedom
di batas kanan untuk luas areaa
2
ax tMSE
ni
i
±2
34
35
Uji ketidak-samaan rata-rata populasi:Newman-Keuls test
(Newman 1939; Keuls 1952).Tukey test (pairwise comparison)
(Tukey 1953).Duncan’s multiple range test
(Duncan 1955).
•Uji Tukey Pairwise Comparison, atu Honestly Significant Differences (MSD)
memungkinkan untuk membandingkan setiap pasang rata-rata populasi dengan sebuah tingkat
pembedaan (single level of significance).
•Uji ini dilandasi oleh studentized range distribution, q, dengan r dan (n-r) degrees of
freedom.
•Nilai kritis dalam uji Tukey Pairwise Comparisons adalah Tukey Criterion:
dimana ni adalah ukuran sampel terkecil dianatar r sample.
•Statistik uji adalah perbedaan absolut (absolute value of the difference) antara rata-rata sampel,
dan hipotesis awal ditolak jika statistik uji lebih besar dari nilai kritis kriteria Tukey
(Tukey Criterion)
T qMSE
ni
a
compare. tomeans population of pairs )!2(!2
!
2
r are e that therNote
r
r
36
7
Contoh:
i Treatment Mean I. H0: 1 2 VI. H0: 2 4
1 Guadeloupe 89 H1: 1 2 H1: 2 4
2 Martinique 75 |89-75|=14>13.7* |75-91|=16>13.7*
3 Eleuthra 73 II. H0: 1 3 VII. H0: 2 5
4 Paradise Is. 91 H1: 1 3 H1: 2 5
5 St. Lucia 85 |89-73|=16>13.7* |75-85|=10<13.7
III. H0: 1 4 VIII. H0: 3 4
The critical point T0.05 for H1: 1 4 H1: 3 4
r=5 and (n-r)=195 |89-91|=2<13.7 |73-91|=18>13.7*
degrees of freedom is: IV. H0: 1 5 IX. H0: 3 5
H1: 1 5 H1: 3 5
|89-85|=4<13.7 |73-85|=12<13.7
V. H0: 2 3 X. H0: 4 5
H1: 2 3 H1: 4 5
|75-73|=2<13.7 |91-85|= 6<13.7
Reject the null hypothesis if the absolute value of the difference between the sample means
is greater than the critical value of T. (The hypotheses marked with * are rejected.)
T qMSE
ni
a
386504 4
4013 7.
..
37
Hipotesis awal yang membandingkan rata-rata populasi 1 dan 2, 1 dan 3, 2 dan 4, dan 3 dan 4 ditolak. Sebaliknya, hipotesis awal kesamaan rata-rata populasi 1 dan 4, 1 dan 5, 2 dan 3, 2 dan 5, 3 dan 5, dan 4 dan 5 diterima.
Garis tebal mengindikasikan pengelompokkan tiga rata-rata populasi, yaitu:
2 dan 3; 2, 3, dan 5; dan 1, 4, dan 5.
1
2
3
4
5
38
Uji ketidak samaan rata-rata populasi:Newman-Keuls test (Newman 1939; Keuls 1952)Tukey test (Tukey 1953)Duncan’s multiple range test (Duncan 1955).
39
Duncan’s multiple range test:Urutkan rata-rata populasi (kecil – besar)Tentukan standar error setiap rata-rataTemukan nilai ra(p,f), untuk p=2,3,…a (a adalah rentang terbesar)Hitung rentang perbedaan deviasi Rp
40
Tentukan standar error setiap rata-rata
Temukan nilai ra(p,f) dari tabelHitung rentang perbedaan deviasi (least significance range)
41
Contoh:Industri kertas mengamati pengaruh konsetrasi “hardwood” 5%;10%;15%;20% dan 25%. Setiap sampel berukuran 5, sehingga ada 25 data (degree of freedom error 25-5=20). Diketahui MSE=8.06, sehingga stadar error adalah 1,27. Urutan rata-rata adalah:
42
Least significance range:
8
43
Pengamatan pasangan rata-rata:
44
45