1.tahmin teorisi ve guven araligi(25.03. 20 11)
TRANSCRIPT
1
İSTATİSTİKSEL TAHMİNLEME VE YORUMLAMA SÜRECİ
ÖRNEKLEME VE ÖRNEKLEME
DAĞILIMLARI
İSTATİSTİKSEL TAHMİNLEME VE YORUMLAMA SÜRECİ
ÖRNEKLEME VE ÖRNEKLEME
DAĞILIMLARI
•TAHMİNLEYİCİLERİN ÖZELLİKLERİ•ÖRNEKLEME DAĞILIMI •NOKTA TAHMİNİ VE GÜVEN ARALIKLARI
2
İstatistiksel metotlar
İstatistiksel metotlar
Tanımlayıcı istatistikler
Yorumlayıcı istatistikler
TahminlemeHipotez
Testi
3
Yorumlayıcı İstatistikler
• Aralık tahminleme ve hipotez testlerini içerir.
• Amacı populasyon karakteristikleri hakkında karar vermektir.
Populasyon?
4
Tahmin süreci
Ortalama, , bilinmiyor
Populasyon Şans örneği%95 eminim ki, 0 ile 60
arasındadır. Ortalama
= 50X
5
Bilinmeyen populasyon parametreleri tahminlenir
Populasyon parametresini
Örnek istatistiğiyleTahminle!
Ortalama
Oran P p
Varyans s2
Farklar 12 1 2
X
X X
2
Tahminleyicilerin Özellikleri
Sapmasız Sapmalı
BAX
)(XP 1. Sapmasızlık
N birimlik aynı anakütleden farklı sayıda örneklem seçilebileceği için tahmin edicinin değeri de seçilen örnekleme göre değişmektedir. Bu durumda örneklem sayısı kadar elde edilen tahmin edici, bir rassal değişken olup, ortalaması ve varyansı olan bir olasılık dağılımına sahiptir. Bu dağılımın beklenen değerinin anakütle parametresine eşit olmasına, diğer bir ifadeyle bir istatistiğin beklenen değeri ile bilinmeyen anakütle parametresi arasındaki farkın sıfıra eşit olmasına “sapmasızlık” denir.
E(X) E(X) 0
Tahminleyicilerin Özellikleri
2. Tutarlılık (Kararlılık)
Küçük örnek hacmi
Büyük örnek hacmi
A
B
)X(P
X
Örneklemdeki birim sayısı sonsuza doğru arttırıldığında, tahmin edicinin değerinin anakütle değerine yaklaşması ve n=N olması durumunda aralarındaki farkın sıfıra inmesi özelliğine “tutarlılık” denir.
nlim P 1
,’nın tutarlı tahmincisidir.
Tahminleyicilerin Özellikleri
3. Etkinlik
A
B
X
)X(P
Birden fazla sapmasız ve tutarlı tahminci olması durumunda, bir tahmincinin varyansının, aynı anakütle parametresinin başka bir tahmincisinin varyansından daha küçük olması durumunda elde edilen tahmincilere “etkin” tahminci adı verilmektedir.
Etkin Tahminci
9
ÖRNEKLEME DAĞILIMI
ORTALAMALARIN ÖRNEKLEME DAĞILIMI
ÖRNEKLEME DAĞILIMI
ORTALAMALARIN ÖRNEKLEME DAĞILIMI
Ortalamaların örnekleme dağılımı anakütle ortalamasının iyi bir tahmincisidir. Ortalamaların örnekleme dağılımı anakütle ortalamasının iyi bir tahmincisidir.
Her biri n hacimli çok sayıda örneğe ait ortalamaların gösterdiği dağımın değişkenliği tek örneğin değişkenliğinden daha azdır.
Standart sapma bir örneğin değişkenliği hakkında bilgi verirken ,
Ortalamaların örnekleme dağılımının değişkenliği standart hatayla gösterilir.
Her biri n hacimli çok sayıda örneğe ait ortalamaların gösterdiği dağımın değişkenliği tek örneğin değişkenliğinden daha azdır.
Standart sapma bir örneğin değişkenliği hakkında bilgi verirken ,
Ortalamaların örnekleme dağılımının değişkenliği standart hatayla gösterilir.
10
Aşırı değerlerin etkisinin önemli ölçüde yok edilmesi,
ortalamaların örnekleme dağılımının değişkenliğini azaltıcı bir
faktördür.
Ana kütle standart sapması bilindiğinde standart hata
Aşırı değerlerin etkisinin önemli ölçüde yok edilmesi,
ortalamaların örnekleme dağılımının değişkenliğini azaltıcı bir
faktördür.
Ana kütle standart sapması bilindiğinde standart hata
xx n
eşitliğiyle hesaplanır.eşitliğiyle hesaplanır. Standart z değerleri Standart z değerleri
XZ
x
formülüyle hesaplanır. Ortalamaların örnekleme dağılımında formülüyle hesaplanır. Ortalamaların örnekleme dağılımında
XX xx xx yerini alır.yerini alır.
11
XZ
x
x
XZ
x
Herhangi bir değerinin standart Z değerine dönüştürmesinde Herhangi bir değerinin standart Z değerine dönüştürmesinde X
eşitliği kullanılır.eşitliği kullanılır.
Z = 0
z= 1
Z
Örnekleme dağılımı Standart normal dağılım
X
X
X
12
Normal populasyondan örnekleme
•Merkezi eğilim
•Yayılım
– yerine koyarak örnekleme
Populasyon dağılımı
Örnekleme dağılımın =16
X = 2.5
n = 4
X = 5
= 10
X
nX
X
50X
50 X
13
Alıştırma
• Türk telekomda çalışan bir operatörsünüz.
Uzun mesafeli telefon görüşmeleri = 8
dk. & = 2 dk. İle normal dağılmakta.
Eğer 25 aramalık örnekler seçerseniz
örnek ortalamalarının % kaçı 7.8 & 8.2 dk.
arasında olacaktır?
14
Çözüm
Örnekleme dağılımı
.3830
.1915.1915
Standart normal dağılım
ZX
n
ZX
n
7 8 8
2 2550
8 2 8
2 2550
..
..
8
X = .4
7.8 8.2 0
Z = 1
-.50 Z.50X
15
ORANLARIN ÖRNEKLEME DAĞILIMIOranların örnek dağılımının ortalaması anakütle oranına eşittir.
P
P 1 P
n
p PZ
P 1 P
n
ÖRNEK: Büyük bir alışveriş merkezinde 15000 YTL’den fazla alışveriş yapan müşterilerin %30’unun kredi kartı kullandığı tespit edilmiştir. 15000 YTL’den fazla alışveriş yapan 100 müşteri için oranların örneklem dağılımının standart hatası nedir?
P
P 1 P 0.30 1 0.300.0458
n 100
16
ORANLARIN ÖRNEKLEME DAĞILIMIAynı örnek için 15000 YTL’den fazla alışveriş yapan 100 müşteriden %20 ile %25’inin kredi kartı kullanması ihtimalini hesaplayınız.
1
1
p P 0.20 0.30Z 2.18
0.30(1 0.30)P 1 P100n
2
2
p P 0.25 0.30Z 1.09
0.30(1 0.30)P 1 P100n
P(0.20 P 0.25) P( 2.18 Z 1.09) 0.4854 0.3621
P(0.20 P 0.25) 0.1233
-2.18 -1.09
0.4854
0.36210.1233
17
ORTALAMALAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI
Ortalamalar arası farkın örnek dağılımının ortalaması μ1 – μ2 ve standart hatası da 1 - 2 ile gösterilir.
1 2
2 21 2
X X1 2n n
1 2 1 2
2 21 2
1 2
X XZ
n n
18
ORTALAMALAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI
Örnek: İki farklı un fabrikasında paketlenen standart 1 kg’lık un paketleri test edilmiş ve birinci fabrikadan alınan 100 paketin ortalaması 1.03 kg, standart sapması 0.04kg; ikinci fabrikadan alınan 120 paketin ortalaması 0.99 kg, standart sapması 0.05 kg bulunmuştur. Anakütle standart sapmaları bilinmediği için örnek standart sapmalarından hareketle ortalamalar arası farkın standart hatası,
1 2
2 2 2 21 2 1 2
X X1 2 1 2
2 2
s s
n n n n
(0.04) (0.05) =
100 120 = 0.006
19
ORANLAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI
Oranlar arası farkın örnek dağılımının ortalaması P1 –P2 ve standart hatası da 1 - 2 ile gösterilir.
1 2
1 1 2 2P P
1 2
P 1 P P 1 P
n n
1 2 1 2
1 1 2 2
1 2
p p P PZ
P 1 P P 1 P
n n
20
ORANLAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI
Örnek: Birinci fabrikadaki kusurlu mamul oranının 0.08 ve ikinci fabrikadaki kusurlu mamul oranının 0.05 olduğu bilinmektedir. Tesadüfi olarak birinci fabrikadan 100, ikinci fabrikadan 150 mamul seçilmiş ve birinci örnekteki kusurlu mamul oranı 0.09, ikinci örnekteki kusurlu mamul oranı 0.06 olarak gözlenmiştir. Buna göre kusur oranları arasındaki farkın standart hatası:
1 2
1 2
1 2
1 1 2 2P P
1 2
P P
P P
P 1 P P 1 P
n n
0.08 0.92 0.05 0.95
100 1500.0324
21
İstatistiksel Tahminleme
Nokta Tahmini Aralık Tahmini
Pp
σs
μ
X
.035P0.25
3.4σ2.5
60μ202
Populasyon parametresinin tek bir tahmin değerini verir
Populasyon parametresinin tahmin aralığını verir. Nokta
tahmini kullanılarak hesaplanır.
22
Örneğin yeterince büyük olmaması veya bir örnekten elde
edilen istatistiğin bir başka örnekten sağlanan istatistikle
aynı olmayışı yüzünden anakütle parametresini bir noktada
tahmin etmek yanlış sonuçlar doğurabilir.
Bu yüzden anakütle parametresi belirli bir hata seviyesi göz
önüne alınarak belirli bir aralıkta aranır. Hata terimini ile
gösterirsek, 1- güven seviyesinde aralık tahmini
yapabiliriz.
Hata terimi normal eğrinin her iki ucunda eşit olarak yer alır.
23
Bu /2 lik hata terimine karşılık gelen ± Z değerleri
belirlenerek örnek dağılımının standart hatası ile
çarpıldığında hata payı elde edilir.
Hata payının örnek istatistiğine eklenip çıkarılması ile aralık
tahmini yapılır. Bu şekilde, anakütle parametresinin belirli
aralıkta yer aldığını, 1- güven seviyesinde söyleyebiliriz.
Güven sınırlarından küçük olanına alt güven sınırı, büyüğüne
ise üst güven sınırı denir.
Hata terimi küçüldükçe güven aralığı genişler. Güven
sınırlarının belirleneceği olasılık seviyesine göre Z değeri
değişir.
2424
Güven Aralığı Tahmininin Elemanları
Güven aralığıÖrnek istatistiği
Alt güven sınırı Üst güven sınırı
Populasyon parametresinin aralık içinde bir yere düşmesinin olasılığı
Güven Aralığı Tahmini Bir değer aralığı verir. Populasyon parametresine yakınlık hakkında bilgi
verir. Olasılık terimleriyle ifade edilir.
25
Güven Aralığı Tahminleri
Ortalama
Güven Aralıkları
Oran
bilinmiyor biliniyor
Varyans
n<30n30
t dağılımıZ dağılımı
26
ORTALAMALAR İÇİN GÜVEN ARALIĞI
Bir örnekden elde edilen istatistiği anakütle ortalaması
x in nokta tahminidir.
Gerçek anakütle ortalaması, 1- güven seviyesinde
X
X X2 X 2P X z X z 1
n n
aralığında yer alır.
27
Örneklerin 90%
Örneklerin 95%
Örneklerin 99%
x_
X Z X Z nX
X2.58 1.645 1.645 2.58X X X X
X X X X
1.96 1.96X XX X
28
Aralıklar ve güven seviyesi
Ortalamanın örnekleme dağılımı
Çok sayıda aralık
aralık Aralıkların %(1 - ) ‘ı ’yü kapsar.
‘sı kapsamaz.
x =
1 - /2/2
X_
x_
uzanirkadaraX
ZX
danX
ZX
'
'
29
• Bilinmeyen populasyon parametresinin aralık içine düşme olasılığıdır.
• %(1 - güven seviyesi
Parametrenin aralık içinde olmaması olasılığıdır.
• Tipik değerler %99, %95, %90
Güven Seviyesi
30
%95 güven sınırları belirlenirken hatası 1-0.95=0.05 dir. Bu
hata normal eğrinin sağ ve sol ucuna eşit olarak dağıtıldığında
/2 =0.05/2=0.025 dur.
Bu alanları belirleyen biri negatif, diğeri pozitif iki Z değeri
vardır.
Normal eğri alanları tablosunda
0.50-0.025=0.4750 değerini gösteren Z= ±1.96 değerleri
aradığımız Z değerleridir.
31
%99 güven sınırları belirlenirken
hatası 1-0.99=0.01 dir.
Bu hata normal eğrinin sağ ve sol ucuna eşit olarak dağıtıldığında
/2=0.01/2=0.005 bulunur.
Normal eğri alanları tablosunda
0.5-0.005=0.4950 değerini gösteren Z= ±2.58 değerleri aradığımız
Z değerleridir.
32
Aralık genişliğini etkileyen faktörler
• Verilerin yayılımı (
• Örnek hacmi
• Güven seviyesi (1 - )
Aralık
uzanir.ya'
dan'X
ZXX
ZX
xx n
33
Örnek: Bir fabrikada üretilen 100 ürünün ortalama ağırlığı
1040 gr standart sapması 25 gr bulunmuştur. Bu imalat
prosesinde üretilen ürünlerin ortalama ağırlığı %95 güvenle
hangi aralıktadır?
Z = 0 z=1.96
/2=0.05/2=0.025
%95 için z değeri ± 1.96 0.475
z=-1.96
34
X X2 X 2P X z X z 1
n n
X
25 25P 1040 1.96 1040 1.96 0.95
100 100
XP 1035.1 1044.9 0.95
35
Populasyonun standart sapması X bilinmediğinde ve nn 30 30 olduğunda ortalama için güven aralığı
1. Varsayımlar:
Popülasyonun standart sapması bilinmiyor
Populasyon normal dağılımlı.
2. Merkezi limit teoremi kullanılarak Z Dağılımı kullanılır.
3. Güven aralığı tahmini:
Örneğin standart sapması
α1)n
SZXμ
n
SZXP( x
α/2x
α/2
36
Örnek
•Bir ampul şirketi yeni bir ampul geliştirerek piyasaya sürüyor. Üretim bandından 100 tanesi rassal olarak seçiliyor ve bunların standart sapması 140 saat, kulanım süreleri de ortalama olarak 1280 saat bulunuyor. =0.05 için populasyon ortalamasının güven aralığını bulunuz.
100
14096.11280
100
14096.11280
95.0)44.130756.1252(P
α1)n
SZXμ
n
SZXP( x
α/2x
α/2
Yorum: Şirketin ürettiği ampullerin ortalama ömrü, 0.95 olasılıkla 1252.56 ile 1307.44 saat arasındadır.
P( )=0.95
37
Bir Oranın Güven Aralığı
1. Varsayımları– İki kategorik çıktı vardır.– Populasyon binom dağılımı gösterir.
2. Güven aralığı tahmini:
α/2 p α/2 pP(p Z .S P p Z .S ) 1 α
.p
p qS
n
xp
n
Örnek hacmi
Özellikli birim sayısı
Örnek oranı p anakütle oranı P nin nokta tahminidir.
38
•400 lise öğrencisinden oluşan bir örnekte 32 öğrenci üniversite sınavını kazanmıştır. Üniversite öğrencilerinin sınavı kazanma
oranı için %95’lik güven aralığını bulunuz.
α/2 p α/2 pP(p Z .S P p Z .S ) 1 α
320.08
400p
ÖRNEK:
0.08 1 0.08 0.08 1 0.08P 0.08 1.96 P 0.08 1.96 0.95
400 400
P 0.053 P 0.107 0.95
39
İki Ortalamanın Farkı İçin Güven Aralığı
Örnek ortalamalarından büyük olan ile gösterilirse örnek
ortalamaları arasındaki farktan hareketle anakütle ortalamaları
arasındaki farkın güven sınırları aşağıdaki gibi olur.
1X
Populasyon Varyansları Biliniyorsa:
1
nnZXX
nnZXXP
2
22
1
21
2/21212
22
1
21
2/21
α1n
S
n
SZXXμμ
n
S
n
SZXXP
2
22
1
21
α/2,21212
22
1
21
α/2,21
Populasyon Varyansları Bilinmiyor fakat n > 30 olduğunda:
40
Örnek
Bir yabancı dil kursunun A sınıfında bilgisayar destekli ve B
sınıfında klasik yöntemlerle eğitim verilmektedir. Kursun
başlangıcından 6 hafta sonra her iki sınıfa da aynı test
uygulanarak sonuçlar karşılaştırılmıştır. A sınıfından rassal
olarak seçilen 40 öğrencinin test sonucunda elde ettiği ortalama
başarı notu 86 ve standart sapması 12, B sınıfından rassal
olarak seçilen 35 öğrencinin ortalama başarı notu 72 ve
standart sapması 14’tür. Her iki sınıftaki öğrencilerin ortalama
başarı notları arasındaki farkın güven aralığını %99 olasılıkla
belirleyiniz.
41
1 1 1
2 2 2
X 86 S 12 n 40
X 72 S 14 n 35
2 2 2 21 2 1 2
1 2 α/2 1 2 1 2 α/21 2 1 2
S S S SP X X μ μ X X 1 α
n n n nZ Z
99.035
14
40
1258.22768μμ
35
14
40
1258.27268P
22
21
22
99.082.21μμ18.6P 21
Örnek
İstanbul’daki üniversite öğrencilerinden rastsal olarak seçilen bir grup öğrenci ile Ankara’daki üniversite öğrencilerinden rastsal olarak seçilen bir grup öğrencinin aylık harcamaları TL olarak aşağıdaki gibidir:
İstanbul X1 25 40 30 40 50 30 60 45
Ankara X2 45 20 15 30 35 25 40
İki örneğin ortalaması sırasıyla 40 ve 30TL ve varyansları da 144 ve 121 olarak bulunmuştur. Anakütle varyanslarının bilinmediği ve eşit olduğu varyasımı altında iki ildeki öğrencilerin aylık harcamalarının farkının %95 güven aralığını hesaplayınız.
Ortalamalar arası Farkların Güven Aralığı(Varyansların Eşit Olması)
Ortalamalar arası Farkların Güven Aralığı(Varyansların Eşit Olması)
1 2
2 22 1 1 2 2X X
1 2
( 1) ( 1)S
2
s n s n
n n
1 2 1 2X X X X1 2 1 2
1 2 α/2,n 2 1 2 1 2 α/2,n 21 2 1 2
1 1 1 1P X X μ μ X X 1 α
n nt S t S
n n n n
1 2
2X X
144(8 1) 121(7 1)S 133.38
8 7 2
1 2
1 1 1 1P 40 30 (2.16) (11.55) μ μ 40 30 (2.16)(11.55) 0.95
8 7 8 7
1 2P 2.59 μ μ 22.59 0.95
Ortalamalar arası Farkların Güven Aralığı(Varyansların Eşit Olması)
45
İki Oran Farkının Güven Aralığı
1. Varsayımları
İki kategorik çıktı vardır.
Populasyonlar binom dağılımı gösterir.
2. Güven aralığı tahmini:
1 2 1 21 2 α/2 p p 1 2 1 2 α/2 p pPr p p Z S P P p p Z S 1
İki oran farkının standart sapması
1 2
1 1 2 2
1 2
. .p p
p q p qS
n n
Örnek oranlarından büyük olan p1 ile gösterilirse örnek oranları
arasındaki farktan hareketle anakütle oranları arasındaki farkın
güven sınırları aşağıdaki gibi olur.
46
İki Oran Farkının Güven Aralığına Örnek
İki farklı ilacın bir hastalığı tedavi etme oranlarının farklı olup
olmadığı kontrol edilmek istenmektedir. Bu amaçla 1000’er adet
hasta üzerinde A ve B ilaçları denensin. Tedavi sonunda A ve B
ilaçlarının uygulandığı hastaların sırasıyla 825 ve 760’ının iyileştiği
gözlendiğine göre ilaçların hastalığı tedavi etme oranlarının
farkının %95’lik güven aralığını bulunuz.
n1 = 1000, n2 = 1000 1 2
825 7600.825 0.760
1000 1000p p
1 2
1 1 2 2
1 2
. . 0.825.(1 0.825) 0.760.(1 0.760)
1000 1000
0.018
p p
p q p qS
n n
47
95.0018.096.1760.082.0PP018.096.1760.082.0Pr 21
1 21 2ˆ ˆ1 2 α/2 1 2 1 2 α/2 p pp pPr p p Z S P P p p Z S 1
95.010.0PP029.0Pr 21
48
Student t Dağılımı
• Küçük örneklerden (n<30) elde edilen
istatistiklerin dağılımı Student t dağılımına uyar.
• Küçük örnek istatistiklerinin gösterdiği dağılım
normal eğri gibi simetriktir.Normal eğriye göre
daha basık ve yaygın bir şekil alır. Böylece eğrinin
kuyruklarında daha büyük bir alan oluşur.
• Küçük örnekler için z cetveli yerine,çeşitli örnek
büyüklükleri ve olasılık seviyeleri için ayrı ayrı
hesaplanmış t cetvelleri kullanılır.
49
zt
0
t (sd = 5)
Standart Normal
t (sd = 13)
Çan şekilli simetrik,
‘Tombul’ kuyruklar
50
Üst kuyruk alanı
sd .25 .10 .05
1 1.000 3.078 6.314
2 0.817 1.886 2.920
3 0.765 1.638 2.353
t0
Student t Tablosun = 3sd = n - 1 = 2 = .10/2 =.05
Olsun:
2.920t değerleri
.05
51
Populasyonun standart sapması X bilinmediğinde ve n< 30n< 30 olduğunda ortalama için güven aralığı
1. Varsayımlar:
Popülasyonun standart sapması bilinmiyor
Populasyon normal dağılımlıdır.
2. Student’ın t Dağılımı kullanılır.
3. Güven aralığı tahmini:
Örneğin standart sapması
x xv;α/2 v;α/2
s sX t X t
n-1 n-1
52
ORTALAMA İÇİN GÜVEN ARALIĞI
Populasyonun standart sapması X bilinmediğinde ve populasyonun
normal dağıldığı varsayımı altında güven aralığı tahmini:
/2 /21 -
11,2
n
stX n 1
1,2
n
stX n
2t 2t
s
x xv;α/2 v;α/2
s sX t X t
n-1 n-1
53
ÖRNEK•Bir fabrikada rasgele üretilen 25 ürünün ortalama ağırlığı 1040 gr
standart sapması 25 gr bulunmuştur. %95 güvenle bu imalat
prosesinde üretilen ürünlerin ortalama ağırlığı hangi aralıkta yer alır?
125
25064.21040
125
25064.21040
53.105047.1029
x xv;α/2 v;α/2
s sX t X t
n-1 n-1
54
Ortalamalar arası Farkların Güven Aralığı
İki anakütleden tesadüfi olarak seçilen ve hacimlerindeki iki
küçük örnekten hareketle anakütle ortalamaları arasındaki farkın
güven sınırları belirlenebilir.
Birinci örneğin serbestlik derecesi n1 -1 ve ikinci örneğin serbestlik
derecesi n2 – 1 dir ve toplam serbestli derecesi
Anakütle ortalamaları arasındaki farkın güven aralığı
belirlenirken serbestlik derecesine
ve hata payına göre t tablo değerleri bulunur.
1n 2n
221 nnv2
221 nnv olur.
1 2 1 2
2 2 2 21 2 1 2
1 2 α/2,n n 2 1 2 1 2 α/2,n n 21 2 1 2
s s s sPr X X t μ μ X X t 1 α
n 1 n 1 n 1 n 1
55
ÖRNEK
13 deneme sonrasında bir benzin pompası ortalama 125 ml
fazla benzin ölçümü yaparken standart sapma 17 ml
olmuştur.Bir başka benzin pompası ise 10 deneme
sonrasında deneme başına ortalama 110 ml fazla benzin
ölçümü yapılmış ve standart sapması 19 ml bulunmuştur.
Anakütle ortalamaları arasındaki farkın %99 güven sınırlarını
bulunuz.2121013 v 831.2tabt
110
19
113
17831.2)110125(
22
1 27.68 37.68
Pompaların fazla ölçümleri arasındaki fark %99 güvenle -7.68 ml ile 37.68 ml arasındadır.
α11n
s
1n
stXXμμ
1n
s
1n
stXXPr
2
22
1
21
2nnα/2,21212
22
1
21
2nnα/2,21 2121
56
Eşleştirilmiş Örnek t Testi
1. İki ilişkili populasyonun ortalamasını test eder.
– Çift ya da eşleştirilmiş
– Tekrarlı gözlemler (önce/sonra)
2. Nesneler arasındaki varyasyonu ortadan kaldırır.
Varsayımları
– İki populasyon da normal dağılımlıdır.
– Eğer normal değilse normale yaklaşmaktadır.
(n1 30 & n2 30 )
Aynı veya benzer denekler üzerinde birbirinden farklı iki işlemin
uygulanması sonucu elde edilen verilere eşleştirilmiş örnekler
denir.
57
İki komisyoncunun aynı evlere farklı fiyatlar verdiği iddia edilmektedir. İddiayı test etmek için 12 ev seçiliyor ve komisyonculardan bu evlere 1000$ bazında fiyat vermeleri isteniyor. Elde edilen sonuçlar aşağıdaki gibidir.İki komisyoncunun fiyat ortalamaları arasındaki farka ilişkin güven aralığını hesaplayınız.
Eşleştirilmiş Örnek t Testi
Komisyoncular
Evler A B D D2
1 181.0 182.0 -1.0 1.00
2 179.9 180.0 -0.1 0.01
3 163.0 161.5 1.5 2.25
4 218.0 215.0 3.0 9.00
5 213.0 216.5 -3.5 12.25
6 175.0 175.0 0.0 0.00
7 217.9 219.5 -1.6 2.56
8 151.0 150.0 1.0 1.00
9 164.9 165.5 -0.6 0.36
10 192.5 195.0 -2.5 6.25
11 225.0 222.7 2.3 5.29
12 177.5 178.0 -0.5 0.25
Toplam -2.0 40.22
58
D 2D 0.167
n 12
2 2
2
D
D 2D 40.22
n 12s 1.904n 1 12 1
ttab : t11,0.05 = ± 2.2011 12 1 11 . .v n s d
, 1 , 12 2D D Dn n
D t s D t s
)904.1(201.2167.0)904.1(201.2167.0 D
023.4357.4 D
BİR POPULASYON VARYANSI İÇİN GÜVEN ARALIKLARI
Bir anakütle varyansı için de güven aralığı bulmak gerekir.
Bu tahminler örneklem varyansına dayanır.
Varyansı olan bir normal anakütleden n gözlemli rassal
bir örneklem seçilsin. Örneklem varyansı da s2 ile gösterilsin.
Bir anakütle varyansı için de güven aralığı bulmak gerekir.
Bu tahminler örneklem varyansına dayanır.
Varyansı olan bir normal anakütleden n gözlemli rassal
bir örneklem seçilsin. Örneklem varyansı da s2 ile gösterilsin.
2
22
1 2
( 1) xn
n S
Rassal değişkeni, (n-1) serbestlik dereceli ki-kare dağılımına
uymaktadır. Bu bulgu, normal bir dağılımdan örneklem
alındığında anakütle varyansı için güven aralıklarının
türetilmesinin temelini oluşturur.
Rassal değişkeni, (n-1) serbestlik dereceli ki-kare dağılımına
uymaktadır. Bu bulgu, normal bir dağılımdan örneklem
alındığında anakütle varyansı için güven aralıklarının
türetilmesinin temelini oluşturur.
Örneklem varyansının gözlenen belli değeri ise, anakütle
varyansının güven aralığı aşağıdaki gibidir:
Örneklem varyansının gözlenen belli değeri ise, anakütle
varyansının güven aralığı aşağıdaki gibidir:
2xs
2 22
2 2
, 1 1 , 12 2
1 11
n n
n S n SP
n n
Red BölgesiRed
Bölgesi1-1-
Örneğin =0.05 n=10 olsunÖrneğin =0.05 n=10 olsun
20.975;9 2
0.025;9
61
Örnek
Bir çimento fabrikasında üretilen çimentodan yapılan betonların
sağlamlığının incelenmesi amacıyla 10 beton örneği alınmış ve
bu örneklerin sağlamlılıkları saptanmıştır. Bu örneklerin
ortalama ve varyansı olarak bulunmuştur. Fabrikanın ürettiği tüm betonların varyansına ilişkin güven
aralığını hesaplayınız.
2312 195x S
1 0.90
n n
Red BölgesiRed
Bölgesi
20.95;9 3.33 2
0.05;9 16.92
=0.10
62
1 0.90
2 22
2 2
, 1 1 , 12 2
1 11
n n
n S n SP
22 20.05;9 0.95;9
9 195 9 1950.90P
29 195 9 1950.90
16.92 3.33P
2103.72 527.02 0.90P
3.33 16.92
103.72 527.02S2
n
1-
2312 195x S 0.10
ÖRNEKDenenen bir motorun 16 deneme sürüşündeki yakıt tüketimlerinin standart
sapması 2.2 golondur. Motorun yakıt tüketiminin gerçek değişkenliğini ölçen
anakütle varyansının % 99 güven aralığını hesaplayınız. n=16 s=2.2
n n
Red BölgesiRed
Bölgesi
1)1()1(
2
1,2
1
22
2
1,2
2
nn
snsnP
01.080.322
15,005.0
60.4215,995.0
2 22
2 2
, 1 1 , 12 2
( 1) ( 1)1
n n
n S n SP
99.060.4
)2.2(15
80.32
)2.2(15 22
2
P
99.078.1521.2 2 P
n=16 S=2.2
65
İKİ POPULASYON VARYANSININ KARŞILAŞTIRILMASI Normal dağılımlı iki populasyonun varyanslarının oranı F dağılımına
uymaktadır. F dağılışı simetrik olmayan bir dağılıştır. Bu nedenle
güven aralığının hesaplanmasında her iki F değeri için F tablosuna
bakmak gerekmektedir.
1 2
2121
n 1,n 1 2222
s
Fs
1
1/
/
1,1;2
22
21
22
21
1,1;2
122
21
1,1;2
22
22
21
21
1,1;2
1
2121
2121
nnnn
nnnn
Fs
sF
s
sP
Fs
sFP
66
1 2
2 1
1 ; 1, 12
; 1, 12
1
n n
n n
FF
11
1
1,1;2
22
21
22
21
1,1;2
22
21
1,1;2
22
21
22
21
1,1;2
122
21
21
12
2121
nnnn
nnnn
Fs
s
Fs
sP
Fs
sF
s
sP
67
İKİ POPULASYON VARYANSININ KARŞILAŞTIRILMASI Normal dağılımlı iki populasyonun varyanslarının oranına ilişkin güven
aralığı :
F 0
1 2α / 2;n 1,n 1,F 1 21-α / 2;n 1,n 1,F
11
1,1;2
22
21
22
21
1,1;2
22
21
21
12
nnnn
Fs
s
Fs
sP
68
İKİ POPULASYON VARYANSININ KARŞILAŞTIRILMASI Aşağıda verilen bilgiler yardımıyla pazara sunulan iki ayrı bağımsız hisse
senedinin değişkenliklerinin oranına ilişkin çift yönlü güven aralığını bulunuz.
21 123.38s 2
2 8.02s 02.0
0.99;16,100.01;10,16
1 10.271
3.69F
F
1 2
2 1
1 ; 1, 12
; 1, 12
1
n n
n n
FF
2 11n1 17n
11
1,1;2
22
21
22
21
1,1;2
22
21
21
12
nnnn
Fs
s
Fs
sP
56.410.16,01.01,1;
2 21
FFnn
69
21 123.38S 2
2 8.02S 2 11n 1 17n
156.4
02.8
38.123
69.3
1
02.8
38.12322
21P
1
110,16;01.02
2
21
22
21
16,10;01.022
21 F
s
s
Fs
sP
98.067.69168.4
98.0)56.4(38.15)271.0(38.15
22
21
22
21
P
P
85.2
49.2
10,16,05.0
16,10,05.0
F
F
ÖRNEKÖRNEKPazara yeni sürülmüş on yedi AAA dereceli sınai tahvilden oluşan rassal Pazara yeni sürülmüş on yedi AAA dereceli sınai tahvilden oluşan rassal
bir örneklemde vadelerin varyansı 123.35’dir. Onbir yeni CCC dereceli bir örneklemde vadelerin varyansı 123.35’dir. Onbir yeni CCC dereceli
sınai tahvilden oluşan bağımsız bir rassal örneklemde vadelerin varyansı sınai tahvilden oluşan bağımsız bir rassal örneklemde vadelerin varyansı
8.02’dir. Bu iki tahvilin değişkenliklerinin %90 güven aralığını bulunuz.8.02’dir. Bu iki tahvilin değişkenliklerinin %90 güven aralığını bulunuz.
n1=17 s12=123.35 s2
2=8.02 n1-1=16 n2-1=10 sd.n2=11
11
1,1;2
22
21
22
21
1,1;2
22
21
21
12
nnnn
Fs
s
Fs
sP
38.1502.8
35.12322
21 s
s
71
90.0)85.2(38.15)49.2
1(38.15
22
21
P
90.083.4318.622
21
P
90.0)85.2(38.15)402.0(38.1522
21
P