tanimlayiciistatistikler_merkeziegilim
DESCRIPTION
lTRANSCRIPT
1
TANIMLAYICI İSTATİSTİKLER
MERKEZİ EĞİLİM ÖLÇÜLERİ
Dr. Mehmet AKSARAYLIDr. Mehmet AKSARAYLID.E.D.E.ÜÜ. . İİ..İİ.B.F..B.F.
EKONOMETREKONOMETRİİ BBÖÖLLÜÜMMÜÜ[email protected]@deu.edu.tr
Tanımlayıcı İstatistikler
•Duyarlı Ortalamalar
•Aritmetik ort.
•Tartılı Aritmetik •Geometrik ort.•Kareli ort.•Harmonik ort.
•Duyarlı Olmayan Ort.•Mod•Medyan•Kartiller
•Değişim Aralığı (Range)•Standart sapma•Varyans•Mutlak sapma•Değişkenlik katsayısı•Kartil sapma katsayısı•Ortalama sapma katsayısı
•Bowley asimetri ölçüsü•Pearson asimetri ölçüsü
Basıklık Ölçüleri
Yer Ölçüleri (Merkezi Eğilim Ölçüleri)
Değişkenlik Ölçüleri Çarpıklık Ölçüleri
Aritmetik Ortalama • Üzerinde inceleme yapılan veri setindeki
elemanların toplanıp incelenen eleman sayısına bölünmesiyle elde edilen yer ölçüsüne aritmetik ortalama denir.
• Halk dilinde ortalama ifadesi kullanıldığında ilk akla gelen kavram aritmetik ortalamadır.
• Örnek:– Sınav notlarının ortalaması,– Yaz aylarında m2’ye düşen ortalama yağış miktarı
Yer Ölçüleri: Aritmetik – Ortalama - Mod - Medyan
Basit Veriler İçin
Yaş: 24, 26, 20, 18, 24
Aritmetik Ortalama = X iXn
= ∑
Mod= 24
=(24+26+20+18+24)/5
18,
Medyan=24
=22.4
20, 24, 2624,
Gruplandırılmış Veriler İçin10 bayanın ayakkabı numaraları:
35, 38, 36, 36, 37, 36, 38, 35, 39, 37,
=36.7X = i i
i
X ff
∑∑
Grup
35 36373839Σ
Medyan = (10+1)/2=5,5. Veri = 36.5
Frekans
23221
10
35, 35, 36, 36, 36, 37, 37, 38, 38, 39,
Xifi
70108747639
367
=367/10
Mod=en çok tekrar eden veri=36
Yer Ölçüleri: Aritmetik – Ortalama - Mod - Medyan
f : frekans
k: grup sayısı
i = 1,2,3,……….,k
Sınıflanmış Seriler İçin Aritmetik Ortalama
nfk
i i=∑
=1
∑
∑
=
== k
i i
k
i ii
f
fmx
1
1
f : frekans
k : sınıf sayısı
i = 1,2,3,……….,k
m : sınıf orta noktası
• Sınıflanmış serilerde her bir sınıf içindeki değerlerin neler olduğu bilinmediğinden ve yalnızca her bir sınıfın frekans değerleri bilindiğinden dolayı sınıfı temsil etmek üzere sınıf orta noktaları hesaplamada kullanılır.
• Kullanılan formül gruplanmış seriler için kullanılan formüle benzerdir.
2
Örnek: Sınıflandırılmış Veriler İçin Aritmetik ortalama
X = i i
i
m ff
∑∑ = 365/25
25Σ
140 – 50’dan az
230 – 40’’dan az
420 - 30’dan az
610 - 20’dan az
120 – 10’dan az
fiSınıflar
=14.6
45
35
25
15
5
mi
365
45
70
100
90
60
fi.mi
25
24
22
18
12
Birikimlifi = Σfi
Aritmetik ortalamanın özellikleri:
• Örnek elemanları ortalama etrafında toplanma eğilimdedir yani örneği en iyi temsil eden tek bir simetrik değerdir.
•n
xx ∑=
∑= xxn0=−∑ xnx
0x
x nn
− =∑∑
0=−∑∑ xx
( ) 0=−∑ xx
Aritmetik ortalamadan sapmaların toplamı sıfırdır.
AĞIRLIKLI ARİTMETİK ORTALAMA:
• İndex sayıların hesaplanmasında, yüzdelerin ortalamasında çarpımların ortalamasının alınmasında kullanılır .
Basit seriler için
Frekans verileri için
∑∑
wwx
xw
∑∑=
wfwfx
xw...
.../21
2211
++++
=ΣΣ=ff
xfxfwwfx iiiw
..............ˆ...............
21
2211
1
11
++++
=∑
==∑ ff
xfxfwwx
wwxX
i
iiw
Örnek:İstatistiki Bölge Birimleri Sınıflandırmasına göre Türkiye toplam 12 bölgeye
ayrılmaktadır. Aşağıda bu bölgelere ilişkin 2000 yılı nüfus ve kişi başına düşen GSYİH (YTL) miktarları verilmektedir. Bu verilerden yola çıkarak Türkiye
geneline ilişkin ortalama kişi başına düşen GSYİH miktarını bulunuz.
175.0367.528.4TOPLAM5.273.11.7Doğu Karadeniz12
10.084.82.1Batı Karadeniz11
7.984.21.9Orta Anadolu10
21.758.72.5Akdeniz9
17.926.42.8Batı Anadolu8
22.235.73.9Doğu Marmara7
27.598.93.1Ege6
8.412.92.9Batı Marmara5
3710.03.7İstanbul4
9.246.61.4Güneydoğu Anadolu3
4.813.71.3Ortadoğu Anadolu2
2.752.51.1Kuzeydoğu Anadolu1
Toplam nüfus(1.000.000)GSYİH (1000YTL)BÖLGE ADIwxwx
Aritmetik ortalama ile hesaplanırsa:
1.1 1.3 1.4 3.7 2.9 3.1 3.9 2.8 2.5 1.9 2.1 1.7 28.4 2.36712 12
x + + + + + + + + + + += = =
Sakınca nedir?
Ağırlıklı aritmetik ortalama ile hesaplanırsa:
(1.1 2.5) (1.3 3.7) ... (1.7 3.1) 2.592.5 3.7 ... 3.1wx × + × + + ×
= =+ + +
GEOMETRİK ORTALAMA:
• Örnek veri değerleri çarpımının, örnek hacmi derecesinden köküne eşittir .
nnxxxxG ........ 321=
Özellikleri:1. olmalıdır.
2.Serideki değerlerin her birinin yerine geometrik ortalama konulduğunda serinin çarpım sonucu değişmez.
2.4.8.16.32 = 32768 = 8.8.8.8.8
3.Geometrik ortalamanın orijinal gözlemlerinin logaritmik sapmaları eşittir. Bu özellikten dolayı ortalama oranlara, değişme oranlarına, logaritmik dağılmış şekiller uygulanır. Örneğin; fiyat indekslerinde geometrik ortalama anlamlı sonuçlar verir.
0>ix
3
4.Aritmetik ortalama gerçekte nispi olan değerler yerine mutlak değerlenmiş gibi bir işleme bağlı tutularak çok artan nispi değerleri olduğundan fazla gösterir. Bu yüzden yukarı eğilimlidir.
5.Logaritmik bir dağılımda geometrik ortalamanın tercih nedeni böyle bir dağılımda mutlak sapmaların değil ancak merkezi eğilim etrafında nispi sapmaların simetrik olma eğilimidir.
6.G birimleri değerleri arasındaki orana göre değer alır.7.Uç değerlerden kadar etkilenmez.8.log x1-log G9.
10.
11.
G < x
1....................** 21 =Gx
Gx
Gx n
Gnxxx n ............. 21 =
• Basit seri :
( ) nn
nn
ii xxxxxG
1321
1
1
..........=⎟⎟⎠
⎞⎜⎜⎝
⎛= ∏
=
nnxxxxG ........ 321=
[ ] ⎥⎦
⎤⎢⎣
⎡=++= ∑
=
n
iin x
nxxx
nG
121 log1log.....loglog1log ∑
=
=n
iix
nantiG
!
log1log
Frekans serilerinde ise geometrik serinin hesaplanması:
( )1 2 1 21
1 2 1 2. ........ ...n nff ff f f ff
n nG x x x x x xΣ ∑= =
1 2
1 1 1 2 2 2
tane tane tane
..... ..... ............ .....n
n n nNf f f
G x x x x x x x x x=1424314243 14243
1 21 2
1 2 1 2.... ...n
nff f
N ff fn nx x x x x x= =
[ ] ∑=Σ
=+++Σ
=n
iiinn xf
fxfxfxf
fG
12211 log1log......loglog1log
∑=Σ
=n
iii xf
fantiG
1log1log
Bileşik Faiz Formülü
( )nn rPP += 10 ( )0
1PP
r nn =+ ( ) n n
PP
r0
1 =+
1−= n
o
n
PP
rn
PPr on loglog)1log(
−=+
P0=başlayış miktarır= faizn=yılPn=n yıl sonraki meblağ
Örnek: 3 yılda 1000$, 5000$ a artmıştır. Yıllık ortalama artış yüzdesi nedir?
3500% gibi gözükse de bu ortalama % artışı doğru değildir.
“r ortalama artış yüzdesini göstermektedir
Başlangıç 10001 yıl sonra 1000(1+r)2 yıl sonra 1000(1+r)2
3 yıl sonra 1000(1+r)3=5000
( )31 5r+ =
3 5 1r = −
HARMONİK ORTALAMA
Gözlemlerin terslerinin aritmetik ortalamasının tersidir.
HGx >>
∑=
=++
= n
i in x
n
nxxx
H
121
11......111
nx
H
n
i i∑== 1
11veya
Harmonik ortalama aşağı eğimlidir. H.O’da 0>ix olmalıdır.
nxxx .......21 == HGx ==Eğer ise olur.
H.O belli koşullar altında ve belli fiyat tipleri altında zaman serilerini ortalamak için kullanılır.
Uygulamada sabit ve değişken birimler vardır. Örneğin; 1 birimlik mal A kişisi tarafından 30 dk’da ve yine 1 birimlik mal B kişisi tarafından 20 dk’da
üretiliyorsa mal miktarı sabit, zaman değişkendir. Ortalaması alınan değişkendir yani zamandır.
24
301
201
2=
+=H dk’da 1kg mal (ort.) üretilmektedir
Uçakla 400 km, trenle 60 km(570km)
hkmOH /10446
4800
2400462
601
4001
2. ≅==+
=
Harmonik Ortalama uygulama yerleri Zaman birimi başına hız
Para birimi başına satın alınan birim sayısı
4
Örnek: A ve B gibi iki şehir arasında 100km lik bir yol vardır. Bir otomobilli yolun ilk yarısını 30 km/saat hızla gidiyor. Diğer yarısını 40
km/saat hızla gidiyor. Hız ortalaması nedir?
v = ortalama hız ; t = geçen zaman ; d = alınan yol
t2: Yolun ikinci yarısında geçen zaman 1 1 2 2. .
2d v t v t= =
t1: Yolun ilk yarısında geçen zaman
1 21 22 2
d dt ve tv v
= =1 2
1 2 1 2
1 1 1 1.2 2d vtt t t
v v v v⎛ ⎞ ⎛ ⎞
= + = + = +⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠
1 2 1 2
2 2 34.28 11 11 1 1 130 402 i
d vt nvt vt
xv v v v
= = = = = =⎛ ⎞ ⎛ ⎞ ⎛ ⎞++ + ⎜ ⎟⎜ ⎟ ⎜ ⎟ ⎝ ⎠⎝ ⎠ ⎝ ⎠
∑
Harmonik ortalama
KUADRATİK ORTALAMA :Gözlemlerin karelerinin aritmetik ortalamasının köküdür. Standart sapmanın hesaplanmasında kullanılır. Ortalama değerlerinin ortalamasında kullanılmaz.
HGxK >>>
2xKnΣ
=
Mod• Bir veri setinde en çok gözlenen ( en çok tekrar
eden ) değere veya frekansı en fazla olan şans değişkeni değerine mod adı verilir.
• Veri setinin modu olmayacağı gibi birden fazla da modu olabilir.
• Mod genellikle kesikli şans değişkenli için oluşturulan gruplanmış serilerde aritmetik ortalama yerine kullanılabilir.
Basit Seriler İçin Mod
Örnek: Bir fabrikada çalışan 7 endüstri mühendisinin bildiği yabancı dil sayıları aşağıda verilmiştir. Buna göre bu mühendislerin bildiği yabancı dil sayısının modunuhesaplayınız.
xi : 2,0,1,2,0,1,0 0,0,0,1,1,2,2.
Veri setinde en çok tekrar eden eleman 0 olduğundan (3 kez ) mod değeri 0 ‘dır.
• Eğer veri seti 1,0,1,2,0,1,0 şeklinde olsaydı veri seti iki modlu olacaktı. ( 0 ve 1 )
• Eğer veri seti 2,0,1,2,0,1 şeklinde olsaydı veri setinin modunun olmadığı ifade edilecekti.
Gruplanmış Seriler İçin Mod
Ekran Satış Adedi
51 166 372 482 594 7
Örnek: Aşağıdaki tabloda bir TV bayisindeki LCD televizyonların ekran boyutlarına göre satış miktarlarıverilmiştir. Frekans dağılımının aritmetik ortalamasınıhesaplayınız.
• Frekans dağılımına bakıldığında en fazla satış miktarı 94 ekran LCD televizyonda olduğundan dolayı ( 7 adet ) dağılımın modunun 94 olduğu söylenir.
• Eğer 82 ekran LCD televizyonlarından da 7 adet satılsaydı dağılımın iki modu olduğu ifade edilirdi. ( 82 ve 94 )
Sınıflanmış Seriler İçin Mod
• Sınıflanmış serilerde mod değeri hesaplanırken ilk olarak mod sınıfı belirlenir.
• Mod sınıfı frekansı en yüksek olan sınıftır.
• Mod sınıfı belirlendikten sonra bu sınıf içerisinde yer alan modun tam değeri sınıf frekansı ve kendine komşu olan sınıf frekansları dikkate alınarak hesaplanır.
5
iL .21
1mod Δ+Δ
Δ+Mod =
Modsınıfının alt sınırı
Mod sınıfıyla bir önceki sınıf fr. arasındaki fark
Mod sınıfıyla bir sonraki sınıf fr. arasındaki fark
2524221812
Σfi
Sınıflandırılmış Veriler İçin
Mod
Sınıfı
25Σ
140 – 50’dan az230 – 40’’dan az420 - 30’dan az610 - 20’dan az
120 – 10’dan azfiSınıflar
453525155mi
3654570
1009060
fi.mi
Sınıf aralığı
Medyan • Bir veri setini büyükten küçüğe veya küçükten
büyüğe sıraladığımızda tam orta noktadan veri setini iki eşit parçaya ayıran değere medyan adıverilir.
• Veri setinde aşırı uçlu elemanlar olduğunda aritmetik ortalamaya göre daha güvenilirdir.
• Medyan, veri setindeki tüm elemanlardan etkilenmez.
Basit Seriler İçin Medyan
21+n
12+
n
• Veri Setinin Hacmi Tek Sayı İse;
nci gözlem değeri medyandır.
• Veri Setinin Hacmi Çift Sayı İse;
ve nci gözlem değerinin aritmetik
ortalaması medyandır.2n
Örnek: İstatistik I dersini alan 10 öğrencinin vize notları aşağıdaki gibi sıralanmıştır. Buna göre vize notları için medyan değerini hesaplayınız.
30,42,56,61,68,79,82,88,90,98
n/2 ve (n/2)+1 nci elemanlar 68 ve 79 olup bunların ortalaması 73,5 medyan değeridir.
Veri Seti 30,42,56,61,68,79,82,88,90 şeklinde 9 adet veriden oluşsaydı (n+1)/2 nci eleman olan 68 veri setinin medyanı olacaktı.
Gruplanmış Seriler İçin Medyan
• Gruplanmış serilerde medyan değeri hesaplanırken veri setinin tam orta noktasının hangi gruba ait olduğunu belirlemek için kümülatif frekans sütunu oluşturulur.
• Sıra numarası belirlendikten sonra o sıra numarasına ait grup medyan değeri olarak ifade edilir.
Grup Frekans ∑ fi
51 1 166 3 472 4 882 5 1394 7 20
Örnek: Yandaki tabloda bir TV bayisindeki LCD televizyonların ekran boyutlarına göre satışmiktarları verilmiştir. Frekans dağılımının medyanını hesaplayınız.
• n/2 ve (n/2)+1 nci gözlem değerlerine karşılık gelen değerler(10 ve 11 nci sıra ) 82 olduğundan dolayı medyan değeri 82’dir.
• Frekans dağılımı yandaki gibi olsaydı (n+1)/2 nci elemana ( 8 ncielemana ) karşılık gelen sayı 72 olduğunda dolayı veri setinin medyanı 72 olacak idi.
Grup Frekans ∑ fi
51 1 166 3 472 4 882 5 1394 2 15
6
Sınıflanmış Seriler İçin Medyan
• Sınıflanmış serilerde medyan değeri hesaplanırken ilk olarak medyan sınıfı belirlenir.
• Medyan sınıfı kümülatif frekanslar dikkate alındığında toplam frekansın yarısını içinde bulunduran sınıftır.
• Medyan sınıfı belirlendikten sonra medyan sınıfından bir önceki sınıfın kümülatif frekansı ve medyan sınıfıfrekansı dikkate alınarak hesaplanır.
2524221812
Σfi
Sınıflandırılmış Veriler İçin
Med = i
1
medmed
ff
2L .if
−Σ+
∑
Medyan sınıfının alt sınırı Medyan sınıfının
frekansıSınıf aralığı
Medyan sınıfından bir önceki sınıfın Yığmalı frekansı
Medyan
Sınıfı25Σ
140 – 50’dan az230 – 40’’dan az420 - 30’dan az610 - 20’dan az
120 – 10’dan azfiSınıflar
453525155mi
3654570
1009060
fi.mi
iL .21
1mod Δ+Δ
Δ+Mod = (12 0)0 .10 6.67
(12 0) (12 6)−
= + =− + −
2524221812
Σfi
Sınıflandırılmış Veriler İçin
Mod
Sınıfı
25Σ
140 – 50’dan az230 – 40’’dan az420 - 30’dan az610 - 20’dan az
120 – 10’dan azfiSınıflar
453525155mi
3654570
1009060
fi.mi
2524221812
Σfi
Sınıflandırılmış Veriler İçin
Med = i
med
medmed
ff
2L .if
−Σ+
∑ 25 12210 .10 10.83
6
−= + =
Medyan
Sınıfı25Σ
140 – 50’dan az230 – 40’’dan az420 - 30’dan az610 - 20’dan az
120 – 10’dan azfiSınıflar
453525155mi
3654570
1009060
fi.mi
0
2
4
6
8
10
12
14
0_10 10 _20 20_30 30_40 40_50
Med =10.83
Mod = 6.67
A.O.=14.6
if
ff
LQQ
li
Q .41
11
−+=
∑i
f
ff
LMedQQ
li
Q .22
22
−+==
∑i
f
ff
LQQ
li
Q .43
31
33
−+=
∑
%25 %25
%25%25
Q1 Q2 Q3
KARTİLLER
7
if
ff
LQQ
li
Q .41
11
−+=
∑83.3520.
12
84
70
20 =−
+=
Q1 sınıfı
701080-100601560-80’den az452540-60’dan az201220-40’dan az880-20’den azΣfifiSınıflar
if
ff
LMedQQ
li
Q .22
22
−+==
∑5220.
25
20270
40 =−
+=
Q2 sınıfı
701080-100601560-80’den az452540-60’dan az201220-40’dan az880-20’den azΣfifiSınıflar
if
ff
LQQ
li
Q .43
31
33
−+=
∑7020.
15
454703
60 =−
×
+=
Q3 sınıfı
701080-100601560-80’den az452540-60’dan az201220-40’dan az880-20’den azΣfifiSınıflar