tanimlayiciistatistikler_merkeziegilim

7
1 TANIMLAYICI İSTATİSTİKLER MERKEZİ EĞİLİM ÖLÇÜLERİ Dr. Mehmet AKSARAYLI Dr. Mehmet AKSARAYLI D.E. D.E.Ü. . İ.İ.B.F. .B.F. EKONOMETR EKONOMETRİ BÖLÜMÜ mehmet. mehmet.aksarayli aksarayli@deu.edu.tr @deu.edu.tr Tanımlayıcı İstatistikler •Duyarlı Ortalamalar •Aritmetik ort. •Tartılı Aritmetik •Geometrik ort. •Kareli ort. •Harmonik ort. •Duyarlı Olmayan Ort. •Mod •Medyan •Kartiller •Değişim Aralığı (Range) •Standart sapma •Varyans •Mutlak sapma •Değişkenlik katsayısı •Kartil sapma katsayısı •Ortalama sapma katsayısı •Bowley asimetri ölçüsü •Pearson asimetri ölçüsü Basıklık Ölçüleri Yer Ölçüleri (Merkezi Eğilim Ölçüleri) Değişkenlik Ölçüleri Çarpıklık Ölçüleri Aritmetik Ortalama • Üzerinde inceleme yapılan veri setindeki elemanların toplanıp incelenen eleman sayısına bölünmesiyle elde edilen yer ölçüsüne aritmetik ortalama denir. • Halk dilinde ortalama ifadesi kullanıldığında ilk akla gelen kavram aritmetik ortalamadır. • Örnek: Sınav notlarının ortalaması, Yaz aylarında m 2 ’ye düşen ortalama yağış miktarı Yer Ölçüleri: Aritmetik – Ortalama - Mod - Medyan Basit Veriler İçin Yaş: 24, 26, 20, 18, 24 Aritmetik Ortalama = X i X n = Mod= 24 =(24+26+20+18+24)/5 18, Medyan=24 =22.4 20, 24, 26 24, Gruplandırılmış Veriler İçin 10 bayanın ayakkabı numaraları: 35, 38, 36, 36, 37, 36, 38, 35, 39, 37, =36.7 X = i i i Xf f Grup 35 36 37 38 39 Σ Medyan = (10+1)/2=5,5. Veri = 36.5 Frekans 2 3 2 2 1 10 35, 35, 36, 36, 36, 37, 37, 38, 38, 39, X i f i 70 108 74 76 39 367 =367/10 Mod=en çok tekrar eden veri=36 Yer Ölçüleri: Aritmetik – Ortalama - Mod - Medyan f : frekans k: grup sayısı i = 1,2,3,……….,k Sınıflanmış Seriler İçin Aritmetik Ortalama n f k i i = =1 = = = k i i k i i i f f m x 1 1 f : frekans k : sınıf sayısı i = 1,2,3,……….,k m : sınıf orta noktası •Sınıflanmış serilerde her bir sınıf içindeki değerlerin neler olduğu bilinmediğinden ve yalnızca her bir sınıfın frekans değerleri bilindiğinden dolayı sınıfı temsil etmek üzere sınıf orta noktaları hesaplamada kullanılır. • Kullanılan formül gruplanmış seriler için kullanılan formüle benzerdir.

Upload: baltimorlu

Post on 27-Jan-2016

220 views

Category:

Documents


1 download

DESCRIPTION

l

TRANSCRIPT

Page 1: TanimlayiciIstatistikler_merkeziegilim

1

TANIMLAYICI İSTATİSTİKLER

MERKEZİ EĞİLİM ÖLÇÜLERİ

Dr. Mehmet AKSARAYLIDr. Mehmet AKSARAYLID.E.D.E.ÜÜ. . İİ..İİ.B.F..B.F.

EKONOMETREKONOMETRİİ BBÖÖLLÜÜMMÜÜ[email protected]@deu.edu.tr

Tanımlayıcı İstatistikler

•Duyarlı Ortalamalar

•Aritmetik ort.

•Tartılı Aritmetik •Geometrik ort.•Kareli ort.•Harmonik ort.

•Duyarlı Olmayan Ort.•Mod•Medyan•Kartiller

•Değişim Aralığı (Range)•Standart sapma•Varyans•Mutlak sapma•Değişkenlik katsayısı•Kartil sapma katsayısı•Ortalama sapma katsayısı

•Bowley asimetri ölçüsü•Pearson asimetri ölçüsü

Basıklık Ölçüleri

Yer Ölçüleri (Merkezi Eğilim Ölçüleri)

Değişkenlik Ölçüleri Çarpıklık Ölçüleri

Aritmetik Ortalama • Üzerinde inceleme yapılan veri setindeki

elemanların toplanıp incelenen eleman sayısına bölünmesiyle elde edilen yer ölçüsüne aritmetik ortalama denir.

• Halk dilinde ortalama ifadesi kullanıldığında ilk akla gelen kavram aritmetik ortalamadır.

• Örnek:– Sınav notlarının ortalaması,– Yaz aylarında m2’ye düşen ortalama yağış miktarı

Yer Ölçüleri: Aritmetik – Ortalama - Mod - Medyan

Basit Veriler İçin

Yaş: 24, 26, 20, 18, 24

Aritmetik Ortalama = X iXn

= ∑

Mod= 24

=(24+26+20+18+24)/5

18,

Medyan=24

=22.4

20, 24, 2624,

Gruplandırılmış Veriler İçin10 bayanın ayakkabı numaraları:

35, 38, 36, 36, 37, 36, 38, 35, 39, 37,

=36.7X = i i

i

X ff

∑∑

Grup

35 36373839Σ

Medyan = (10+1)/2=5,5. Veri = 36.5

Frekans

23221

10

35, 35, 36, 36, 36, 37, 37, 38, 38, 39,

Xifi

70108747639

367

=367/10

Mod=en çok tekrar eden veri=36

Yer Ölçüleri: Aritmetik – Ortalama - Mod - Medyan

f : frekans

k: grup sayısı

i = 1,2,3,……….,k

Sınıflanmış Seriler İçin Aritmetik Ortalama

nfk

i i=∑

=1

=

== k

i i

k

i ii

f

fmx

1

1

f : frekans

k : sınıf sayısı

i = 1,2,3,……….,k

m : sınıf orta noktası

• Sınıflanmış serilerde her bir sınıf içindeki değerlerin neler olduğu bilinmediğinden ve yalnızca her bir sınıfın frekans değerleri bilindiğinden dolayı sınıfı temsil etmek üzere sınıf orta noktaları hesaplamada kullanılır.

• Kullanılan formül gruplanmış seriler için kullanılan formüle benzerdir.

Page 2: TanimlayiciIstatistikler_merkeziegilim

2

Örnek: Sınıflandırılmış Veriler İçin Aritmetik ortalama

X = i i

i

m ff

∑∑ = 365/25

25Σ

140 – 50’dan az

230 – 40’’dan az

420 - 30’dan az

610 - 20’dan az

120 – 10’dan az

fiSınıflar

=14.6

45

35

25

15

5

mi

365

45

70

100

90

60

fi.mi

25

24

22

18

12

Birikimlifi = Σfi

Aritmetik ortalamanın özellikleri:

• Örnek elemanları ortalama etrafında toplanma eğilimdedir yani örneği en iyi temsil eden tek bir simetrik değerdir.

•n

xx ∑=

∑= xxn0=−∑ xnx

0x

x nn

− =∑∑

0=−∑∑ xx

( ) 0=−∑ xx

Aritmetik ortalamadan sapmaların toplamı sıfırdır.

AĞIRLIKLI ARİTMETİK ORTALAMA:

• İndex sayıların hesaplanmasında, yüzdelerin ortalamasında çarpımların ortalamasının alınmasında kullanılır .

Basit seriler için

Frekans verileri için

∑∑

wwx

xw

∑∑=

wfwfx

xw...

.../21

2211

++++

=ΣΣ=ff

xfxfwwfx iiiw

..............ˆ...............

21

2211

1

11

++++

=∑

==∑ ff

xfxfwwx

wwxX

i

iiw

Örnek:İstatistiki Bölge Birimleri Sınıflandırmasına göre Türkiye toplam 12 bölgeye

ayrılmaktadır. Aşağıda bu bölgelere ilişkin 2000 yılı nüfus ve kişi başına düşen GSYİH (YTL) miktarları verilmektedir. Bu verilerden yola çıkarak Türkiye

geneline ilişkin ortalama kişi başına düşen GSYİH miktarını bulunuz.

175.0367.528.4TOPLAM5.273.11.7Doğu Karadeniz12

10.084.82.1Batı Karadeniz11

7.984.21.9Orta Anadolu10

21.758.72.5Akdeniz9

17.926.42.8Batı Anadolu8

22.235.73.9Doğu Marmara7

27.598.93.1Ege6

8.412.92.9Batı Marmara5

3710.03.7İstanbul4

9.246.61.4Güneydoğu Anadolu3

4.813.71.3Ortadoğu Anadolu2

2.752.51.1Kuzeydoğu Anadolu1

Toplam nüfus(1.000.000)GSYİH (1000YTL)BÖLGE ADIwxwx

Aritmetik ortalama ile hesaplanırsa:

1.1 1.3 1.4 3.7 2.9 3.1 3.9 2.8 2.5 1.9 2.1 1.7 28.4 2.36712 12

x + + + + + + + + + + += = =

Sakınca nedir?

Ağırlıklı aritmetik ortalama ile hesaplanırsa:

(1.1 2.5) (1.3 3.7) ... (1.7 3.1) 2.592.5 3.7 ... 3.1wx × + × + + ×

= =+ + +

GEOMETRİK ORTALAMA:

• Örnek veri değerleri çarpımının, örnek hacmi derecesinden köküne eşittir .

nnxxxxG ........ 321=

Özellikleri:1. olmalıdır.

2.Serideki değerlerin her birinin yerine geometrik ortalama konulduğunda serinin çarpım sonucu değişmez.

2.4.8.16.32 = 32768 = 8.8.8.8.8

3.Geometrik ortalamanın orijinal gözlemlerinin logaritmik sapmaları eşittir. Bu özellikten dolayı ortalama oranlara, değişme oranlarına, logaritmik dağılmış şekiller uygulanır. Örneğin; fiyat indekslerinde geometrik ortalama anlamlı sonuçlar verir.

0>ix

Page 3: TanimlayiciIstatistikler_merkeziegilim

3

4.Aritmetik ortalama gerçekte nispi olan değerler yerine mutlak değerlenmiş gibi bir işleme bağlı tutularak çok artan nispi değerleri olduğundan fazla gösterir. Bu yüzden yukarı eğilimlidir.

5.Logaritmik bir dağılımda geometrik ortalamanın tercih nedeni böyle bir dağılımda mutlak sapmaların değil ancak merkezi eğilim etrafında nispi sapmaların simetrik olma eğilimidir.

6.G birimleri değerleri arasındaki orana göre değer alır.7.Uç değerlerden kadar etkilenmez.8.log x1-log G9.

10.

11.

G < x

1....................** 21 =Gx

Gx

Gx n

Gnxxx n ............. 21 =

• Basit seri :

( ) nn

nn

ii xxxxxG

1321

1

1

..........=⎟⎟⎠

⎞⎜⎜⎝

⎛= ∏

=

nnxxxxG ........ 321=

[ ] ⎥⎦

⎤⎢⎣

⎡=++= ∑

=

n

iin x

nxxx

nG

121 log1log.....loglog1log ∑

=

=n

iix

nantiG

!

log1log

Frekans serilerinde ise geometrik serinin hesaplanması:

( )1 2 1 21

1 2 1 2. ........ ...n nff ff f f ff

n nG x x x x x xΣ ∑= =

1 2

1 1 1 2 2 2

tane tane tane

..... ..... ............ .....n

n n nNf f f

G x x x x x x x x x=1424314243 14243

1 21 2

1 2 1 2.... ...n

nff f

N ff fn nx x x x x x= =

[ ] ∑=Σ

=+++Σ

=n

iiinn xf

fxfxfxf

fG

12211 log1log......loglog1log

∑=Σ

=n

iii xf

fantiG

1log1log

Bileşik Faiz Formülü

( )nn rPP += 10 ( )0

1PP

r nn =+ ( ) n n

PP

r0

1 =+

1−= n

o

n

PP

rn

PPr on loglog)1log(

−=+

P0=başlayış miktarır= faizn=yılPn=n yıl sonraki meblağ

Örnek: 3 yılda 1000$, 5000$ a artmıştır. Yıllık ortalama artış yüzdesi nedir?

3500% gibi gözükse de bu ortalama % artışı doğru değildir.

“r ortalama artış yüzdesini göstermektedir

Başlangıç 10001 yıl sonra 1000(1+r)2 yıl sonra 1000(1+r)2

3 yıl sonra 1000(1+r)3=5000

( )31 5r+ =

3 5 1r = −

HARMONİK ORTALAMA

Gözlemlerin terslerinin aritmetik ortalamasının tersidir.

HGx >>

∑=

=++

= n

i in x

n

nxxx

H

121

11......111

nx

H

n

i i∑== 1

11veya

Harmonik ortalama aşağı eğimlidir. H.O’da 0>ix olmalıdır.

nxxx .......21 == HGx ==Eğer ise olur.

H.O belli koşullar altında ve belli fiyat tipleri altında zaman serilerini ortalamak için kullanılır.

Uygulamada sabit ve değişken birimler vardır. Örneğin; 1 birimlik mal A kişisi tarafından 30 dk’da ve yine 1 birimlik mal B kişisi tarafından 20 dk’da

üretiliyorsa mal miktarı sabit, zaman değişkendir. Ortalaması alınan değişkendir yani zamandır.

24

301

201

2=

+=H dk’da 1kg mal (ort.) üretilmektedir

Uçakla 400 km, trenle 60 km(570km)

hkmOH /10446

4800

2400462

601

4001

2. ≅==+

=

Harmonik Ortalama uygulama yerleri Zaman birimi başına hız

Para birimi başına satın alınan birim sayısı

Page 4: TanimlayiciIstatistikler_merkeziegilim

4

Örnek: A ve B gibi iki şehir arasında 100km lik bir yol vardır. Bir otomobilli yolun ilk yarısını 30 km/saat hızla gidiyor. Diğer yarısını 40

km/saat hızla gidiyor. Hız ortalaması nedir?

v = ortalama hız ; t = geçen zaman ; d = alınan yol

t2: Yolun ikinci yarısında geçen zaman 1 1 2 2. .

2d v t v t= =

t1: Yolun ilk yarısında geçen zaman

1 21 22 2

d dt ve tv v

= =1 2

1 2 1 2

1 1 1 1.2 2d vtt t t

v v v v⎛ ⎞ ⎛ ⎞

= + = + = +⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠

1 2 1 2

2 2 34.28 11 11 1 1 130 402 i

d vt nvt vt

xv v v v

= = = = = =⎛ ⎞ ⎛ ⎞ ⎛ ⎞++ + ⎜ ⎟⎜ ⎟ ⎜ ⎟ ⎝ ⎠⎝ ⎠ ⎝ ⎠

Harmonik ortalama

KUADRATİK ORTALAMA :Gözlemlerin karelerinin aritmetik ortalamasının köküdür. Standart sapmanın hesaplanmasında kullanılır. Ortalama değerlerinin ortalamasında kullanılmaz.

HGxK >>>

2xKnΣ

=

Mod• Bir veri setinde en çok gözlenen ( en çok tekrar

eden ) değere veya frekansı en fazla olan şans değişkeni değerine mod adı verilir.

• Veri setinin modu olmayacağı gibi birden fazla da modu olabilir.

• Mod genellikle kesikli şans değişkenli için oluşturulan gruplanmış serilerde aritmetik ortalama yerine kullanılabilir.

Basit Seriler İçin Mod

Örnek: Bir fabrikada çalışan 7 endüstri mühendisinin bildiği yabancı dil sayıları aşağıda verilmiştir. Buna göre bu mühendislerin bildiği yabancı dil sayısının modunuhesaplayınız.

xi : 2,0,1,2,0,1,0 0,0,0,1,1,2,2.

Veri setinde en çok tekrar eden eleman 0 olduğundan (3 kez ) mod değeri 0 ‘dır.

• Eğer veri seti 1,0,1,2,0,1,0 şeklinde olsaydı veri seti iki modlu olacaktı. ( 0 ve 1 )

• Eğer veri seti 2,0,1,2,0,1 şeklinde olsaydı veri setinin modunun olmadığı ifade edilecekti.

Gruplanmış Seriler İçin Mod

Ekran Satış Adedi

51 166 372 482 594 7

Örnek: Aşağıdaki tabloda bir TV bayisindeki LCD televizyonların ekran boyutlarına göre satış miktarlarıverilmiştir. Frekans dağılımının aritmetik ortalamasınıhesaplayınız.

• Frekans dağılımına bakıldığında en fazla satış miktarı 94 ekran LCD televizyonda olduğundan dolayı ( 7 adet ) dağılımın modunun 94 olduğu söylenir.

• Eğer 82 ekran LCD televizyonlarından da 7 adet satılsaydı dağılımın iki modu olduğu ifade edilirdi. ( 82 ve 94 )

Sınıflanmış Seriler İçin Mod

• Sınıflanmış serilerde mod değeri hesaplanırken ilk olarak mod sınıfı belirlenir.

• Mod sınıfı frekansı en yüksek olan sınıftır.

• Mod sınıfı belirlendikten sonra bu sınıf içerisinde yer alan modun tam değeri sınıf frekansı ve kendine komşu olan sınıf frekansları dikkate alınarak hesaplanır.

Page 5: TanimlayiciIstatistikler_merkeziegilim

5

iL .21

1mod Δ+Δ

Δ+Mod =

Modsınıfının alt sınırı

Mod sınıfıyla bir önceki sınıf fr. arasındaki fark

Mod sınıfıyla bir sonraki sınıf fr. arasındaki fark

2524221812

Σfi

Sınıflandırılmış Veriler İçin

Mod

Sınıfı

25Σ

140 – 50’dan az230 – 40’’dan az420 - 30’dan az610 - 20’dan az

120 – 10’dan azfiSınıflar

453525155mi

3654570

1009060

fi.mi

Sınıf aralığı

Medyan • Bir veri setini büyükten küçüğe veya küçükten

büyüğe sıraladığımızda tam orta noktadan veri setini iki eşit parçaya ayıran değere medyan adıverilir.

• Veri setinde aşırı uçlu elemanlar olduğunda aritmetik ortalamaya göre daha güvenilirdir.

• Medyan, veri setindeki tüm elemanlardan etkilenmez.

Basit Seriler İçin Medyan

21+n

12+

n

• Veri Setinin Hacmi Tek Sayı İse;

nci gözlem değeri medyandır.

• Veri Setinin Hacmi Çift Sayı İse;

ve nci gözlem değerinin aritmetik

ortalaması medyandır.2n

Örnek: İstatistik I dersini alan 10 öğrencinin vize notları aşağıdaki gibi sıralanmıştır. Buna göre vize notları için medyan değerini hesaplayınız.

30,42,56,61,68,79,82,88,90,98

n/2 ve (n/2)+1 nci elemanlar 68 ve 79 olup bunların ortalaması 73,5 medyan değeridir.

Veri Seti 30,42,56,61,68,79,82,88,90 şeklinde 9 adet veriden oluşsaydı (n+1)/2 nci eleman olan 68 veri setinin medyanı olacaktı.

Gruplanmış Seriler İçin Medyan

• Gruplanmış serilerde medyan değeri hesaplanırken veri setinin tam orta noktasının hangi gruba ait olduğunu belirlemek için kümülatif frekans sütunu oluşturulur.

• Sıra numarası belirlendikten sonra o sıra numarasına ait grup medyan değeri olarak ifade edilir.

Grup Frekans ∑ fi

51 1 166 3 472 4 882 5 1394 7 20

Örnek: Yandaki tabloda bir TV bayisindeki LCD televizyonların ekran boyutlarına göre satışmiktarları verilmiştir. Frekans dağılımının medyanını hesaplayınız.

• n/2 ve (n/2)+1 nci gözlem değerlerine karşılık gelen değerler(10 ve 11 nci sıra ) 82 olduğundan dolayı medyan değeri 82’dir.

• Frekans dağılımı yandaki gibi olsaydı (n+1)/2 nci elemana ( 8 ncielemana ) karşılık gelen sayı 72 olduğunda dolayı veri setinin medyanı 72 olacak idi.

Grup Frekans ∑ fi

51 1 166 3 472 4 882 5 1394 2 15

Page 6: TanimlayiciIstatistikler_merkeziegilim

6

Sınıflanmış Seriler İçin Medyan

• Sınıflanmış serilerde medyan değeri hesaplanırken ilk olarak medyan sınıfı belirlenir.

• Medyan sınıfı kümülatif frekanslar dikkate alındığında toplam frekansın yarısını içinde bulunduran sınıftır.

• Medyan sınıfı belirlendikten sonra medyan sınıfından bir önceki sınıfın kümülatif frekansı ve medyan sınıfıfrekansı dikkate alınarak hesaplanır.

2524221812

Σfi

Sınıflandırılmış Veriler İçin

Med = i

1

medmed

ff

2L .if

−Σ+

Medyan sınıfının alt sınırı Medyan sınıfının

frekansıSınıf aralığı

Medyan sınıfından bir önceki sınıfın Yığmalı frekansı

Medyan

Sınıfı25Σ

140 – 50’dan az230 – 40’’dan az420 - 30’dan az610 - 20’dan az

120 – 10’dan azfiSınıflar

453525155mi

3654570

1009060

fi.mi

iL .21

1mod Δ+Δ

Δ+Mod = (12 0)0 .10 6.67

(12 0) (12 6)−

= + =− + −

2524221812

Σfi

Sınıflandırılmış Veriler İçin

Mod

Sınıfı

25Σ

140 – 50’dan az230 – 40’’dan az420 - 30’dan az610 - 20’dan az

120 – 10’dan azfiSınıflar

453525155mi

3654570

1009060

fi.mi

2524221812

Σfi

Sınıflandırılmış Veriler İçin

Med = i

med

medmed

ff

2L .if

−Σ+

∑ 25 12210 .10 10.83

6

−= + =

Medyan

Sınıfı25Σ

140 – 50’dan az230 – 40’’dan az420 - 30’dan az610 - 20’dan az

120 – 10’dan azfiSınıflar

453525155mi

3654570

1009060

fi.mi

0

2

4

6

8

10

12

14

0_10 10 _20 20_30 30_40 40_50

Med =10.83

Mod = 6.67

A.O.=14.6

if

ff

LQQ

li

Q .41

11

−+=

∑i

f

ff

LMedQQ

li

Q .22

22

−+==

∑i

f

ff

LQQ

li

Q .43

31

33

−+=

%25 %25

%25%25

Q1 Q2 Q3

KARTİLLER

Page 7: TanimlayiciIstatistikler_merkeziegilim

7

if

ff

LQQ

li

Q .41

11

−+=

∑83.3520.

12

84

70

20 =−

+=

Q1 sınıfı

701080-100601560-80’den az452540-60’dan az201220-40’dan az880-20’den azΣfifiSınıflar

if

ff

LMedQQ

li

Q .22

22

−+==

∑5220.

25

20270

40 =−

+=

Q2 sınıfı

701080-100601560-80’den az452540-60’dan az201220-40’dan az880-20’den azΣfifiSınıflar

if

ff

LQQ

li

Q .43

31

33

−+=

∑7020.

15

454703

60 =−

×

+=

Q3 sınıfı

701080-100601560-80’den az452540-60’dan az201220-40’dan az880-20’den azΣfifiSınıflar