prof. dr. Ömer akbulut - ataaof.edu.tr · tablolar ve grafikler atatürk Üniversitesi...
TRANSCRIPT
İÇİN
DEK
İLER
• Giriş
• Tanımlayıcı İstatistikler
• Frekans Tabloları
• Grafikler
HED
EFLE
R
• Bu üniteyi çalıştıktan sonra;
• Verileri frekans tablolarında özetleyebilecek,
• Grafiklerle gösterebilecek,
• Doğru tablo yapabilecek ve grafik çizebilecek,
• Tabloları ve grafikleri yorumlayabilecek,
• Sonuç çıkarabileceksiniz.
ÜNİTE
4
TABLOLAR VE GRAFİKLER
BİYOİSTATİSTİK Prof. Dr. Ömer AKBULUT
ÜNİTE
2
Tablolar ve Grafikler
Atatürk Üniversitesi Açıköğretim Fakültesi 2
Görsel özellik taşıyan
tanımlayıcı istatistik
metotları;
Frekans tabloları ve
Şekiller veya Grafikler
olarak iki ana grup
altında toplanır.
GİRİŞ
Sayımlar, kayıtlar, anket çalışmaları ve deneysel araştırmalardan elde edilen
sağlık, eğitim, üretim, tüketim, nüfus, tarım, trafik vb. alanlara ait ham verileri ilk
aşamada değerlendirmek ve bu verilerden sonuç çıkarmak veya bazı karakteristik
ölçüler hesaplamak tanımlayıcı istatistiğin (deskriptif) konusudur.
Tanımlayıcı istatistiğin amacı; tek tek incelendiklerinde ferler (üniteler) için bilgi veren, ancak populasyon hakkında bilgi vermeyen veya çok sınırlı bilgi veren verileri uygun metotlar kullanarak değerlendirmek, özetlemek, kolay anlaşılır hâle getirmek ve yorumlayarak sonuç çıkarabilmektir.
Bu amaçla farklı istatistik metotlar kullanılmaktadır. Birinci grup tanımlayıcı
istatistik metotlar görsel özellik taşıyan istatistik araçlardan oluşmaktadır. Bu
ünitede görsel özellik taşıyan istatistik araçlar anlatılacaktır. Veriler, bu verilerin bir
sonucu olarak hesaplanan bazı karakteristik ölçüler ile de tanımlanmaktadır.
Genellikle yer ve değişim ölçüleri olarak adlandırılan bu karakteristik tanımlama
ölçüleri Ünite 3’te anlatılmıştır.
Görsel özellik taşıyan tanımlayıcı istatistik metotlar genelde iki ana grupta
toplanabilir. Bunlar;
Frekans tabloları,
Şekiller veya Grafikler olarak adlandırılır.
FREKANS TABLOLARI
Frekans tabloları, verilerin özetlenerek kolay anlaşılır hâle getirilmesi
fonksiyonuna sahiptir. Tanımlayıcı istatistikte ve verilerin özetlenmesinde
sonuçların sunumunda tablolardan yaygın olarak yararlanılmaktadır.
Frekans tabloları;
Tek boyutlu tablolar,
İki boyutlu tablolar (Çapraz tablolar) olarak iki farklı şekilde
oluşturulmaktadır.
Tek Boyutlu Frekans Tabloları
Frekans tabloları satır ve sütunlardan oluşan matris şeklindeki düzenlenmiş
yapılardır. Bu tablolarda incelenen değişkene ait sınıflar (alt gruplar, kategoriler)
ile bu sınıflara ait frekans, nispi (oransal) frekans ve gerektiğinde eklemeli frekans
ve eklemeli nispi frekans ölçüleri yer alır. Bu ölçüler aşağıda kısaca açıklanmıştır.
Frekanslar: İncelenen değişkenin ilgili sınıfına veya alt grubuna ait veri sayısı
o sınıfın frekans değeridir.
Nispi Frekans, NF: Bir sınıfın frekansının yani veri sayısının (n), toplam veri
sayısına (N) bölünüp 100 ile çarpılmasıyla elde edilir.
Eklemeli Frekans, EF: Herhangi bir sınıfın frekansının ile o sınıftan önceki
sınıfların frekanslarının toplanmasıyla elde edilir.
Eklemeli Nispi Frekans, ENF: Bir sınıfın eklemeli frekansının, toplam veri
sayısına (N) bölünüp 100 ile çarpılmasıyla elde edilir.
Tablolar ve Grafikler
Atatürk Üniversitesi Açıköğretim Fakültesi 3
Tek boyutlu frekans tablolarında sınıflar
nitel (kalitatif) olabilir.
Aşağıda kesikli değişkenler için tek boyutlu frekans tablosu örnekleri
verilmiştir. Bu tablolarda (Örnek, 2.1, 2.2, 2.3) sınıflar kalitatif (nitel) sınıflardan
oluşturulmuştur.
Örnek Tablo 2.2. Cinsiyete Göre Dağılım Tablosu
Cinsiyet Frekans
(n)
Nispi Frekans
(%)
Eklemeli Nispi
Frekans (%)
Bay 17 56.7 56.7
Bayan 13 43.3 100.0
Toplam 30 100.0
Bu tabloda bay ve bayanların sayıları ve toplam içindeki % payları
görülmektedir. Bayların % değeri 56,7 olup bay sayısının (17) toplam sayıya (30)
bölünmesi ve bölümün 100 ile çarpımı ile elde edilmiştir (17/30*100=56.7).
Bayanların oranı % 43.3 değeri de benzer şekilde hesaplanmıştır.
Örnek Tablo 2.2. Kan Gruplarına Göre Dağılım Tablosu
Kan Grubu Frekans
(n)
Nispi Frekans (%) Eklemeli Nispi
Frekans (%)
A 10 33.3 33.3
B 8 26.7 60.0
AB 7 23.3 83.3
0 5 16.7 100.0
Toplam 30 100.0
Bu tabloda 30 kişinin A, B kan grubu sisteminde kan gruplarına dağılımı
sunulmuştur. Tabloda her bir grubun sayısı ve toplam içindeki % payları
görülmektedir. A kan grubundaki fertlerin oranı ( % değeri) 33.3; bu gruptakilerin
frekans (sayı) değerinin (10) toplam sayıya (30) bölünmesi ve bölümün 100 ile
Örn
ek
2.1
•Aşağıdaki örnek tabloda fertler cinsiyete göre (Bay, Bayan) tasnif edilmiştir. Bay ve bayanların sayıları ve toplam içindeki oranları tabloda sunulmuştur.
Örn
ek
2.2
•Örnek 2.1'deki fertler aşağıdaki tabloda kan gruplarına göre sınıflandırılmıştır. Her kan grubundaki fertlerin sayı, % ve eklemeli % değerleri Örnek Tablo 2.2'de sunulmuştur.
Tablolar ve Grafikler
Atatürk Üniversitesi Açıköğretim Fakültesi 4
Tek boyutlu frekans tablolarında sınıflar
nicel (kantitatif) olabilir.
çarpımı ile elde edilmiştir (10/30*100=33.3). Diğer kan gruplarına ait oranlar da
benzer şekilde hesaplanmıştır.
B kan grubunun eklemeli nispi frekansı 60,0 hesaplanırken bu grubun %
değeri 27,7 üzerine üstteki A kan grubunun eklemeli nispi frekans değeri
eklenerek bulunmuştur. AB kan grubunun eklemeli nispi frekansı benzer olarak
23.3+26.7+33.3= 83.3 şeklinde hesaplanmıştır.
Tek boyutlu frekans tabloları yukarıdaki örneklerde olduğu gibi kalitatif
sınıflardan oluşturulabilir. Bazen sınıflar kesikli, ancak nicel (kantitatif) sınıflardan
da oluşturulabilir. Örneğin bir yerleşkedeki evler oda sayısına göre (1, 2, 3, 4+ odalı
evler) veya aileler çocuk sayısına göre (0, 1, 2, 3, 4, 5, 6+ çocuklu aileler) ayrı ayrı
sınıflandırılabilir. Bu tabloların sınıfları sayısal (nicel) ve tablolar tek boyutludur.
Eğer yerleşkedeki aileler çocuk sayısına ve ikamet ettikleri evlerdeki oda sayısına
göre birlikte tek bir tabloda sınıflandırılarak veriler özetlenirse bu tablo iki boyutlu
(çapraz tablo) olarak nitelendirilir. İki boyutlu tablalar bir sonraki bölümde
incelenecektir.
Örnek Tablo 2.3. Oda Sayısına Göre Evlerin Dağılım Tablosu
Oda sayısı Frekans (n) Nispi Frekans
(%)
Eklemeli
Frekans (n)
Eklemeli Nispi
Frekans (%)
1 300 37.5 300 37.5
2 200 25.0 500 62.5
3 240 30.0 740 92.5
4+ 60 7.5 800 100.0
Toplam 800 100.0
Bu tabloda 800 ailenin ikamet ettikleri evlerin oda sayısı bakımından
dağılımı, sayı ve % olarak ayrıca eklemeli (yığılımlı) sayılar ve % değerler verilmiştir.
Tabloda her bir grubun sayısı ve toplam içindeki % payları görülmektedir. Burada
%, eklemeli n, ve eklemeli % değerlerinin hesaplama şeklinin bir önceki tablodaki
aynı sistemde yapıldığına dikkat ediniz.
Yukarıdaki 2.3 numaralı Örnek Tabloyu yorumlamak gerekirse, 800 ailenin
%37.5’lik en büyük dilimi tek odalı evlerde yaşamaktadır. İki ve daha az sayıdaki
odalı evlerde yaşayan ailelerin 800 kişilik bu toplumdaki oranı %62.5’tir. Diğer bir
ifade ile toplumun %62.5’i iki ve tek odalı evlerde yaşamaktadır.
Örn
ek 2
.3
•Ailelerin ikamet ettikleri evlerin oda sayısıngöre dağılımı nitel sınıflı tablolara örnektir. 800 ailenin ikamet etiği evlerin oda sayısına dağılımı sayı, %ve eklemeli sayı ve eklemeli yüzde olarak Örnek Tablo 2.3' te verilmiştir.
Tablolar ve Grafikler
Atatürk Üniversitesi Açıköğretim Fakültesi 5
Sürekli değişkenler,
kategorik değişkenlere
dönüştürülerek veriler
tek boyutlu frekans
tablolarında
özetlenebilmektedir.
Sürekli Değişkenlerden Frekans Tablosu Oluşturma Frekans tablolarında verilerin özetlendiği sınıf değişkeni; kesikli değişken
(kan grupları, eğitim düzeyleri vb.) olabildiği gibi sürekli bir değişkenin (kronolojik
yaş, kan şeker değeri, sistolik kan basıncı gibi) belli kurallara bağlı olarak kesikli
(kategorik) değişkene dönüştürülmüş formları olabilmektedir. Sürekli
değişkenlerin kategorik forma dönüştürülmesi ve frekans tablosu oluşturması
işlemi tanımlayıcı istatistikte çok sık uygulama alanı bulmaktadır. Ancak sürekli
değişkenin kesikli forma dönüştürüldüğü durumlarda (sınıfların oluşturulması),
bazen bilgi kaybına neden olabilmektedir.
Sürekli bir değişken, kategorik bir değişkene dönüştürülerek tek boyutlu
frekans tablosu oluşturulurken aşağıdaki işlem sırası takip edilir.
Sınıf sayısı (SS) belirlenir. SS genellikle 5-20 arasında alınır.
Değişim genişliği (DG) hesaplanır. Maksimum değerden, minimum değer
çıkartılır. DG= Maksimum Değer – Minimum Değer
Sınıf aralığı (SA) hesaplanır. DG, SS bölünür. SA = DG / SS.
Sınıf alt limitleri (AL) ve sınıf üst limitleri (ÜL) belirlenir.
Ölçüm hassasiyet birim değerinin yarısı ilgili sınıfın AL değerinden
çıkartılarak ve aynı değer aynı sınıfın ÜL değerine eklenerek alt ve üst sınırlar (AS
ve ÜS) hesaplanır.
Sınıf orta değerleri (SOD) hesaplanır. Bir sınıfın SOD AS+ÜS/2 veya
AL+ÜL/2 formülleri ile hesaplanır.
İlgili sınıfın AL, ÜL değerleri dâhil, bu aralıktaki veriler sayılarak o sınıfın
frekansı belirlenir.
Ölçüm Hassasiyet Birimi (ÖHB): Bir değişkenin verilerinin ölçümünde
kullanılan ondalık derecesidir. Örneğin tam sayı ölçümlerde ÖHB 1 dir. ÖHB tek
ondalıkla ölçümlerde genlikle 0.1, iki ondalıkla ölçümlerde 0.01 dir. Ölçümler tek
ondalıkla yapılmış ancak ölçümler 10.5, 11.0. 11.5 12.0 gibi 0.5 birim hassasiyetle
ölçülmüş ise ÖHB 0.5’tir.
Sürekli bir değişkeni sınıflara ayırarak verilerin frekans tablosunda
özetlenmesi ile ilgili aşağıdaki örneği (Örnek 2.4) inceleyiniz?
Örn
ek 2
.4.
•Kırk öğrencinin A dersinden aldıkları notlar aşağıdaki gibidir. Bu notları 5 sınıfta frekans tablosunda özetleyiniz?
•{5, 9, 15, 18, 25, 27, 29, 32, 34, 35, 36, 39, 41, 42, 45, 45, 46, 46, 46, 48, 49, 50, 50, 50, 50, 54, 55, 56, 58, 58, 63, 63, 65, 65, 66, 70, 84, 85, 85, 86}
Tablolar ve Grafikler
Atatürk Üniversitesi Açıköğretim Fakültesi 6
Önce sınıf sayısı belirlenmelidir. Bu örnekte sınıf sayısının 5 olması
istenmiştir. Dolaysıyla SS=5 alınacaktır.
İkinci aşamada değişim genişliği hesaplanacaktır. 100’lük not ölçeğinde en
yüksek not 100, en düşük not 0 olacaktır. Dolayısıyla Değişim genişliği, 100-0 =
100’ dür.
Burada sınıf aralığı 100/5=20 olacaktır.
Sınıf limitlerinin belirlenmesinde en düşük değer ilk sınıfın alt limiti olarak
alınır ve sınıf aralığı değeri bu değerin üzerine eklenerek diğer sınıfların alt limitleri
belirlenir. Yukarıdaki örnekte ilk sınıfın alt limiti 0’dır. İkinci sınıfın alt limiti
0+20=20, üçüncü sınıfın alt limiti 20+22=40, aynı yaklaşımla 4. ve 5. Sınıfların alt
limitleri sırasıyla 60 ve 80 olarak belirlenir.
Notlar tam sayı ile ifade edildiği için bu örnekte ölçüm hassasiyet birimi,
ÖHB= 1’dir. Üst limitler için ikinci sınıfın alt limitinden ölçüm hassasiyet birimi
çıkartılarak ilk sınıfın alt limiti belirlenir. Örneğimizde ikinci sınıfın alt limiti 20’dir.
Bu değerden ÖHB çıkartıldığında yani 20-1=19 ilk sınıfın üst limiti olarak belirlenir.
Bu değerin üzerine sınıf aralığı 20 değeri eklenerek diğer sınıfların üst limitleri
sırasıyla 39, 59, 79 olarak hesaplanır. Son sınıfın üst limiti olarak ise maksimum
değer 100 alınır.
Bir sonraki aşamada bu limitler arasındaki değerler sayılarak (limitler dâhil) her bir sınıfın frekansları belirlenir. Örneğimizde 0-19 arası 4, 20-39 arası 8, not bulunmaktadır. Aynı şekilde 3, 4 ve 5. sınıfların frekansları sırasıyla 12, 6 ve 4 olarak belirlenmiştir.
Belirlenen limitler ve sayılan frekanslar aşağıdaki Tabloda (Tablo 2.4)
sunulmuştur.
İlk sınıfın nispi frekansı (4/40)*100= %10, ikinci sınıfın nispi frekansı
(8/40)*100= %20 olarak hesaplanır. Diğer sınıfların nispi (oransal) frekansları
sırasıyla % 45, %15 ve %10’ dur.
Eklemeli frekanslar her sınıfın frekansı üzerine kendinden önceki sınıfların
frekansları eklenerek hesaplanır. İlk sınıfın eklemeli frekansı 4’dür. İkinci sınıfın
eklemeli frekansı 8+4=12, 3. sınıfın eklemeli frekansı, 4+8+12=30 şeklinde
hesaplanır.
Eklemeli nispi frekanslarda eklemeli frekanslarda olduğu gibi her sınıfın nispi
frekansı üzerine, önceki sınıfların nispi frekansı eklenerek (10+20=30,
10+20+45=75 vb.) hesaplanır.
Son sınıfın eklemeli frekansı toplam fert sayısını (örneğimizde 40) ve son sınıfın
eklemeli nispi frekansı her zaman 100 olmalıdır.
Sınıf aralığı eşit alınan ve yukarıda bir örneği verilen (SA=20) tabloların
oluşturulması daha kolaydır ve yaygın olarak kullanılırlar. Ancak her zaman
öngörülen veri sınıflandırması bu tip tablolarla sağlanamaz. Bu nedenle sınıf aralığı
eşit olmayan frekans tabloları oluşturulur.
Tablolar ve Grafikler
Atatürk Üniversitesi Açıköğretim Fakültesi 7
Sürekli değişkenler,
kategorik değişkenlere
dönüştürülürken sınıf
aralıkları eşit olabildiği
gibi farklı da
olabilmektedir.
Örnek Tablo 2.4. Sınıf Aralıkları Eşit Tablo (Öğrencilerin Puanlara Göre Dağılımı)
Sınıflar (Notlar)
AL – ÜL (Not Aralığı)
Frekans (n)
Nispi Frekans (%)
Eklemeli Frekans (n)
Eklemeli Nispi Frekans (%)
1 0 - 19 4 10 4 10
2 20 - 39 8 20 12 30
3 40 - 59 18 45 30 75
4 60- 79 6 15 36 90
5 80 -100 4 10 40 100
Toplam 40 100
Çoğu durumlarda sürekli bir değişken kategorik bir forma dönüştürülürken
kategorilerin (sınıfların) alt ve üst limitleri önceki çalışmalarla belirlenmiştir ve
sınıflar eşit aralıklı olmayabilir. Bu durumda araştırıcılar bu sınıf limitlerine uygun
olarak verileri sınıflandırmak durumundadırlar. Beden kitle indeksi değerlerinin
Zayıf –Normal- Kilolu-Şişman ve Obez sınıflarına dönüştürmesi ve Türkiye’de
ilköğretimde 100’lük not sisteminin 5’li not sistemine dönüştürülmesinde
kullanılan sınıflandırmalar sınıf aralıkları eşit olmayan sınıflandırmanın tipik
örnekleridir. Aşağıda sürekli değişkenler kesikli (sınıfsal) ve sınıf aralığı eşit
olmayan forma dönüştürülerek oluşturulmuş frekans tablosu örnekleri (Örnek
Tablo 2.5 ve Örnek Tablo 2.6) verilmiştir.
Örnek Tablo 2.5. Sınıf Aralığı Eşit Olmayan Tablo (Öğrencilerin Puanlara Göre Dağılımı)
Sınıflar (Notlar)
AL – ÜL (Not Aralığı)
Frekans (n)
Nispi Frekans (%)
Eklemeli Frekans (n)
Eklemeli Nispi Frekans (%)
0 0 - 24 26 13 26 13
1 25 - 44 34 17 60 30
2 45 - 54 40 20 100 50
3 55 - 69 50 25 150 75
4 70- 84 30 15 180 90
5 85 -100 20 10 200 100
Toplam 200 100
Örn
ek 2
.5.
•İlköğretimde okuyan 200 öğrencinin, 100'lük sistem notlarının 5'lik sistem notlara dönüştürülmesinde kullanılan sınıf limitleri ile sınıflandırılmış notlar ile oluşturulan frekans tablosu Örnek Tablo 2.5' te sunulmuştur.
Tablolar ve Grafikler
Atatürk Üniversitesi Açıköğretim Fakültesi 8
Bu tabloda da sınıflar 0 ile 5 arasındaki 5’lik sistem notları olup 100’lük
sistemdeki notlardan oluşturulmuştur. Bu nedenle sınıfların alt ve üst limitleri (AL
ve ÜL) Milli Eğitim Bakanlığı uzmanları tarafından belirlenmiştir. Sınıf aralıkları eşit
değildir. Herhangi bir sınıfta belirlenen limitler arasındaki fertlerin sayısı ilgili
sınıfın frekansını oluşturmuştur. Yukarıdaki örnek tabloda 200 kişi arasında 2
notuna sahip yani puanı 45 ile 54 arasında olan (45 ve 54 dâhil) 40 kişi mevcut
olup bunların oranı %20’dir. Ayrıca bu tablodan notu 70’ten düşük oranların
oranının Eklemeli Nispi Frekans sütunundan %75 olduğu görülebilir. Diğer
rakamlar da benzer şekilde yorumlanabilir.
İnsanlarda Beden kitle indeksi, vücut ağırlığının (kg cinsinden) boy
uzunluğunun karesine (m olarak) bölünmesi ile hesaplanır ve sürekli değişken
özelliği gösterir. Örneğin, 70 kg ağırlığında ve 175 cm boyundaki bir kişinin beden
kitle indeksi, BKİ=70/1.752 =22.84 olarak hesaplanır. Bu özellik kullanılarak
oluşturulan tek boyutlu, sınıf aralığı eşit olmayan tablo örneği aşağıda
sunulmuştur.
Örnek Tablo 2.6. İki Ucu Açık Sınıflı Frekans Tablosu ( Beden Kitle İndeksi Sınıfları, BKİ)
Sınıf AL - ÜL Frekans (n)
Nispi Frekans (%)
Eklemeli Nispi F. (%)
Zayıf < 18.5 8 10.0 10.0
Normal 18.5 - 24.9 47 58.8 68.8
Biraz Kilolu 25.0 - 29.9 15 18.8 87.6
Şişman 30.0 - 39.9 8 10.0 97.6
Obez 40.0 > 2 2.5 100.1*
∑=80 100.1*
*NF toplamı ve ENF toplamı 100 olmalıdır. Ancak sınıflardaki yüzde değerlerde yapılan
yuvarlaklaştırmaya bağlı olarak 100.1 veya 99.9 olabilir.
Bu tabloda da sınıflar (kategoriler) sürekli bir değişkenden (Beden kitle
indeksi, BKİ) oluşturulmuştur. Sınıfların alt ve üst limitleri sağlık uzmanları
tarafından belirlenmiştir ve sınıf aralıkları eşit değildir. Bu tablonun bir diğer
özelliği iki ucu açık frekans tablosuna örnek oluşturmasıdır.
Yukarıdaki örnek tabloda 80 kişi arasında BKİ 30.0 ile 39.9 arasında 8 kişi
tespit edilmiştir. Bu 8 kişinin toplam 80 kişi içindeki oranı %10 dur. Ayrıca BKI
değeri 24.9 ve daha az olanların oranı bu tablonun Eklemeli Nispi Frekans
sütunundan %68.8 olduğu görülebilir.
Yukarıda anlatılan ve örnekler verilen tek boyutlu frekans tabloları,
Örn
ek 2
.6.
•Beden kitle indeksi değerlerinin (sürekli değişken) kesikli değişkene dönüştürülmesi nde kullanılan sınıf limitleri ile sınıflandırılmış budeğişken ile oluşturulan tek boyutlu frekans tablosu Örnek Tablo 2.6 da sunulmuştur.
Tablolar ve Grafikler
Atatürk Üniversitesi Açıköğretim Fakültesi 9
Veriler frekans olarak
iki boyutlu tablolar
(çapraz tablolar)
kullanılarak
özetlenebilir. İki
boyutlu bu tablolara
kontenjans tablosu da
denilmektedir.
a) Sınıfları kalitatif olan tablolar,
b) Sınıfları kesikli ancak nicel değerlerden oluşan tablolar,
c) Sınıf aralıkları eşit olan tablolar,
d) Sınıf aralıkları eşit olmayan, ancak özel bir anlam ifade eden tablolar ve,
e) Birinci sınıfın alt limiti ve/ya son sınıfın üst limiti olamayan, bir ucu veya
iki ucu açık frekans tabloları olarak özetlenebilir.
İki Boyutlu Frekans Tabloları (Çapraz Tablolar)
Verilerin özetlenmesinde çok yaygın olarak iki boyutlu tablolardan (çapraz
tablolar) yararlanılır. İki boyutlu bu tablolara kontenjans tablosu da denilmektedir.
Verilerin iki farklı değişkene ait olması durumunda frekanslar iki boyutlu tablolar
kullanılarak özetlenebilir.
Çapraz tablolar görünüm olarak çok farklı şekillerde düzenlenebilir.
Çapraz tablolarda değişkenlerden birinin sınıfları yatay (satır), diğerinin sınıfları
düşey (sütun) eksene yerleştirilerek matris oluşturulur. Birinci satıra ve birinci
sütuna ele alına bu iki değişkenin sınıfları yerleştirilir. Çok kesin bir kural
olmamakla birlikte anlatım kolaylığı sağlamak için eğer değişkenlerden biri bağımlı
değişken ise, bağımsız değişken yatay eksene (x ekseni) bağımlı değişken düşey
eksene (y ekseni) yerleştirilir. Oluşan hücrelerin her birine değişkenlerin ilgili
sınıflarının frekanslar yazılır. Gerekli görülürse satır toplamları için en sağ tarafa ve
sütun toplamları için en alta sütun ve satır toplamları ilave edilebilir.
Ayrıca yine gerekli görülürse her bir hücredeki frekansın altına satır yüzdesi
ve sütun yüzdesi ve toplama göre yüzdeler yazılabilir. Yüzde değerlerin
hesaplanması tek boyutlu tablolardaki gibidir.
Örnek Tablo 2.7. Öğrencilerin Başarı Durumlarına ve Liselere Göre Frekans Dağılımı
Fen L. Anadolu L. Meslek L. Toplam
Başarılı 75 90 80 245
Başarısız 5 10 40 55
Toplam 80 100 120 300
Örn
ek 2
.7.
•Üç faklı lise grubundan 300 öğrencinin ÖSS sınavında taban puan bakımından başarı durumları aşağıdaki tablolarda özetlenmiştir. Tablolara frekans ve yüzde değerlerin yazılmasını ve yorumlanmasını inceleyiniz.
Tablolar ve Grafikler
Atatürk Üniversitesi Açıköğretim Fakültesi 10
İki boyutlu tablolarda
frekansların yanında
satır, sütun ve genel
yüzde değerler de
verilebilir.
Çapraz tablolarda yüzde değerler
İki boyutlu frekans tablosunda özetlenen frekans dağılımları gerekli
görülürse yüzdelik olarak da ifade edilebilir. Çoğu kez yüzde değerler
frekanslardan daha açıklayıcı olabilmektedir. Bu nedenle tablolar genellikle yüzde
değerler ile birlikte sunulur.
İki boyutlu tablolarda yüzdelikler satır yüzde değerleri, sütun yüzde
değerleri ve genel yüzde değerleri olarak da verilebilir. Yukarıda frekans olarak
özetlenen verilerin satır sütun ve genel yüzde değerleri için aşağıda ayrı ayrı satır,
sütun ve genel yüzde değerleri verilmiş ve kısa yorumlamalar yapılmıştır.
Satır Yüzdeleri: Aşağıdaki tabloda (Tablo 2.8.) yukarıdaki 300 öğrenci
örneğinin liselere dağılımı verilmiştir. Bu örneğe göre öğrencilerin % 26.7’si Fen
Lisesi, %36.7‘si Anadolu Lisesi ve %32.7‘si Meslek Lisesi mezunudur. Başarılı 245
öğrencinin %30.6‘sı Fen, %36.7‘si Anadolu ve %32.7‘si Meslek Lisesi mezunudur.
Aynı şekilde başarısız 55 öğrencinin %9.1’i Fen, %18.2‘si Anadolu ve %72.7‘si
Meslek Lisesi mezunudur. Örnek Tablo 2.8. Başarılı, Başarısız ve Toplam Öğrencilerin Liselere Göre % Dağılımı (Satır Yüzdeleri)
Başarı
Durumu
Mezun Olunan Lise Toplam
Fen L. Anadolu L. Meslek L.
Başarılı n
%
75 90 80 245
30.6 36.7 32.7 100.0
Başarısız n
%
5 10 40 55
9.1 18.2 72.7 100.0
Toplam N
%
80 100 120 300
26.7 33.3 40.0 100.0
Sütun Yüzdeleri: Sütunlardaki frekanslara göre de yüzde değerler
hesaplanabilir ve bu yüzde değerler yorumlanabilir. Yukarıdaki örneğe ait sütun
yüzdeleri de hesaplanmış (Tablo 2.9.) ve elde edilen değerler sütunlar için
yorumlanmıştır.
Örnek Tablo 2.9. Toplam Öğrenci ve Lise Gruplarına ait Başarılı ve Başarısız ve Öğrencilerin % Dağılımı (Sütun Yüzdeleri)
Başarı
Durumu
Mezun Olunan Lise Toplam
Fen L. Anadolu L. Meslek L.
Başarılı n
%
75 90 80 245
93.8 90.0 66.7 81.7
Başarısız n
%
5 10 40 55
6.2 10.0 33.3 18.3
Toplam N
%
80 100 120 300
100.0 100.0 100.0 100.0
Bu örnekte 300 öğrencinin % 87.1 i başarılı (245 kişi) % 18.3’ü (55 kişi)
başarısız olmuştur. Başarı ve başarısızlık yüzdeleri (oranları) sırasıyla Fen Lisesinde
%93.8 ve %6.2, Anadolu Lisesinde %90.0 ve %10.0, Meslek Lisesi grubunda %66.7
ve %33.3’tür.
Tablolar ve Grafikler
Atatürk Üniversitesi Açıköğretim Fakültesi 11
Genel Toplama Göre Yüzdeler: Satır ve sütun yüzdelerinin yanında genel
toplama göre yüzde değerleri de hesaplanabilir ve yorumlanabilir.
Örnek Tablo 2.10. Herhangi Bir Lise Grubunda Genel Toplama Göre Başarı veya Başarısızlık % Dağılımı (Genel Yüzdeler)
Başarı
Durumu
Mezun Olunan Lise Toplam
Fen L. Anadolu L. Meslek L.
Başarılı n
%
75 90 80 245
25.0 30.0 26.7 81.7
Başarısız n
%
5 10 40 55
1.7 3.3 13.3 18.3
Toplam N
%
80 100 120 300
26.7 33.3 40.0 100.0
Yukarıdaki örnekte 300 öğrencinin %87.1'i başarılı (245 kişi) % 18.3’ü (55
kişi) başarısız olmuştur. Fen Lisesinde başarılı olan 75 öğrenci genel toplamın
(300)kişi % 25.0’lık dilimini oluşturmaktadır. Fen Lisesi mezunu ve başarısız olan
öğrencilerin oranı genel toplamın sadece % 1.7’ sine tekabül etmektedir. Anadolu
Lisesi mezunu ve başarılı olanların sayısı 90 kişi olup toplam öğrenci içindeki oranı
%30 olarak belirlenmiştir. Diğer liselere ait oranlar benzer şekilde ifade edilir.
Bu tablolarda tanımlayıcı istatistik olarak sunulan verilerin analitik
değerlendirilmesi Ünite 10’da Ki- Kare testleri başlığı altında anlatılacaktır.
Tablo yapımında dikkat edilecek hususlar
Tablo başlığı kısa, öz, anlaşılır ve basit olmalıdır.
Tablo başlığına tablonun üstüne yazılmalıdır.
Satır ve sütun değişkenleri ve ölçüleri belirtilmelidir.
Oranlar (% ler) tek başına verilmemeli, gerektiğinde verilmelidir.
N sayısı (fert sayısı) sınırlı ise oran verilmemelidir.
Tabloda uygun yerlerde toplamlar (N) verilmelidir.
Tablolar ve Grafikler
Atatürk Üniversitesi Açıköğretim Fakültesi 12
Histogram sürekli
değişkenlerin dağılımını göstermek
için dik koordinat sistemine çizilen bir
grafiktir.
Verilerin görsel
takdiminde kullanılan
en önemli grafik
türleri; Histogramlar,
Sütun grafikler,
Çizgi grafikler,
Bölünmüş daire
grafikleri, Kutu
grafikler ve Nüfus
piramitleridir. Frekans
olarak iki boyutlu
tablolar (çapraz
tablolar) kullanılarak
özetlenebilir. İki
boyutlu bu tablolara
kontenjans tablosu da
denilmektedir.
GRAFİKLER
Verilerin takdim ve özetlenmesinde oldukça yaygın olarak kullanılan bir
diğer ana grup araç grafiklerdir. En önemli grafikler şunlardır:
Histogramlar
Sütun Grafikleri
Çizgi veya Trend Grafikleri
Bölünmüş Daire Grafikleri
Kutu Grafikler
Nüfus Piramitleri (Özel Grafikler)
Histogramlar
Sürekli bir değişkene ait veri setinden oluşturulan sınıflardaki frekans
dağılımını göstermek için çizilen grafik türüdür. Dik koordinat sisteminde yatay
eksene (x) sınıf sınırları, dikey eksene (y) frekanslar yerleştirilerek çizilen
dikdörtgenler vasıtasıyla frekans dağılışının gösteren histogram grafiği oluşturulur.
Aşağıda çocuklarda doğum ağırlığı dağılımı için bir histogram örneği verilmiştir.
Şekil 2.1. Histogram örneği
D_AG
5,004,504,003,503,002,502,00
Cocuklarda Dogum Agirligi10
8
6
4
2
0
Std. Dev = ,78
Mean = 3,02
N = 30,00
N=30
=3.02
Doğum Ağırlığı Dağılımı
Fre
kan
slar
(n
i)
Tablolar ve Grafikler
Atatürk Üniversitesi Açıköğretim Fakültesi 13
Sütun Grafikler Kategori veya sınıflara ait miktarlar arasındaki ilgiyi göstermek için x
eksenine sınıf veya alt sınıflar y eksenine mutlak veya nispi miktarları
yerleştirilerek oluşturulan grafiklerdir. Aşağıda farklı sütun grafik örnekleri
verilmiştir:
Şekil 2.2. Sütun Grafik Örnekleri
0
20
40
60
80
100
1970 1980 1990 2000 2010
Toplam
Kız
Erkek
Yıllar
Ad
et
(n)
Ad
et
(n)
0
5
10
15
20
25
30
35
Kan Grubu
35
18
27
10
A
B
AB
0
Tablolar ve Grafikler
Atatürk Üniversitesi Açıköğretim Fakültesi 14
Bir bütünün kısımlarını
göstermek için bölünmüş daire grafiği
çizilir.
Sütun grafikler
kategorilere ait
miktarlar arasındaki
ilgiyi göstermek için
çizilir. Sütun grafiklerin
bir diğer formu çizgi
(trend) grafikleridir.
Çizgi veya Trend Grafikleri
Sütun grafiklerin bir başka şekli çizgi grefiklerdir. Bu grafik X eksenindeki
değişkenin sınıflarına veya alt sınıflara göre yönelimi göstermek için çizilen grafik
türüdür. Aşağıda iki farklı çizgi grafik örneği verilmiştir.
Şekil 2.3. Çizgi Grafik Örnekleri
Bölünmüş Daire Grafikleri
Bir bütünü meydana getiren parçaların ifade edilmesinde daireden
faydalanılarak çizilen grafiklerdir. Çizim, % 1’lik değerin 3,6 derecelik açıya karşılık
getirilmesi esasına dayanır. Aşağıda kan gruplarına dağılım için bölünmüş daire
grafiği örneği verilmiştir.
Şekil 2.4. Bölünmüş Daire Grafiği Örneği
05
101520253035404550
1950 1960 1970 1980 1990 2000
Nü
fus
(m
ilyo
n)
Yıllar
Köy
Şehir
15
25
50
90
60
0
10
20
30
40
50
60
70
80
90
100
1970 1980 1990 2000 2010
Toplam Kız Erkek
35; 39%
18; 20%
27; 30%
10; 11%
A
B
AB
0
Ad
et
(n)
Kan Gruplarına dağılım (n=90)
Tablolar ve Grafikler
Atatürk Üniversitesi Açıköğretim Fakültesi 15
Kutu grafikler ve nüfus
grafikleri diğer grafiklere göre daha
özgün bilgiler sunarlar.
Kutu Grafik
Diğer grafiklere göre daha özgün bir grafik türüdür. Bu grafik türü “Boksör
Torbası Grafiği” olarak da adlandırılmaktadır. Verilerin dağılımı yanında birçok
istatistik ölçüyü göstermek için kullanılır. Örnekte görüldüğü gibi maksimum,
minimum, medyan, çeyrek ölçüler, sapmalı değerler gibi birçok ölçü bu grafik ile
sunulabilmektedir. Aşağıda erkek ve kız bebeklerin doğum ağırlığı ile ilgili boksör
torbası grafiği örneği verilmiştir.
Şekil 2.5. Kutu Grafik Örneği
Özel Grafikler
Grafik ve şekil çiziminin esaslarına göre özel amaç için çizilen grafiklerdir. Nüfus piramitleri buna örnek olarak verilebilir. Aşağıda Türkiye’nin 1998 yılı Nüfus Piramidi örnek olarak verilmiştir.
1317N =
CýNSIYET
KizErkek
D_
AG
5,5
5,0
4,5
4,0
3,5
3,0
2,5
2,0
1,5
24
Medyan
Minimum
Maksimum Sapmalı değer
Erkek Kız
Çeyrek 3
Çeyrek 1
Yüzde Şekil 2.6. Türkiye’nin 1998 Yılı Nüfus Piramidi
Tablolar ve Grafikler
Atatürk Üniversitesi Açıköğretim Fakültesi 16
Nüfus piramitleri, bir ülkenin geri kalmışlık, gelişmişlik yada gelişmekte
olduğunun bir göstergesidir. Nüfus piramidi o ülke veya bölgenin nüfus sayısı ve
yapısı hakkında bilgi verir. Nüfus piramitleri ile ilgili daha ileri açıklamalar nüfus
istatistikleri ünitesinde verilmiştir.
Grafik çiziminde sıkça bazı hatalar yapılmaktadır. Yapılan en önemli hatalar
aşağıda sıralanmıştır. Bunlar;
Eksenlerin orantısızlığı,
Eksenlerde yer alan değerlerin ve birimlerinin belirtilmemesi,
Şekil veya grafik içindeki detayların açıklanmaması,
Şekil ve grafiğin içeriğini belirten başlığın, şeklin altına yazılmaması,
Eksenin başlangıç veya sıfır noktasının belirlenmemesi,
Kısaltılan eksenlere kesme “//” işaretinin konmamasıdır.
Tart
ışm
a •Bir bölge hastenesine tedavi amacıyla başvuran hastaların polikliniklere dağılımında hangi grafik türünün kullanılacağını tartışınız ve nedenini açıklayınız.
•Yıllara göre kanser hastası değilşiminde niçin çizgi grafik kullanacağınızı tartışınız. Bu amaç için sütun grafik kullanılabilir mi?
Tablolar ve Grafikler
Atatürk Üniversitesi Açıköğretim Fakültesi 17
Ö
zet
•Verilerin özetlenmesi ve bu verilerden sonuç çıkartılması sürecinde tablolar ve grafiklerden yararlanılmaktadır.
•Frekans tabloları; tek boyutlu ve iki boyutlu (çapraz tablo) olarak oluşturulmaktadır.
•Tek boyutlu frekans tablarında yüzde değerler (nispi frekanslar) ve eklemeli nispi frekanslar (yığılımlı nispi ferkanslar) da hesaplanabilir.
•Ayrıca iki boyutlu tablolarda frekansların yanında satır, sütun ve genel yüzde değerleride verilebilir.
•Verilerin özetlenmesinde sık kullanılan araçlardan biride grafiklerdir.
•Grafik çizim kurallarına uyulmadığında grafik anlaşılamaz veya okuyucuyu yanıltabilir.
•Tanımlayıcı istatistikte kullanılan en yaygın grafik çeşitleri; Histogramlar, Sütun grafikler, Çizgi grafikler, Bölünmüş daire grafikleri, Kutu grafiklerdir.
•Amaca ve verilerin yapısına uygun grafiğin seçimi tanımlayıcı istatistikte önemlidir.
Tablolar ve Grafikler
Atatürk Üniversitesi Açıköğretim Fakültesi 18
Değerlendirme
sorularını sistemde ilgili ünite başlığı altında yer alan “bölüm sonu testi” bölümünde etkileşimli
olarak cevaplayabilirsiniz.
DEĞERLENDİRME SORULARI
1. Tek boyutlu bir frekans tablosunda son sınıfın (en alt sınıfın)eklemeli nispi
frekans değeri nedir?
a) Toplam frekansa bağlıdır.
b) 50’dir.
c) 100’dür.
d) Toplam frekans değerine eşittir.
e) Bilinemez.
2. Toplam veri sayısı 400 0lan bir tabloda ikinci sınıfta 50 fert var ise, bu sınıfın
nispi frekansı % olarak nedir?
a) % 10
b) % 12.5
c) % 20
d) % 5
e) Bilinemez.
3. Tam sayı olarak belirlenen (ondalıksız) verilerle hazırlanan bir frekans
tablosunda ilk üç sınıfa ait sınıf değerleri 18, 21 ve 24 olarak verildiğine göre,
birinci sınıfın sınıf limitleri ( (AL ve ÜL) nedir?
a) 16-20
b) 15-20
c) 17-18
d) 17-19
e) 16-19
4. Bir frekans tablosunda toplam frekans 200 dür. Dördüncü sınıfın frekansı 12,
eklemeli frekansı 40 ve beşinci sınıfın eklemeli frekansı 64 ise, dördüncü sınıfın
nispi ve eklemeli nispi frekansları (NF ve ENF) nedir?
a) NF = % 6 ENF = % 20
b) NF = % 12 ENF = % 25
c) NF = % 8 ENF = % 40
d) NF = % 5 ENF = % 10
e) NF = % 6 ENF = % 40
Tablolar ve Grafikler
Atatürk Üniversitesi Açıköğretim Fakültesi 19
5. Tek boyutlu bir frekans tablosunda sınıflar (kategoriler) için aşağıdakilerden
hangisi yanlıştır?
a) Sınıflar rakamla gösterilebilir.
b) Sınıf aralığı farklı olabilir.
c) Sınıflar kalitatif (nitel) olabilir.
d) Sınıf sayısı 5 ile 20 arasında olabilir.
e) Sınıf aralığı her zaman eşit olmalıdır.
6. Polikliniklere göre ayakta tedavi edilen ve yatış yapılan hasta sayılarının
değerlendirildiği bir çalışmada bir hastaneye gelen 5000 hastanın 500’ü
dâhiliye polikliniğine gelmiş, bunların 200 adedi Dâhiliye servisine yatış
yapmıştır. Tüm servislere yatış yapan hasta sayısı ise 1500’dür. Tüm hastalara
göre dâhiliye servisine yatış yapan hasta oranı nedir?
a) % 4
b) % 5
c) % 40
d) % 10
e) Hesaplanamaz.
7. Miktarları karşılaştırmak için en yaygın hangi grafik kullanılır?
a) Histogram
b) Sütun grafik
c) Çizgi grafik
d) Bölünmüş daire grafiği
e) Nüfus piramidi
8. Kadın ve erkek nüfusun, 5 veya 10 yaş gruplarında, dağılımını özel olarak
göstermek için çizilen en uygun grafiğin adı nedir?
a) Histogram
b) Sütun grafik
c) Çizgi grafik
d) Bölünmüş daire grafiği
e) Nüfus piramidi
9. Bir bütünün %10’luk kısmı bölünmüş daire grafiğinde kaç derecelik açı ile
temsil edilir?
a) 36
b) 360
c) 3.6
d) 90
e) 45
Tablolar ve Grafikler
Atatürk Üniversitesi Açıköğretim Fakültesi 20
10. Grafik başlığı grafiğin hangi tarafına yazılır?
a) Üstüne
b) Altına
c) Sağına
d) Soluna
e) Uygun yere
Cevap Anahtarı
1.C, 2.B, 3.D, 4.D, 5.E, 6.A, 7.B, 8.E, 9.A, 10.B
Tablolar ve Grafikler
Atatürk Üniversitesi Açıköğretim Fakültesi 21
YARARLANILAN VE BAŞVURULABİLECEK DİĞER
KAYNAKLAR
Akbulut, Ö. (2009). Biyoistatistik Ders Notları. Atatürk Üniversitesi HELİTAM
Programı. Erzurum
Başar, A. Oktay, E. (1997). Uygulamalı İstatistik. Şafak Yayınları, Erzurum.
Çelik, M.Yusuf. (1999). Biyoistatistik Araştırma İlkeleri Yeni bir yaklaşım. Dicle
Üniv. Tıp Fakültesi, Diyarbakır.
Düzgüneş, O. Kesici, T. Gürbüz, F. (1983). İstatistik Metotları I. Ziraat Fakültesi
Yayınları, Ankara.
Hayran, M, Özdemir, O. (1996). Bilgisayar İstatistik ve Tıp.(2. Baskı) Hekimler Yayın
Birliği MEDAR. Ankara.
Karataş, Ş. (1973). İstatistiğe Giriş. Atatürk Üniversitesi Basımevi, Erzurum.
Yıldız, N. Akbulut, Ö. Bircan, H. ( 2006). İstatistiğe Giriş, Uygulamalı Temel Bilgiler,
Çözümlü ve Cevaplı Sorular. Aktif Yayınevi, İstanbul.