psikolojide Ölçme ve Ölçek geliştirme-ii · kilidir ve büyük kozmik zamanda enerji...

24
Psikolojide Ölçme ve Ölçek Geliştirme-II Adnan ERKUŞ • Önder SÜNBÜL • Seç�l ÖMÜR SÜNBÜL Seha YORMAZ • Sem�h AŞİRET Ölçme Araçlarının Ps�kometr�k N�tel�kler� ve Ölçme Kuramları

Upload: others

Post on 11-Aug-2020

8 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Psikolojide Ölçme ve Ölçek Geliştirme-II · kilidir ve büyük kozmik zamanda enerji farklılıklarından dolayı madde farklılıkla - rı da ortaya çıktığı için her şey

Psikolojide Ölçme ve ÖlçekGeliştirme-II

Adnan ERKUŞ • Önder SÜNBÜL • Seç�l ÖMÜR SÜNBÜLSeha YORMAZ • Sem�h AŞİRET

Ölçme Araçlarının Ps�kometr�k N�tel�kler� veÖlçme Kuramları

Page 2: Psikolojide Ölçme ve Ölçek Geliştirme-II · kilidir ve büyük kozmik zamanda enerji farklılıklarından dolayı madde farklılıkla - rı da ortaya çıktığı için her şey

Adnan ERKUŞ, Önder SÜNBÜL, Seçil ÖMÜR SÜNBÜL, Seha YORMAZ, Semih AŞİRET

PSİKOLOJİDE ÖLÇME VE ÖLÇEK GELİŞTİRME-II

ISBN 978-605-318-818-6DOI 10.14527/9786053188186

Kitap içeriğinin tüm sorumluluğu yazarlarına aittir.

© 2017, PEGEM AKADEMİ

Bu kitabın basım, yayım ve satış hakları Pegem Akademi Yay. Eğt. Dan. Hizm. Tic. Ltd. Şti.ye ait-tir. Anılan kuruluşun izni alınmadan kitabın tümü ya da bölümleri, kapak tasarımı; mekanik, elekt-ronik, fotokopi, manyetik, kayıt ya da başka yöntemlerle çoğaltılamaz, basılamaz, dağıtılamaz. Bu kitap T.C. Kültür Bakanlığı bandrolü ile satılmaktadır. Okuyucularımızın bandrolü olmayan ki-taplar hakkında yayınevimize bilgi vermesini ve bandrolsüz yayınları satın almamasını diliyoruz.

Pegem Akademi Yayıncılık, 1998 yılından bugüne uluslararası düzeyde düzenli faaliyet yürüten uluslararası akademik bir yayınevidir. Yayımladığı kitaplar; Yükseköğretim Kurulunca ta-nınan yükseköğretim kurumlarının kataloglarında yer almaktadır. Dünyadaki en büyük çevri-miçi kamu erişim kataloğu olan WorldCat ve ayrıca Türkiye’de kurulan Turcademy.com ve Pegemindeks.net tarafından yayınları taranmaktadır, indekslenmektedir. Aynı alanda farklı yazar-lara ait 1000’in üzerinde yayını bulunmaktadır. Pegem Akademi Yayınları ile ilgili detaylı bilgilere http://pegem.net adresinden ulaşılabilmektedir.

1. Baskı: Nisan 2017, Ankara

Yayın-Proje: Özlem SağlamDizgi-Grafik Tasarım: Ayşe Nur Yıldırım

Kapak Tasarım: Pegem Akademi

Baskı: Vadi Grup Ciltevi A.Ş.İvedik Organize Sanayi 28. Cadde 2284 Sokak No:105

Yenimahalle/ANKARA(0312 394 55 91)

Yayıncı Sertifika No: 14749Matbaa Sertifika No: 26687

İletişim

Karanfil 2 Sokak No: 45 Kızılay / ANKARAYayınevi: 0312 430 67 50 - 430 67 51

Yayınevi Belgeç: 0312 435 44 60Dağıtım: 0312 434 54 24 - 434 54 08

Dağıtım Belgeç: 0312 431 37 38Hazırlık Kursları: 0312 419 05 60

İnternet: www.pegem.netE-ileti: [email protected]

pegem
Sticky Note
Marked set by pegem
Page 3: Psikolojide Ölçme ve Ölçek Geliştirme-II · kilidir ve büyük kozmik zamanda enerji farklılıklarından dolayı madde farklılıkla - rı da ortaya çıktığı için her şey

İnsanın psikolojik özelliklerini ölçmek gibi güç bir işe katkı sunmuş olan

evrenvatandaşı tüm bilimcilere…

Page 4: Psikolojide Ölçme ve Ölçek Geliştirme-II · kilidir ve büyük kozmik zamanda enerji farklılıklarından dolayı madde farklılıkla - rı da ortaya çıktığı için her şey

ÖN SÖZ

İlkini çıkarırken ‘bu kitap dizisinin en az altı ciltten oluşacağını’ belirtmiş ve bundan sonrakileri de MeÜ EÖD Abd’nin değerli akademisyenleriyle birlikte ger-çekleştirmeyi umduğumu eklemiştim. Biraz geç olsa da ikinci cilt ile karşınızda-yı(m)z. Bundan sonra arayı fazla açmadan ve üstelik ‘ailemizi’ de her ciltte giderek büyüterek, dizinin diğer ciltlerini sizlere sunmayı planlıyoruz. Umarız ülkemizin psikometri ve onun eğitimde ölçme-değerlendirme, endüstri psikolojisinde ölç-me-değerlendirme, klinik psikolojide ölçme-değerlendirme gibi uygulama alanla-rına bir katkı sunabiliriz.

Bilindiği gibi, psikolojik değişkenlerin ölçülmesi, fen bilimlerindeki değiş-kenlerin ölçülmesinden çok daha çetrefil sorunları aşmayı gerektiriyor. Psikolojik değişkenlerin psikometrik anlamda ölçülmeye başlamasının üzerinden ancak bir yüzyıldan biraz daha fazla zaman geçti. Bu süreç içinde, psikolojik değişkenlerin ölçülmesinde epey yol alındı, ancak ‘koşu’ hâlâ amacına tam olarak ulaşamadı. Bu doğal karşılanmalıdır; çünkü, kendi nöronal bağlantılarımızla yine kendi bilişi-mizin-duyuşumuzun nasıl işlediğini çözmeye çalışıyoruz. Bu süreçte, hem ölçme aracı geliştirme yöntem ve tekniklerimiz, hem ölçme ile ilgili kuramlarımız, hem de ölçme araçlarımızın psikometrik özellikleri konusunda önemli gelişmeler de yaşandı ve hemen her gün de yaşanmaya devam ediyor. Bu bakımdan, ölçme ku-ramları ile güvenirlik ve geçerlik konusunda yeni bakış açılarının ortaya çıkması da doğal karşılanmalıdır. Son yıllarda hızla yaşamımıza giren bilgisayar teknolo-jisinin alanımıza da çok önemli katkıları oldu. Kim bilir, belki de yakın gelecekte, bilgisayar teknolojisi ile birlikte biyoloji bilimindeki, kuantum mekaniğindeki ve özellikle de beyin fizyolojisi konusundaki gelişmeler ile psikolojinin insanı anlama ve açıklama çabaları bütünleşecek ve insanı bütünsel olarak ölçme ve değerlendir-me aşamasına geçeceğiz.

Bu kitap dizisinin ilk cildinde, psikolojide ölçme ve ölçek geliştirmenin te-mel kavram ve işlemleri biraz değişik bir açıdan ele alınmıştı. Bu ciltte, iki ana bölüm bulunmaktadır: Ölçme Araçlarının Psikometrik Nitelikleri ve Ölçme Kuram-ları. Ölçme Kuramları bölümünü genç arkadaşlarım üstlendiler; diğer bölümü de, özellikle ilk kitaptaki yaklaşımın devamı olan tartışmalı konulara değineceğimden ve biraz ‘aykırı’ yaklaşımlarda bulunacağımdan dolayı ben üstlendim; böylelikle gençleri de ‘suçuma ortak etmemeye’ çalıştım. Bu bakımdan her bölümün yazar-larının sadece kendi yazdıklarından sorumlu olmaları gerekmekle birlikte, kitabın editörü olmamasına rağmen, tümündeki eksiklik ve yanlışlıkları ayrıca bizzat şah-sım adına üstleniyorum.

Page 5: Psikolojide Ölçme ve Ölçek Geliştirme-II · kilidir ve büyük kozmik zamanda enerji farklılıklarından dolayı madde farklılıkla - rı da ortaya çıktığı için her şey

vi Psikolojide Ölçme ve Ölçek Geliştirme II

Güvenirlik ve geçerlik bölümlerinde birbirini bütünleyen ve ilk kitaptaki yaklaşımın devamı olan “yeni” bazı şeyler ekledim ve bu konulara biraz farklı yaklaştım. Elbette, böyle bir girişim çeşitli riskleri ve eksiklikleri de beraberinde getirecektir. İşte bu risk ve eksiklikleri göze almaktan ‘korktuğum için’ olsa gerek, kendi yazdığım bölümleri alanımızdan değerli bazı arkadaşlarıma da okuttum, görüşlerini almaya çalıştım. Elbette, bu durum, tüm sorumluluğu onlarla paylaş-tığım veya onların benim “aykırı” görüşlerime tümüyle katıldıkları anlamına gel-miyor; özellikle her türlü yanlıştan kendimin sorumlu olduğunu belirtiyor ve Prof. Dr. Şener Büyüköztürk ile Doç. Dr. İbrahim Alper Köse’ye zaman ayırıp ve emek harcayıp titizlikle okuyarak yaptıkları tüm eleştiri, öneri ve düzeltmeler için çok teşekkür ediyorum. Bu arkadaşlarımın özel bir seçilme gerekçesi bulunmamak-tadır, kitap konusundaki konuşmalar sırasında yeri geldiği için kendilerinden bu rica yapılmıştır. Diğer arkadaşlarımızdan da gelecek kitaplarda yararlanırız, gönül alırız. Umarım, bu yazılanlara alandan herkes katkı sunar da daha doğruyu hep birlikte bulabiliriz.

Kendi yazdığım bölümlerde, içerik ve açıklama açısından alandan olan ve olmayan okuyucu dengesini tutturabildim mi bilemiyorum. Çünkü bazı yerlerde formüllerin içinde boğulunurken, bazı yerlerde üstün körü geçiverdim. Bunun bir nedeni uygulamada, alan dışından kişilerin de güvenirlik ve geçerlikle bir şekil-de tanışık olmalarıdır. İstatistiksel işlemleri ise, alandan olanların temeli olduğu/olması, alandan olmayanların da ya istatistik kursları almaları veya araştırmaları gerektiği düşüncesiyle çoğunlukla atladım veya ‘ödev’ olarak verdim; ancak bazı pratik amaçlar için de örnekleyerek sundum. Kuramsal tarihçe ve kendi yakla-şımlarım için de uzun uzun tartışmak ve karşılaştırmak yerine (çünkü daha çok tartışılacağa benziyor), doğrudan mantıksal ve işlemsel temelde kendi görüşümü açıklamaya giriştim; aksi halde, bu kitap hiçbir zaman tamamlanamazdı! Kendi yaklaşımlarım, salt bu karmaşaya son vermek için yıllar içinde üretilmiştir; ama umarım karmaşayı daha da arttırmış olmamışımdır. Kendi yazdığım bölümlerde kullandığım dil ise, eh sanırım her zamanki gibi, bana göre… Bana yapılan onca ‘baskıya’ rağmen de galiba değişmeyecek…

Ölçme Kuramları bölümünün, oldukça doyurucu olduğunu söylemeliyim. Her kuramın hem mantıksal ve istatistiksel temelleri çok iyi işlenmiş, hem de her kuram için örneklerle anlaşılabilirliği artırılmış durumdadır. Bu kadar derli toplu ve doyurucu bir bölüm yazdıkları için genç arkadaşlarıma çok teşekkür ediyo-rum. Ölçme kuramları bölümünde, Klasik Test Kuramı’nın sayıltıları ve eşitlikleri, Madde Tepki Kuramı’nın sayıltıları, eşitlikleri, modelleri, türleri, model-veri uyu-mu ve kestirim yöntemleri, Kökdeşlik (congenerik) Kuramı ve Genellenebilirlik Kuramları yer almaktadır. Özellikle MTK’da model-veri uyumu ile kestirim yön-

Page 6: Psikolojide Ölçme ve Ölçek Geliştirme-II · kilidir ve büyük kozmik zamanda enerji farklılıklarından dolayı madde farklılıkla - rı da ortaya çıktığı için her şey

viiÖn Söz

temlerinin alandaki lisanüstü öğrencilerimiz için çok yararlı olacağını beklemek-teyim. Tüm kuramların özellikle dilimizde ilk kez topluca ve böylesine ayrıntılı bir şekilde ele alınmasının psikometri ve eğitimde ölçme-değerlendirme lisansüstü programları için son derece yararlı olacağını düşünmekteyiz.

Bundan öncekilerde olduğu gibi, bu kitapta da eksiklikler ve hatta yanlışlıklar mutlaka olacaktır. Özellikle, kuramlar-güvenirlik ve geçerlik konusu sürekli evril-mekte ve tartışılmakta olduğu ve özellikle bu kitabın ilk bölümüyle ikinci bölümü güvenirlik konusunda birbirleriyle binişiklik gösterdikleri için kapsamın sınırları-nı çizmekte epey zorlandık. Bu eksiklikleri ve hataları gelecek baskılarda, sizlerin de katkılarıyla gidermeye çalışacağımızdan emin olabilirsiniz. Ancak, kitaptaki tüm hataları ve eksiklikleri baştan kabul ediyor ve sorumluluğunu alıyoru(z)m.

Ne kadar ciddiye alınırız bilemiyoruz ama, kitaptakilerin tartışılması bizleri çok sevindirecektir. Bilimin itici gücü, eleştirel irdeleme, merak, kuşku ve sorgula-madır; raflarda tozlanan kitaplarla veya okuyup da okumamış görünmekle bilim-sel ilerleme bir hayalden öteye geçemez. Umarım, bu kitaptaki yazılanlar alanda ‘ses bulur’ da tartışılır; tartışıla tartışıla daha iyiye ve güzele doğru hep birlikte yol alırız.

Kitabın basımında emeği geçen Pegem Akademi çalışanlarına teşekkür eder, okuyuculara yararlı olmasını dileriz. Bilimle kalın...

Yazarlar adına Dr. Adnan Erkuş

Nisan 2017

pegem
Sticky Note
Marked set by pegem
Page 7: Psikolojide Ölçme ve Ölçek Geliştirme-II · kilidir ve büyük kozmik zamanda enerji farklılıklarından dolayı madde farklılıkla - rı da ortaya çıktığı için her şey

YAZARLAR

1. Bölüm: Ölçme Araçlarının Psikometrik Nitelikleri Dr. Adnan ERKUŞ, Emekli Öğretim Üyesi

2. Bölüm: Psikolojide Ölçme Kuramları Dr. Önder SÜNBÜL, Mersin Üniversitesi Eğitim Fakültesi Dr. Seçil ÖMÜR SÜNBÜL, Mersin Üniversitesi Eğitim Fakültesi Uzm. Semih AŞİRET, Mersin Üniversitesi Eğitim Fakültesi Uzm. Seha YORMAZ, Mersin Üniversitesi Eğitim Fakültesi

Page 8: Psikolojide Ölçme ve Ölçek Geliştirme-II · kilidir ve büyük kozmik zamanda enerji farklılıklarından dolayı madde farklılıkla - rı da ortaya çıktığı için her şey

İÇİNDEKİLER

Ön Söz ....................................................................................................................................vYazarlar ............................................................................................................................. viiiBazı Hatırlatmalar ............................................................................................................. xii

I. BÖLÜM

ÖLÇME ARAÇLARININ PSİKOMETRİK NİTELİKLERİ

1. KISIM

GÜVENİRLİK (RELIABILITY)

Ölçme ‘Sonuçlarına’ Karışan Hatalar .................................................................................4Güvenirlik Tanımları .........................................................................................................14Klasik Test Kuramında Hata ve Güvenirlik ....................................................................16Ölçme Araçlarının Güvenirliklerini İrdeleme Yolları ...................................................22Maddelerin Gerçek ve Hata Puanlarına İlişkin Farklı Ön Kabullere Dayanılarak Türetilen Farklı Alfa Katsayıları .......................................................................................34Puanlama Güvenirliği veya Puanlayıcılar Arası Güvenirlik .........................................38Madde Tepki Kuramında Güvenirlik ...............................................................................48Güvenirlik ile İlgili Diğer Konular ...................................................................................49Ölçme Araçlarının Güvenirliğini Rapor Etme ...............................................................50Güvenirlik ile ilgili Yapılan Hatalar ve Son Uyarılar ......................................................51Kaynaklar .............................................................................................................................54

2. KISIM

ÖLÇMEDE GEÇERLİK

Ölçme Geçerliği ..................................................................................................................76Geriye Dönük (Retrospective/Postdictive) Geçerlik ...............................................82Zamandaş (Concurrent) Geçerlik ..............................................................................83Yordama (Predictive) Geçerliği ..................................................................................83

Karar (Değerleme-Kullanım) Geçerliği ...........................................................................91Kaynaklar ...........................................................................................................................101

pegem
Sticky Note
Marked set by pegem
pegem
Sticky Note
Marked set by pegem
pegem
Sticky Note
Marked set by pegem
Page 9: Psikolojide Ölçme ve Ölçek Geliştirme-II · kilidir ve büyük kozmik zamanda enerji farklılıklarından dolayı madde farklılıkla - rı da ortaya çıktığı için her şey

x Psikolojide Ölçme ve Ölçek Geliştirme II

II. BÖLÜM

PSİKOLOJİDE ÖLÇME KURAMLARI

1. KISIM

KLASİK TEST KURAMI (KTK)

Gözlenen Puan Dağılımının Beklenen Değeri .............................................................111Paralel Formlar Arası Korelasyon: Güvenirlik .............................................................112Gözlenen Puan ve Gerçek Puan Arasındaki Korelasyon: Güvenirlik İndeksi .........114Gözlenen Puan ve Hata Puanı Arasındaki Korelasyon ...............................................115Test Uzunluğunun Güvenirlik Üzerine Etkileri ...........................................................115

2. KISIM

MADDE TEPKİ KURAMI (MTK)

Madde Karakteristik Eğrisi .............................................................................................124Madde Tepki Kuramının Sayıltıları ................................................................................125Madde Tepki Kuramı Modelleri .....................................................................................127Test Karakteristik Eğrisi ...................................................................................................136Madde Parametrelerinin Değişmezliği ..........................................................................138Bilgi Fonksiyonları ...........................................................................................................140

3. KISIM

ÇOKBOYUTLU MADDE TEPKİ KURAMI

Boyutluluk (Dimensionality) ..........................................................................................144Çokboyutlu Madde Tepki Kuramı Modeli Türleri .......................................................151ÇBMTK’de Eş Olasılık Konturları, Madde Vektörü ve Grafiksel Gösterimler .........153Çokboyutlu Yapıların Tekboyutlu Madde Tepki Kuramına Dayalı Analizi ..............156

4. KISIM

MADDE TEPKİ KURAMINDA MODEL-VERİ UYUMU

Sayıltıların İncelenmesi ...................................................................................................160Model-Veri Uyumunun Değerlendirilmesi ..................................................................164

Page 10: Psikolojide Ölçme ve Ölçek Geliştirme-II · kilidir ve büyük kozmik zamanda enerji farklılıklarından dolayı madde farklılıkla - rı da ortaya çıktığı için her şey

xiİçindekiler

5. KISIM

MADDE TEPKİ KURAMINDA KULLANILAN KESTİRİM YÖNTEMLERİ

Yetenek Kestirimi .............................................................................................................190Madde ve Yetenek Parametrelerinin Kestirimi .............................................................200

6. KISIM

GENELLENEBİLİRLİK KURAMI

Genellenebilirlik Kuramı’nın Temel Kavramları ..........................................................216Tek Yüzeyli Desenler ........................................................................................................220İki Yüzeyli Desenler .........................................................................................................230

Kaynaklar ...........................................................................................................................241Yazarlar Hakkında ............................................................................................................247

Page 11: Psikolojide Ölçme ve Ölçek Geliştirme-II · kilidir ve büyük kozmik zamanda enerji farklılıklarından dolayı madde farklılıkla - rı da ortaya çıktığı için her şey

xii Psikolojide Ölçme ve Ölçek Geliştirme II

BAZI HATIRLATMALAR

Okuyucunun, bir temeli olduğunu varsaymakla birlikte, bazı hatırlatmaların yapılmasını yararlı görmekteyiz.

Varyans, Kovaryans, Matris, Vektör, Faktör…

Evrenin oluşumunu başlatan Büyük Patlamadan dolayı her şey birbiriyle iliş-kilidir ve büyük kozmik zamanda enerji farklılıklarından dolayı madde farklılıkla-rı da ortaya çıktığı için her şey değişim içindedir: Termodinamiğin 2. Yasası. Tam da bu nedenle, bilim de bu doğanın bir parçası olan insan bilişinin gelişiminin bir ürünü olarak, bu farklılık-benzerlik ve buradan hareketle değişimin işleyiş kural-larını bulma çabası olarak ortaya çıkmıştır. Bu farklılık ve benzerlik ve değişimi ne denli dakik bir şekilde tanımlayabilir (ölçebilir) isek, o denli sağlam (güvenilir-ge-çerli) çıkarımlar yapabiliriz. Bu bakımdan bilimin temeli ölçmeye ve ölçmenin temeli de benzerlik (merkezi eğilim) - farklılık (değişim) ölçülerine ve bunların üzerinde yükselen ilişki ve farklılık işlemlerine dayanır.

Varyans ve ölçmedeki yeri

Bilimde ve dolayısıyla ölçme sonuçları üzerinde yapılan işlemlerde en çok bilgi veren değişim ölçüsü varyanstır. Varyans aritmetik ortalamayla birlikte ve hatta her ne kadar sürekli değişkenler için aritmetik ortalamadan türetiliyorsa da sadece kendisi başlı başına (özellikle de insanın psikolojik özelliklerinin ölçümü söz konusuysa) en önemli bir ölçüdür. Sürekli veriler için varyans:

xN

xN

X X2 22 2

v = = =-^ h| |

tanım eşitlikleri ile N

xN

X22

-_ i||

hesaplama eşitliği. Bu eşitliklerin tümü evren varyansı için aynı sonucu verir. Ör-neklem varyansı için paydanın n-1 (serbestlik derecesi) olması gerekir.

Veriler, ikili (dichotomic) süreksizse (1-0) varyans bir ikili değişken (örneğin çoktan seçmeli bir maddeye verilen yanıtlar) için (Bernoulli Teoremine göre);

σ2 = p x q’dur; bir örneklem grubu içinse, = n x p x q’dur. p, ilgilenilen özel-liğin gözlenme oranı (1-0’lı puanlanan bir test maddesi için doğru cevap oranı = madde güçlük düzeyi), q ise ilgili özelliğin gözlenmeme oranı (doğru cevaplama-ma oranı).

Sürekli veriler için olan eşitlikten de görüleceği gibi, varyans, her bir puanın kendi aritmetik ortalamasından olan uzaklığına (sapma puanı, = x) dayanmakta-dır ve bir tek puanın değişimi ancak sapma puanı kadardır. Ancak, bir grup ölçüm

Page 12: Psikolojide Ölçme ve Ölçek Geliştirme-II · kilidir ve büyük kozmik zamanda enerji farklılıklarından dolayı madde farklılıkla - rı da ortaya çıktığı için her şey

xiiiBazı Hatırlatmalar

sonucu için sapma puanlarının toplamları daima 0,00 olacağından, kareleri alına-rak bu sorundan kurtulunur; varyans, bu bakımdan sapmaların ikinci momen-tidir. Bu özellikler gereği, varyans hiçbir zaman eksi değerler al(a)maz. Bir grup ölçme sonucunun varyansı 0,00’a eşitse, “o grupta ölçülen özellik açısından hiçbir değişim yoktur”, yani “benzeşik (homojen) bir grup ile karşı karşıyayız”; 0,00’dan uzaklaştıkça da (üst sınırı ölçeğin ranjına bağlıdır), “o grup ölçülen özellik açısın-dan farklılaşıyor”, yani “ayrışık (heterojen) bir grup ile karşı karşıyayız” demektir.

Şimdi, varyansın büyük ya da küçük olması beklentilerini biraz aydınlatmaya çalışalım. Hangi durumlarda büyük, hangi durumlarda küçük varyans arzu edilir ve bunlar neyi gösterir? Varyans = Hata, her koşulda doğru mudur?

Bilimsel araştırmalarda, araştırma grupları arasındaki “farklılığı” araştırırken, gruplararası ve grupiçi değişimin en önemli göstergesi olarak varyans kullanılır. Ölçek geliştirme sürecinde de varyans, maddeler arası ve bireyler arası değişimin en önemli ölçüsüdür.

Görgül bir bilimsel araştırmada denence (hipotez) test edilirken çoğunlukla değişim yaratma potansiyeli olan bir değişkenin (bağımsız değişken) ilgili özellik (bağımlı değişken) üzerinde beklenen değişimi yapıp yapmadığı merak edilir; bu-nun için de genellikle deney ve kontrol veya araştırma ve karşılaştırma grubu (ya da grupları) kullanılır ve her gruptaki bireylerin ölçülen değişken açısından ola-bildiğince “aynı” olmasına (seçilmesine) özen gösterilir ve yöntembilim alanında bu bakımdan, grupları a priori ve a posteriori denkleştirme ve kontrol konusunda zengin bir literatür vardır. Bu bakımdan, istenmeyen değişimin kaynağı olabile-cek diğer değişkenler (karıştırıcı değişkenler) olabildiğince kontrol altında tutulur ki, geriye tek değişim kaynağı olarak değişimlenen (manipüle edilen) bağımsız değişkenden gelen etki kalabilsin. Bu, şu anlama gelir: Gruplar arası (deney ve kontrol grupları olsun) varyans olabildiğince büyük, grup içi varyans da olabildi-ğince küçük olmalıdır. Bu bakımdan, varyans analizindeki F değerinin (oranının) büyüklüğü için (yani, H0 denencesini reddetmek için gerekli olan Alfa olasılığı için- amaç elbette buysa), gruplar arası varyansın (σ2

GA) büyük ve grupiçi varyan-sın (σ2

Gİ) küçük olması arzu edilir. Araştırmanın etkililiği, σ2GA’nın büyüklüğüne

bağlıdır, ancak bu tek başına yeterli değildir, diğer yandan σ2Gİ’nin de olabildiğin-

ce küçük olması gerekir:

F = σ2GA / σ

2Gİ; 15/3 ≠ 15/15 gibi. Bu bakımdan, F değeri kuramsal olarak

minimum 1,00 olabilir.

Her grup içindeki bireyler ölçülen özellik açısından ne kadar birbirlerinden farklıysa σ2

Gİ da o kadar büyüyecektir (maksimum σ2GA kadar); bu bakımdan or-

taya çıkacak fark değişimlemeden mi, yoksa her grupta bulunan bireylerin zaten

Page 13: Psikolojide Ölçme ve Ölçek Geliştirme-II · kilidir ve büyük kozmik zamanda enerji farklılıklarından dolayı madde farklılıkla - rı da ortaya çıktığı için her şey

xiv Psikolojide Ölçme ve Ölçek Geliştirme II

var olan farklılıklarından mı kaynaklanıyor “anlaşılamaz”. Bundan dolayı, σ2Gİ bir

araştırma denencesinin testinde araştırmaya (ölçmenin değil) karışan hatanın bir ölçüsü olarak alınır:

Grup

Birey

Grup I Grup IIA

durumuB

durumuA

durumuB

durumu

1

2

3

4

5

.

.

.

5

5

5

6

5

5

.

.

.

1

9

2

5

7

2

.

.

.

1

1

1

1

2

1

.

.

.

9

1

8

2

3

4

.

.

.

Tablodaki hipotetik durum ve değerlerden şunu anlıyoruz: A durumunda, Grup I ve Grup II’nin arasındaki σ2

GA büyük, σ2Gİ ise küçük olacak ve gruplar

arasındaki fark denencesi (H1) de kabul edilmiş (H0 red); oysa ki B durumunda, σ2

GA büyük olsa bile σ2Gİ de büyük olacağından H0 denencesinin kabulü olasılığı

da artacaktır.

Bir ölçek geliştirme sürecinde ise (tekboyutluluk açısından), yukarıdaki gör-gül araştırmanın etkinliğindeki satır/sutün varyans beklentisinin tam tersi söz konusudur: Ölçülecek özellik açısından, ‘madde veya ölçek toplam puanları için’ bireyler arası varyansın (σ2

BA) oldukça büyük, sütunlarda yer alan maddeler arası varyansın (σ2

MA ) ise oldukça küçük olması arzu edilir:

Page 14: Psikolojide Ölçme ve Ölçek Geliştirme-II · kilidir ve büyük kozmik zamanda enerji farklılıklarından dolayı madde farklılıkla - rı da ortaya çıktığı için her şey

xvBazı Hatırlatmalar

Madde

Birey 1 2 3 4 5 . . . k

1

2

3

4

5

.

.

.

5 5 4 5 1 . . .

1 2 1 1 4 . . .

3 3 3 3 5 . . .

2 2 2 2 4 . . .

2 1 1 1 5 . . .

. . . . .

. . . . .

. . . . .

Peki neden? Bunun iki potansiyel nedeni vardır: 1) Geliştirilecek ölçeğin, öl-çülecek özelliğin tüm ranjını temsil edecek olan bireylere ‘uygulanacak’ olması ve bu nedenle maddelerin ve ölçeğin bu bireyler arası farkı ayırt edebilmesi ile 2) ölçek veya altölçekteki maddelerin tekboyutluluğunun sağlanması. Aynı boyut içindeki σ2

MA’ın büyümesi, maddelerin aynı şeyleri ölçmekten giderek uzaklaşması ve tek-boyutluluğun bozulması anlamına gelir; bu da hem madde istatistik ve paramet-relerini hem de güvenirlik ve geçerliği olumsuz yönde etkiler. Örneğin, tablodaki 5. madde oldukça sorunlu görünmektedir; bu maddenin yazımında anlamsal bir sorun olabilir veya bir başka altboyuta ait olabilir, salt bu nedenle σ2

MA büyür. El-bette, ölçülen özellik çokboyutlu olabilir, ancak bu beklenti her altboyutun kendi içinde tekboyutlu hale getirilmesi gerektiğini ortadan kaldırmaz. Ölçme kuram-larını, ölçek geliştirme sürecini ve ölçeğin psikometrik özelliklerini anlayabilmek için bu bireylerx maddeler matrisinin çok iyi kavranması gerekmektedir.

Varyansın en iyi kullanıldığı alan, ileride görüleceği gibi, Genellenebilirlik Kuramı’dır. Bir Yüzeyli (facet) Genellenebilirlik Kuramı, (bireyler x maddeler) de-ğişim kaynağının yanında ortaketkiyi de dikkate alarak, aslında psikometrik anla-yışı yansıtmaktadır.

Ancak bu istatistiklerin hemen tümü ve dolayısıyla madde-ölçek psiko-metrik özellikleri, sonuçta, maddelerin gerçekten ilgili özelliği ölçecek şekilde hazırlanıp hazırlanmamasına ve deneme uygulamasındaki örneklemin ilgili özelliğin ranjını temsil edici olup olmamasına dayanmaktadır.

Page 15: Psikolojide Ölçme ve Ölçek Geliştirme-II · kilidir ve büyük kozmik zamanda enerji farklılıklarından dolayı madde farklılıkla - rı da ortaya çıktığı için her şey

xvi Psikolojide Ölçme ve Ölçek Geliştirme II

Kovaryans ve ölçmedeki yeri

Kovaryans, aynı obje kümesine ait iki değişkenin birlikte değişkenliği hak-kında bilgi verir (Baykul, 2010; s. 59). Tıpkı korelasyonda olduğu gibi, kovaryans-tan söz edebilmek için ölçümler arasında bağımlılık olması gerekir. İki değişken arasındaki kovaryans eşitliği:

,Kov X YX Y XY

Nxy

NX Y

NXY

= =- -

=-^ ^ ^h h h| | |

, beklenen

değerler için

Kov (X,Y) = E(XY)-E(X).E(Y).

İkili puanlanan maddeler içinse, evren kovaryansı, ;jk jk j kv r r r= -

eğer bir başarı testinin iki maddesi arasındaki kovaryans hesaplanacaksa, .S p p p pjk jk j k jk= - her iki maddede de doğru cevaplayanların göreli frekansı,

pj, j maddesini, pk, k maddesini doğru cevaplayanların göreli frekanslarıdır.

Bir değişkenin (ölçme işleminde maddenin) kendisiyle kovaryansı, onun var-yansını verir; bu bakımdan, eğer maddeler arası kovaryans matrisi oluşturulmuş-sa, bu matrisin köşegen değerleri maddelerin her birinin varyansları (bir madde-nin kendi kendisiyle kovaryansı varyansıdır) olduğundan, matrisin sadece yarısını (alt veya üst) vermek yeterli olur ve böyle bir matris, “varyans-kovaryans” matrisi olarak da adlandırılabilir. Kovaryanslar ham puanlar üzerinden de hesaplanabilir, ama kullanışlı olmaz; bunun yerine standart puanlardan hesaplanması yeğlenir; çünkü ham puanlar eşit aralıklı olarak kabul edilemez ve bu nedenle karşılaştırma yapmaya uygun değildir.

Bir tek değişkenin-maddenin (bireysel puanlar açısından/sütun) varyansının büyük olması, maddeler arası (satır) varyansın ise küçük olması arzu edilirken; maddelerin birbirleriyle kovaryanslarının ise büyük olması (ölçek tekboyutluluğu açısından) arzu edilir. İki madde arasındaki kovaryans ne kadar 0,00’a yaklaşırsa, iki madde arasındaki ilişki de dikleşir (ortogonal) ve iki maddenin birbirinden ba-ğımsız (farklı boyutlarda) yer aldığı sonucuna varılır. Ölçek geliştirme sürecinde, tekboyutluluk açısından arzu edilen;

Madde varyansı

(sütun içi/bireyler arası)

Maddeler arası varyans (sütunlar arası/maddeler arası)

Madde kovaryansları

(ikişerli birlikte değişim)Büyük Küçük Büyük (yeterince)

• Madde varyansı büyüdükçe grubun ölçülen değişken açısından hetero-jen, maddenin ayırt ediciliğinin yüksek olacağına; küçüldükçe grubun homojen ve maddenin ayırt ediciliğinin düşük olacağına işaret eder: Grubun örneklenmesi ve/veya madde yazımı sorunları.

Page 16: Psikolojide Ölçme ve Ölçek Geliştirme-II · kilidir ve büyük kozmik zamanda enerji farklılıklarından dolayı madde farklılıkla - rı da ortaya çıktığı için her şey

xviiBazı Hatırlatmalar

• Maddeler arası varyansın küçük olması, maddelerin aynı boyutu ölçtü-ğüne, büyüdükçe farklı boyutları ölçtüğüne işaret eder: Kavramsal ör-nekleme, madde örnekleme ve/veya madde yazımı sorunları.

• Madde kovaryansının büyüklüğü (elbette bir yere kadar arzu edilir), iki maddenin ‘benzer’ şeyleri ölçtüğüne; küçüklüğü (0,00 tamamen ayrı) farklı şeyleri ölçtüğüne işaret eder: Yukarıdaki sorunların tümü.

Bu üç durum, ölçme ‘hataları’ açısından önemli göstergeler olduğundan, öl-çek geliştirme sürecinde olduğu gibi, güvenirlik-geçerlik irdelemelerinde, model test etmelerde ve daha pek çok işlemde önemli istatistiklerdir.

Vektör ve ölçmedeki yeri

Vektör, aynı boyut üzerinde yer alan bir grup verinin başlangıç ve bitim de-ğerleri ile büyüklük ve yönü hakkında bilgi veren büyüklüklerdir. Bir vektör üze-rindeki değerlere vektörün bileşenleri denir.

Vektörler, bir psikolojik özelliği ölçme iddiası içeren bir ölçme aracının mad-delerinin boyutluluklarını (tek boyutluluk-çok boyutluluk, tekfaktör/çok bileşen-lilik) ve bu boyutlar arasındaki ilişkileri (veya ilişkisizlikleri) saptamada önemli bir yer tutar.

İki vektörün birbirine göre ilişkileri, onların skaler çarpımlarıyla bulunabilir: u.v = |u| . |v| . Cosθ. Bu çarpımın 0,00 olması (Cosθ=0,00), iki vektör arasındaki açının 90o, yani bu iki vektörün (boyutun) birbirine dik olması durumunda, bu iki vektör (boyut) birbirinden lineer bağımsız demektir. Vektörler ile faktör analizinde boyut çıkarma birbiriyle yakından ilişkilidir.

Psikolojik değişkenler için lineer bağımsız olan iki vektör veya boyutun topla-namazlığı söz konusudur. Örneğin, psikolojide “çatı” değişken olan kişilik, duygu dışavurum tarzları veya ilgiler gibi değişkenler böyledir: Nörotik kişilik boyutu-nun psikotik kişilik (MMPI’da olduğu gibi) boyutuyla, açık alana ilgi boyutunun sayısal ilgi boyutuyla (Kuder İlgi Envanteri’nde olduğu gibi) toplanması bir anlam ifade etmez. Bu bakımdan, bir kişinin “kişilik (toplam) puanı veya ilgi toplam pu-anı şudur” demek anlamlı olmaz; ancak her altboyut toplam puanları bir anlam ifade eder. Ancak ve ancak, aynı vektör üzerindeki bileşenler veya vektörler ara-sındaki açı küçük olursa toplanabilirlik söz konusu olmaya başlar. Tekboyutlulu-ğu gösterilmiş bir ölçek veya bir altölçeğin kendini oluşturan maddelerinden elde edilmiş puanlarının toplanması, ölçmede birikimliliğe uygundur. Ancak psikolo-jik değişkenler için pür/saf bir vektör elde edebilmek hemen hemen olanaksızdır. Öte yandan boyutlar arası açının küçük olduğu (tekfaktörlü-çokbileşenli) durum-

Page 17: Psikolojide Ölçme ve Ölçek Geliştirme-II · kilidir ve büyük kozmik zamanda enerji farklılıklarından dolayı madde farklılıkla - rı da ortaya çıktığı için her şey

xviii Psikolojide Ölçme ve Ölçek Geliştirme II

larda, çokça kanıtlandığı gibi (Wechsler Zekâ ölçeklerindeki gibi) hem altboyutlar kendi içinde hem de altboyutlar kendi arasında toplanabilir ve bu toplamlar, pu-anların yorumunda bir anlam ifade eder. Kümelerle gösterildiğinde bu durum şu şekildedir (Erkuş, 2014):

A. Ayrık yapılar (faktörler) B. Bileşik yapılar (bileşenler)

Ayrık yapıların her biri kendi içinde tek boyutludur ve vektörler arası açı 900’ye yaklaşır ve faktör analizinde dik döndürmelere uygundur. Bu tür ayrık ya-pılarda, maddeler birbirleriyle ya çok küçük kovaryans gösterirler veya hiç gös-termezler, bir faktörde yer alan maddeler de diğer faktörlerle ya korelasyon gös-termez ya da eksi korelasyon gösterirler. Bileşik yapılarda ise vektörler arası açı küçüktür ve eğik (oblique) döndürmelere uygundur. Bileşenli yapılarda, maddele-rin hemen tümü ilk faktöre artı yük verirler ve ilk faktörün açıkladığı varyans tüm faktörlerden “açık ara” fazladır, çünkü psikolojik yapının doğası gereği “benzer şeyi” (“aynı” değil) ölçerler (birbirleriyle kovaryans gösterirler) ve açıklayıcı faktör analitik tekniklerle ölçeğin yapısı irdelenirken maddelerin hep diğer yapılara da yük verdiği görülür ve bu tür maddeler “atıldıkça” bu kez diğer maddeler de yük vermeye başlarlar. Tüm bunlar bize, hem ölçülen psikolojik yapının çok iyi bilin-mesi, hem de maddelerin yük değerleri ve işaretlerinin (ezber ölçütlerden uzak) bu değişkenin kavramsal yapısının dikkate alınması gerektiğini gösterir. Bileşen-li yapılar için, “a priori” puanlamanın bu istatistiksel sonuçlara göre yeniden ya-pılmasına ve ölçme hatalarının hiç değilse görgül-istatistiksel irdelemeden sonra “temizlenmesine” yönelik bir öneri ilk kitapta yapılmıştı. Aksi halde “kompleks” madde diye atılan her madde (aslında çokboyutlu veya bileşenli olan) psikolojik özelliğin yanlış tanımlanmasına ve ölçülmesine yol açmaktadır. Psikometride, bi-leşik-ayrık yapı ayrımı için gerekli olan açı ölçütünün bulunması, hâlâ en önemli araştırma konularının başında gelmektedir ve gelmelidir.

pegem
Sticky Note
Marked set by pegem
Page 18: Psikolojide Ölçme ve Ölçek Geliştirme-II · kilidir ve büyük kozmik zamanda enerji farklılıklarından dolayı madde farklılıkla - rı da ortaya çıktığı için her şey

xixBazı Hatırlatmalar

Matrisler ve ölçmedeki yeri

Matris, iki boyutlu uzayda iki değişkenin koordinat değerlerini veren (satır/sütun) bir tablo gösterimidir: A = |ajk|. Böyle bir matriste, her bir satır veya sütu-nun değerleri uzayda birer nokta olarak bir vektör oluştururlar. Matrisler, ölçmede bazı işlemleri yapmada önemli bir yer tutarlar. Psiko-fizik ölçmenin, aynı bireyler-den tek tek alınan fiziksel-algısal büyüklüklerini içeren tekrarlı ölçmelerini içeren matrislerin yerine, psikometrik ölçmenin madde-bireyler matrisinin kullanılma-sıyla birlikte önemi ve işlevi daha da artmıştır. Matrislerle (M = (1xA) / N olmak üzere) yapılabilecek bazı işlemler:

• Bir puanlar matrisinin (birey x madde), kendisinin transpozuyla (sağ-dan) çarpımı, kovaryans matrisini, bu matrisin köşegen değerleri de madde varyanslarını verir.

• 1-0 puanlanan maddeli testler/ölçekler için, madde güçlük/onaylanma düzeyleri için, madde puanları matrisinin, 1 satırlı n sütunlu ve tüm elemanları 1 olan bir matrisle çarpımı, madde güçlük (veya onaylanma) indeksleri matrisini verir.

• Madde güçlük (onaylanma) matrisinin, kendi transpozuyla çarpımının kovaryans matrisinden çıkarılmasıyla da maddeler arası kovaryans mat-risi elde edilir.

• Model test etmek de korelasyon/kovaryans matrisine dayanır:

I I I

I

yT T

y y

xT

xT

TyT

x xT

1 1 1

1K

/ / K /

/

/

/ / / K

b } b b

b

CUC

UC

CU

U=

- + - + -

- +

f

d

- - -

-

J

L

KKKKKKKK^

^ _

^

^ ^ N

P

OOOOOOOOh

h i

h

h h77

AA

|

Kestirilen kovaryans matrisi (∑) ile gözlenen kovaryans matrisi (S) arasındaki ilişki konusunda Maximum Likelihood uyum fonksiyonu,

F = log|∑| + tr(S∑-1)-log|S|-(p + q)

şeklinde formüle edilir. İki matris ne kadar birbirine eşitse, uyum o kadar yüksek anlamına gelir.

Faktör ve ölçmedeki yeri

Faktör, iki anlamda kullanılmaktadır: Bağımsız değişken/etmen olarak ve doğrudan gözlenemeyen ya da örtük değişken, yani psikolojik yapı (construct). Bu-radaki ilgimiz, psikolojik değişkenin altta yatan örtük yapısı anlamındadır. Faktör analizi, genel olarak, gözlenen değişkenler arasındaki ilişkilerden hareketle, bu

Page 19: Psikolojide Ölçme ve Ölçek Geliştirme-II · kilidir ve büyük kozmik zamanda enerji farklılıklarından dolayı madde farklılıkla - rı da ortaya çıktığı için her şey

xx Psikolojide Ölçme ve Ölçek Geliştirme II

örtük yapıları ortaya çıkarma, yani aynıları aynı yerde-farklıları farklı yerde öbek-leme işlemidir; bu işlem maksimum k-1 faktör çıkarılıncaya kadar devam eder. Bir psikolojik ölçme aracının maddeleri için söyleyecek olursak; maddeler arası korelasyon veya kovaryanstan hareketle, birbiriyle ilişkili olanlar bir faktör (veya bileşen) altında yer alırlar; bu madde öbeği içindeki her maddenin o faktöre kat-kısı ise faktör yükü (factor loading) adını alır. Bir maddenin tüm faktörlere verdiği yüklerinin karelerinin toplamı ise o maddenin veya değişkenin ortakvaryansını (common variance/communality) verir: Demek ki, ortakvaryans bir maddenin kaç faktör varsa hepsine ve isterse negatif olsun toplam olarak katkısını verir; ortak varyans, ham puan yerine z-puanlarının kullanılması ve değerlerin 1,00’den kü-çük olmasından dolayı daima 1,00’den küçük olur. Bir maddenin, ilgili özelliğe katkısı için ortakvaryansın 0,50 ve üstü olması arzu edilir. Elbette, ilişkili (bile-şik) ve ilişkisiz (ayrık) faktörler için formüllerde biraz farklılık söz konusudur. Her bir maddenin kendi faktör katkısı ile testin varyansına katkısının parçası biricik varyans (unique variance) olarak adlandırılır ve bu da ortakvaryansın 1,00’den çı-karılmasıyla elde edilir. Biricik varyans da iki bileşenden oluşur: Özgül varyans (specific variance) ve hata varyansı (error variance). Bu bakımdan, ortakvaryans, özgül varyans ve hata varyansının toplamı 1,00’e eşittir ve ortakvaryans ile öz-gül varyansın toplamı da o değişkenin güvenirliğini gösterir. Her faktörün kendi içindeki maddelerin faktör yükleri karelerinin toplamı ise o faktörün özdeğerini (eigenvalue) verir ve bu da o faktörün ölçeğin tümündeki katkısını (bir anlamda açıklanan varyansı) gösterir. Buradan hareketle, mükemmel bir tekboyutluluk için (her madde aynı yönde işarete ve 1,00 faktör yüküne sahipse), özdeğer = madde sayısı (k) anlamına geldiği sonucu çıkarılabilir; ancak tekrar belirtmek gerekirse, bu psikolojik ölçme araçları için hemen hemen olanaksızdır.

Faktör döndürme, ilgili faktörlerin uzayda döndürülerek anlamlı hale getiril-mesine yarar. Temel olarak dik (ayrık faktörler için) ve eğik (bileşen yapısındakiler için) döndürme yöntemleri altında çeşitli döndürme işlemleri vardır.

Not: Okuyucuya, bu kısımdaki cebirsel işlemler konusunda daha ayrıntılı bilgi için McDonald, 1999’a ve Baykul, 2010’a başvurması salık verilir. Bu kısım (şimdilik) Adnan Erkuş tarafından yazılmıştır.

Page 20: Psikolojide Ölçme ve Ölçek Geliştirme-II · kilidir ve büyük kozmik zamanda enerji farklılıklarından dolayı madde farklılıkla - rı da ortaya çıktığı için her şey

Bilimin dört temel ‘çalışma amacı’; anlamak, açıklamak, yordamak (predic-tion) ve denetim altına almaktır. İnsanlar bilim olmadan da anladıklarını, açıkla-dıklarını ve hatta yordadıklarını geçmişte ve bugün de günlük yaşamda sıklıkla belirtmektedirler. Sıradan gözlemlerimiz oldukça özneldir ve bizleri yanılgıya sü-rükleyebilirler; bilimde gözlem ise, herkesin üzerinde anlaşmaya vardığı sayısal-laştırmaya dayandığı için “oldukça” nesneldir. Bir balıkçı da havanın durumundan fırtına olacağını, balık akınının olacağını tahmin edebilir; ancak balıkçının tah-mini yanılma paylarına rağmen kendi bölgesi için geçerli olabilir, bir başka böl-gede işe yaramaz; meteorolog ise tahminini sayısallaştırılmış gözlem sonuçlarına ve önceden bulunmuş fizik yasalarına dayandırır ve her koşulda bu bilgiler işe yarar. Dogmalar da bir açıklama getirdiklerini iddia ederler; ancak bilimin farkı, akla uygunluğun yanında kullandığı yöntemde yatmaktadır; temelde bu yöntem gözlem ve deneydir. Bu sayısallaştırma yoluyladır ki, gözlemlerimiz iletilebilir, tekrarlanabilir, doğruluğu yanlışlığı test edilebilir duruma gelirler. Oysa günlük yaşamdaki öznel gözlemlerimize dayanan anlama, açıklama ve çıkarımlarımız ço-ğunlukla birbirimizinkinden farklıdır ve kişiler arası çatışmalarımızın da önemli bir kısmını bu oluşturur. Bilimde ise bu gözlem önceden standartları belirlenmiş bir araç yoluyla sayılara dökülerek yapılır. Her türlü ölçme, başlı başına bir gözlem olayı; gözlemin sayısallaştırılmış şeklidir.

Bu ölçmelerin işe yararlığı ise, elde edildiği aracın psikometrik nitelikle-rinin sağlamlığına bağlıdır. Bu psikometrik nitelikler ise “güvenirlik (reliability)” ile “geçerlik(validity)tir. Bu iki özellik birbirine bağlıdır: Bir ölçme aracının geçerli olabilmesi öncelikle onun güvenilir ölçme yapabilmesine bağlıdır; bu bakımdan

I. BÖLÜM

ÖLÇME ARAÇLARININ PSİKOMETRİK NİTELİKLERİ

Page 21: Psikolojide Ölçme ve Ölçek Geliştirme-II · kilidir ve büyük kozmik zamanda enerji farklılıklarından dolayı madde farklılıkla - rı da ortaya çıktığı için her şey

geçerli olan bir ölçme aracı zaten güvenilir olmak zorundadır; ancak güvenilir olan bir ölçme aracı geçerli olmayabilir. Ancak, bunlar da psikolojik değişkenin yapısının ne ve nasıl olduğunun ortaya çıkarılma (ölçme aracının geliştirilme) süre-cinin sağlamlığına bağlıdır…

Psikolojik ölçme araçlarının güvenirliği ve geçerliği denince, çoğu kez, sanki bunlar ölçek geliştirme sürecinden ayrı niteliklermiş gibi algılanmakta ve o şekilde ele alınagelmektedir. Oysaki bu iki niteliğin ‘nitelikli olabilmesi’ tamamıyla öl-çek geliştirme sürecinin niteliğine bağlıdır ve hatta ölçek geliştirme sürecinin ta kendisidir. Bu bölümün, bu niteliklere yaklaşımı bu bakışaçısına uygun olacaktır. Bu bakımdan, hem güvenirlik hem de geçerlik kısımlarında, bugüne kadar alışı-lagelmiş sınıflama ve anlatımların dışına çıkılacaktır. Böylesi bir bakışaçısı, ölçme kuramlarına da zaman zaman genelleştirilecektir. Bu nedenle, kitabın okuyucusu tartışmaya açık bakışaçısına, bölümün yazarı da eleştirileri göğüslemeye hazır ol-malıdır.

Bazı yayınlarda belirtilen “kullanışlılık (usability)” ise ölçeğin psikometrik ni-teliği değil, bir ölçme aracının belirli bir kullanıcı için elverişli olup olmamasıyla ilgilidir (o da ölçek kullanıcısını ilgilendirir, ölçeği değil) ve teknik bir özellik de-ğildir. Bir psikolojik ölçme aracının, uygulama biçimi, sayfa sayısı, madde sayısı vb tümüyle ölçülecek özelliğin yapısına bağlıdır. Örneğin MMPI, WISC gibi “hacmi büyük” ve “uygulaması zor” ölçme araçlarının, kullanıcıların bazıları öyle istiyor diye hacmi azaltılamaz veya uygulama zorluğu basitleştirilemez. Bu bakımdan, “kullanışlılık” denilen “şey” bu kitapta yer alamayacaktır.

2 Psikolojide Ölçme ve Ölçek Geliştirme II

Page 22: Psikolojide Ölçme ve Ölçek Geliştirme-II · kilidir ve büyük kozmik zamanda enerji farklılıklarından dolayı madde farklılıkla - rı da ortaya çıktığı için her şey

Güvenirlik ile hata yan yana olan iki kavramdır ve özelliktir; sözün kısası, güvenirlik ile hata düşman kardeşlerdir. “Güvenilir kişi” dendiğinde, sözü-özü bir kişi; söz verdiği zaman ve yerde hatasız ve üstelik istikrarlı bir şekilde bulunan kişi akla gelir. Ölçme araçları için de benzer bir durum söz konusudur. Ancak, ne tür araç kullanırsak kullanalım (çoğu insan için olduğu gibi), ölçme sonuçlarına; çeşitli kaynaklardan bir miktar hata karışabilir. Bu durum, sadece insan bilimleri için değil, fizik bilimleri için de geçerlidir; ancak, insanın doğrudan gözlenemeyen psikolojik özelliklerinin ölçülmesi söz konusu olduğunda, bu durum bir o kadar daha önemli duruma gelir. Peki hatadan neyi kastediyoruz, hata kaç türlüdür, bu hatalar nerelerden kaynaklanır? Bu hatanın kaynağını, türünü, miktarını bilmek neden önemlidir? Çünkü her türlü anlama, açıklama, yordama ve denetim alma işleminin doğruluğu bu ölçmenin hatasızlığına bağlıdır. Ayrıca, hatanın kaynağını bilirsek onu daha başlangıçta kontrol edebiliriz; türünü ve miktarını bilebilirsek, işlemlerimizde onu etkisizleştirebilir, hatasız durumlar için kestirimlerde buluna-biliriz.

Hangi alanda olursa olsun, ister fen bilimleri isterse sosyal bilimler –hatta sosyal yaşantıda kişiler arası ilişkilerde, güvenirlik (reliability) söz konusu oldu-ğunda, hatanın ne ve ne kadar olduğuna değinmeden güvenirliği irdelemek ola-naklı değildir. “Bu saat hiç şaşmaz, buna güvenebilirsin”, “bu terazi hatasız ölçer”, “bu ölçek 0,99 güvenilirdir”, “Ali’ye güvenebilirsin, söz verdi mi yapar”… Hata kav-ramı, ister istemez “gerçek” kavramı ile de düşman kardeştir; bu bakımdan güve-nirlik ile gerçek arasında da ortak kardeşlik söz konusudur.

1. KISIM

GÜVENİRLİK (RELIABILITY)

Page 23: Psikolojide Ölçme ve Ölçek Geliştirme-II · kilidir ve büyük kozmik zamanda enerji farklılıklarından dolayı madde farklılıkla - rı da ortaya çıktığı için her şey

Ölçme ‘Sonuçlarına’ Karışan Hatalar

Her ölçme kuramı, bir önceki bölümde ele alındığı gibi, kendi hata modeli ile birlikte vardır. Dolayısıyla, “neyin” hata, “neyin” gerçek olarak görüldüğü, bu hatanın “ölçülen” ve “gerçek” ile ilişkisi ve onun nasıl belirleneceği konusunda farklılıklar karşımıza çıkaracaktır. Klasik Test Kuramı, “gerçek puan” kuramı ola-rak anılmasına rağmen, aslında psikometrideki tüm kuramlar bu gerçeğin arayışı içindedir.

Kısaca, ölçmelerde hata (error), ölçülmek istenmeyen miktarın ölçüm sonuçla-rına karışmasıdır. Diğer yandan, ‘bilmeyerek’ yapılan hata, “bilerek” yapılan yan-lıştan (false) farklı ele alınmalıdır. Ölçme sonuçlarına ‘karışan’ hataları tanıyalım:

1. Sabit hata: Her bir ölçme sonucuna belirli ve aynı yönde (+ veya -) ve sabit miktarda karışan hatadır. Bu durum genellikle ölçme aracının ka-librasyonundaki bozulmadan veya ölçmecinin bilerek ekleme-çıkarma-lar yapmasından ortaya çıkar. Örneğin, evdeki baskül, her 10 kg’da 1 kg fazla tartıyorsa ve toplam ağırlık 110 kg gelmişse, “gerçek” ağırlık 100 kg demektir. Bazen, ölçmeci de sınıftaki tüm puanlara (bazı gerekçelerle) 5’er puan ekleyebilir; aslında bu sabit hata gibi görünmekle birlikte, sabit yanlıştır. Sabit hatanın yönü ve miktarı bilindiğinde, gözlenen puandan o miktar kadar çıkarılıp eklenerek, gerçek puan bilinebilir.

2. Sistematik hata: Ölçme sonuçlarına belirli bir yönde belirli bir sistema-tiğe dayanarak (bir aritmetik dizi, oran vb) giderek artan veya giderek azalan miktarlarda karışan hatalardır. Bu hataların da yönü ve sistemati-ği bilinirse, gözlenen sonuçlar düzeltilebilir. Eğer belirlenemeyen neden-lerle bu sistematik artış/azalış ortaya çıkıyorsa, hatadır; ancak, özellikle insan özellikleri açısından bakılacak olursa, örneğin, yaşlılık belirli fizik-sel (ağırlık kaldırma gibi) ve psikolojik özelliklerde (unutma gibi) doğal olarak sistematik bir azalışa; çocukluktan gençliğe geçişte ise sistematik artışa neden olabilirler. Bu tür durumlarda, aslında bu değişimler, hata değil, gerçek puanlardaki değişimler olarak görülmelidirler. Örneğin, bir çocuğunuz olsun ve onun boyunu ve ağırlığını her hafta kaydediyor olun. Eğer bir patolojik durum veya dışsal bilinen bir neden yoksa, çocu-ğunuzun boy uzunluğu ve ağırlığı her hafta giderek artacaktır (olgunlaş-ma –‘maturation’); bu durumda, “benim metrem” veya “baskülüm hatalı ölçüyor” diyebilir misiniz? Aynı şekilde, zekâ yaşa bağlı olarak sistematik bir şekilde belirli bir yaşa kadar artar; aynı ölçme aracıyla ölçülen birey de giderek artan zekâ puanları alır; bu durumda zekâ ölçeği hatalı öl-çüm yapıyor sonucundan çok, ölçülen özelliğin değiştiği sonucuna yük-

4 Psikolojide Ölçme ve Ölçek Geliştirme II

Page 24: Psikolojide Ölçme ve Ölçek Geliştirme-II · kilidir ve büyük kozmik zamanda enerji farklılıklarından dolayı madde farklılıkla - rı da ortaya çıktığı için her şey

leme yapılır. Elbette, hem boy uzunluğu hem de ağırlık açısından, 19. yüzyıla kadar çocuklar bu belirttiğimiz şekilde değil, tam tersine “cüce” veya zekâsı geri yetişkinler” olarak nitelendiriliyordu; o dönemlerdeki çocuk giyimlerine ve çocuklara bakış açılarına bir göz gezdirildiğinde bu durum kolaylıkla anlaşılır. İşte, tam da bu nedenle, eğer ölçülen bir değişken başka bir değişkene bağlı olarak değişiyorsa, o değişkenin dü-zeylerine bağlı olarak normlar geliştirilir; özellikle bu tür durumlarda (çünkü başka normlar da vardır) norm geliştirmenin esprisi yatmakta-dır. Yoksa çocuklar hep “geri zekâlı” veya “cüce” olarak nitelendirilirdi Peki, ölçmecilere bir soru: Madde Ayrımsal İşlevi’nde (DIF) bu değişim mi incelenir? Öyle ya, madem zekâ yaşa bağlı olarak değişiyor, grup farklarına ANOVA ile bakarız, olur biter, DIF’e ne gerek var?! Gelecek kitaplarda bu konuya da eğileceğiz. Bu bakımdan sistematik değişim-ler gerçek puanlarda değişime yolaçacağından, bu tür hataların yolaçtığı farklılıklar güvenilmezlik (unreliability) kaynağı olarak hesaba katılmaz-lar (Ghiselli, Campbell ve Zedeck, 1981). Bu durum, bir önceki bölümde ele alınan Genellenebilirlik Kuramı’nın da ortaya çıkışının temel gerek-çesini oluşturur.

3. Seçkisiz (random) hata: Seçkisiz hatalar [“random” teknik anlamda asla “rasgele”, “gelişigüzel” olamaz; bunlar tam tersine “nonrandom” (acciden-tal, haphazard, incidental) seçme ve olasılık işlemleridir ve hem olasılıkları bilinemez hem de yanlı -bias- verilere/seçimlere yol açarlar (Bu konuda bkz. Erkuş, 2013 ve 2014).] ne yönde ve ne miktarda olduğu bilinme-yen hatalardır ve her türlü ölçmede bir şekilde bulunabilirler. İşte, ölç-me araçlarındaki hatalara konu olan çoğunlukla bu hatalardır. Yönü ve miktarı hakkında bir bilgiye sahip değiliz; çünkü, çeşitli kaynaklardan + veya – yönde ölçme sonuçlarına hata karışır; kimisi puanların yüksel-mesine kimisi de düşmesine yol açar. Peki, yükselme ve düşme (+ ve -) ne anlama gelir; birbirlerini (aynı miktardaysa ve seçkisiz seçilmişlerse) nötrleştirmelerine… Bu bakımdan örnekleme bir birim seçerken, onu seçkisiz seçmenin, seçilen birimlerden gelecek hatalar açısından örnek-lemin yansız seçimine katkıda bulunduğu varsayılır. Özellikle seçimlerin birbirini etkilememesi (bağımsızlık) ve seçimlerin olasılıklarının aynı (eşitlik) olması koşulları bunu sağlar. Seçkisiz hataların bu özelliği, bu hataların davranışı ve dağılımı hakkında önemli bir taban sağlar. Özel-likle psikolojik ölçmeler için geliştirilen araçlar, bir bireyden çok sayıda veya çok sayıda bireyden bir ölçüm almayı gerektirdiği için şu çıkarımı yapmak yanlış olmayacaktır: “Yeterince çok” ölçüm alınırsa, bu ölçümlere

Güvenirlik (Reliability) 5