Analüütilise kompetentsi arendamise seminarid 2006
Kuidas ankeetuuringut efektiivselt planeerida ja andmeid koguda?
14.09.2006
Katre SeemaTNS Emor
2
Käsitletavad teemad
Vajaduste kaardistamine, ülesande püstitus Üldkogumi kirjeldus Valikumeetodid Valimi headus Küsimustiku koostamine Tehniline aruanne Andmete kogumise meetodid
3
Vajaduste kaardistamine, ülesande püstitus (1) Miks? Uuringu läbiviimine iseenesest ei saa olla eesmärgiks Kes on uuringu sihtgrupiks? (asutused, firmad, elanikud,
kliendid, liikmesorganisatsioonid, objekti külastajad,
teenindajad, patsiendid, ..) Kas ja kuidas me saame oma uuringuobjekte kindlalt
määratleda/defineerida või iseloomustada? Kas on olemas andmekogusid üldkogumi kirjeldamiseks,
sihtgrupi osakaalu määramiseks? Kas äkki on meid huvitav informatsioon juba kusagil olemas?
Kas see on usaldusväärne ja kasutatav? Kas meil on ligipääs
sellele andmeallikale?
4
Vajaduste kaardistamine, ülesande püstitus (2) Jõudes ikkagi arusaamale, et teatavat tüüpi uuring on vaja läbi
viia, tuleb täpselt formuleerida konkreetse uuringu eesmärk.
Vastasel korral jääb võib uuringu ülesanne jääda häguseks ning
tulemused kesiseks. Võib ka juhtuda, et ühe uuringu raames ei olegi võimalik
tervikülevaadet probleemile saada (vaatenurki ja seega
võimalikke sihtgruppe liialt palju: liikluskorraldus - politsei,
autojuhid, ühistranspordi korraldajad, jalakäijad, jalgratturid,
erinevad ametkonnad jne jne) – tuleb püstitada hulk
alamülesandeid
5
Üldkogumi kirjeldus
Üldkogumi kirjeldamiseks sobivad mistahes andmeallikad, mis
on usaldusväärsed. Riiklik statistika, registrid, kõiksed andmekogud, eelmised
dokumenteeritud uuringud, teadusartiklid, uurimustööd Kui üldkogumi kohta on väga vähe teada, siis võib uuringu üks
eesmärke ollagi üldkogumi kirjeldamine (nt kalja joojad,
maasikate kasvatajad, autojuhid) laiema, teadaolevate
proportsioonidega objektide kaudu
6
Valikumeetodid
Kõikne uuring või valikuuring? Valiku suurus? Küsimusi on palju, vastuseid ja
põhjuseid nende vastamiseks samuti, kuid kõik sõltub väga palju
konkreetsest eesmärgist ja üldkogumist Tõenäosuslik valik on oma olemuselt juhuslik ja selle korral eeldatakse igal
indiviidil olevat teatav nullist erinev tõenäosus sattuda valimisse (lihtne
juhuvalik, süstemaatiline juhuvalik, kihtvalik, klastervalik, jne) Mittetõenäosusliku valiku korral individuaalseid valikutõenäosusi ei vaadelda
(kvootvalik, ekspertvalik, käepäraste elementide valik jne) Praktikas kasutatavate valikutehnikate varu on rikkalik, seda eriti ka
erinevate valikuviiside kombineerimise alusel. Kuid kuidas valida see õige? Millega mõõta valimi headust?
7
Valimi headus (1) Valimi headuse tuntud kokkuvõtlik garantii on valimi esindavus üldkogumi
suhtes (representatiivsus populatsiooni seisukohalt) Kahjuks ei ole esindavuse mõte kaugeltki üheselt mõistetav
Valim arvatakse esindavaks, sest valikus ei ole võimalik märgata
mingeid suunatud valiku märke Valikureegel on arendatud nii keeruliseks ja valik muutunud nii kalliks, et
ainuüksi seetõttu tavatsetakse valikut pidada esindavaks Kõige sagedamini peetakse esindavaks sellist valimit, mis osutub
üldkogumi minimudeliks. Valim moodustatakse tüüpilistest (ideaalsetest) objektidest ja on
seetõttu esindav. Mõnikord peetakse esindavaks ka sellist valikut, milles on esindatud igat
tüüpi objekt vaadeldavate objektide seast. (nt üliõpilane ja teaduskond)
8
Valimi headus (2)
Teine oluline headuse näitaja on valimi alusel saadud hinnangu täpsus Valimi koostamise eesmärgiks on saada andmeid tunnuse jaotuse või
jaotusparameetrite statistiliseks hindamiseks Hinnangu täpsus sõltub valimi kvaliteedist Hinnangu täpsuse alusena kasutatakse põhiliselt kaht kriteeriumi:
hinnang peab olema keskmiselt õige (nihketa) ja vähima dispersiooniga (hajuvusega)
Mida suurem on tunnuse dispersioon, seda kaugemale võib tegeliku
väärtuse suhtes hajuda valimi alusel saadud keskmine väärtus Mida suurem on valim, seda konsentreeritumalt paiknevad võimalikud
valimikeskmised väärtused parameetri tõelise väärtuse ümber
9
Valimi headus (3) Oluline on see, kui suure osa üldkogumist moodustab valim Mida suurem on valikuosa n/N, seda väiksemas ulatuses hajuvad
aritmeetilise keskmise võimalikud väärtused Kui tunnust võiksime pidada normaaljaotuse alusel jaotunuks, siis saaksime
ligikaudu hinnata ka valimikeskmise usalduspiire Usaldusvahemiku laius sõltub standardhälbe kaudu peale tunnuse
dispersiooni ka valimimahust n Määrates, kui kitsast usaldusvahemikku hindamisel soovitakse saada, on
võimalik arvutada, kui suurt valimit selleks kasutada Selline esmapilgul väärtuslik mõte ei ole aga eriti praktiline, sest iga tunnuse
jaoks tuleks teha oma arvutused ja peaksime teadma ka tunnuse
standardhälvet Reaalsed ülesanded on mitmekesisemad ja eeldavad suuremat valimimahtu
Mittetõenäosuslikud valikudTõenäosuslikud valikud
11
Tõenäosuslikud valikud (1)
Lihtne juhuslik valik on keskseim võimalikest valikuviisidest, esinedes
põhivõttena ka mitmete keerulisemate valikuskeemide sees. Üldkogumi nimestik peab olema kättesaadav (freimiks ametlikud registrid) Juhuarvude generaator (statistikaprogrammid, Excel, juhuarvude tabelid
jne) Üldkogumi nimestik nummerdatakse ja genereeritakse valimimahuga
võrdne arv juhuarve Indiviidid, kelle järjekorranumber ühtib genereeritud juhuarvuga, võetakse
valimisse Lihtsa juhusliku valimi saab moodustada ka pimevalikuga (nt nimesildid
mütsis)
12
Tõenäosuslikud valikud (2)
Sageli moodustatakse lihtne juhuvalik süstemaatilise valiku teel, valides
populatsiooni nimestikust indiviide kindla sammu järel (iga viies, iga kümnes
vms) Lugemist alustatakse nimestiku juhuslikult valitud kohast Tuleb jälgida, et populatsiooni nimestik oleks koostatud juhuslikus
järjekorras (perioodiline ja samm jälgib perioodi, siis tekib nihe) Oluline on mõista, et juhusliku loomu tõttu võib juhuslik valik anda ka halva
tulemuse ja uuritava parameetri ebaõige hinnangu. Paljude valikute korral oleks hinnang keskmiselt õige, kuid ei tarvitse seda olla
iga konkreetse üksikvalimi korral Üks tee hinnangu täpsusastme suurendamiseks seisneb tunnuse
hajuvusastme vähendamiseks, mille saavutamiseks…
13
Tõenäosuslikud valikud (3) … tuleb populatsiooni vaadelda struktureeritult, homogeensete
alampopulatsioonide kogumina Selle mõtte aluseks on kihtvalimi (stratifitseeritud valimi) moodustamine, mil
üldkogum jagatakse teatud kihitunnuse alusel osadeks ja iga kihi sees tehakse
lihtne juhuslik valik Kihitunnuseks on sageli demograafilised või regionaalsed tunnused –
sugu, haridus, regioon, asula tüüp jne Kihitunnuse väärtus peab iga indiviidi korral olema selgelt teada, samuti
peab olema teada indiviidide loetelu kihi sees (kihi freim) Kihid võivad uurimuse seisukohalt ka iseseisvat huvi ja seetõttu on vajalik
nende esindatus valimis Juhuslik valik kihi sees võib olla kihi suurusega võrdeline või
mittevõrdeline (tulemuste tagasikaalumine vastavalt kihtide suurusele!)
14
Tõenäosuslikud valikud (4) Eelnevalt tutvustatud valikutehnikate korral langevad valikuühik ja uurimisühik
kokku ning mõõtmisi tehakse valikuindiviidide korral. Kasutatakse ka valikuskeeme, kus see nii ei ole näiteks klastervalik
(pesavalik). Valikuühikuks indiviidide rühm Indiviidide rühmast kas kõik indiviidid või valik nendest Klastri tähendus sõltub ülesande sisust (korrusmajade trepikojad, firmade
töötajad, leibkonnad, linnaplaani ruudud Sageli on klastervaliku põhjuseks see, et klastrisiseste indiviidide nimestik ei
ole eelnevalt teada ja koostatakse alles uurimuse käigus Samuti tuleb naabruses paiknevate indiviidide uuring odavam
15
Mittetõenäosuslikud valikud (1) Kvootvalik on mõnede arvates problemaatiline valikuviis, kuid sotsioloogilistes
uuringutes üsna levinud Kvootvaliku korral ei tagata kõigile indiviididele võrdseid võimalusi valimisse
sattuda, sest teatud momendil toimub valik ekspertmeetodil Kvootvalik on oma olemuselt kihtvalik, kus valik kihi sees toimub
ekspertmeetodil, näiteks küsitleja suva kohaselt. Küsitleja saab ülesande küsitleda kindlat arvu indiviide, kelle kirjeldus teatud
tunnuste osas on ette antud, personaalse valiku teeb aga küsitleja ise. Kui küsitleja valib indiviidid juhuslikult, siis ei tohiks kvootvaliku tulemustes
nihet tekkida, kui kvoot täidetakse tendentslikult, siis võib tekkida ka viga. Kvootide kehtestamiseks peab hästi tundma populatsiooni, selle variatiivsust
põhjustavate tunnuste jaotusi. Eesmärk on saavutada valim, mis on üldkogumi
minimudel teatud tunnuste osas)
16
Mittetõenäosuslikud valikud (2) Populatsiooni tundmata on raske õigeid kvoote kehtestada, kvootide õigsusest
sõltub aga see, kas valimi alusel saadud tulemused on nihketa või ei ole. Kvootvaliku tehnika on kutsunud esile elava diskussiooni selle valikuviisi heade
ja halbade külgede üle: Kvootvaliku korral ei ole võimalik hinnata tulemuste viga Ka tõenäosuslike valikuviiside korral on vea hindamine keerukas ja
kaudne, eriti mitmeastmeliste valikuviiside korral Valiku viga sõltub suures osas sellest, kuivõrd juhuslikult tehakse
kvootgrupis valik (intervjueerija lähikond, teatavat sorti piirkonnad jäävad
välja või indiviid ei ole kvoottunuse alusel selgelt identifitseeritav) Kvootvalik on odavam, toimub kiiremini ja on korralduslikult lihtsam.
Intervjueerija võib valida lähestikku paiknevad või muidu kergesti
kättesaadavad indiviidid, samuti ei ole vaja valikufreimi
17
Mittetõenäosuslikud valikud (3) Kui kvootvalikus on subjektiivne otsustus olulisel kohal, siis ekspertvalik
põhineb täielikult subjektiivsel valikul. Valimisse võetakse tüüpilised või ideaalsed esindajad, seda muidugi eksperdi
arvamuse kohaselt (nt etnoloog valib 8 tüüpilist Eesti küla ja korraldab neis
süvauuringu) Ekspertvalikuga saavutatakse üldkogumi esindavus tüüpiliste omaduste
edasiandmise mõttes Ekspertvalikut saab kasutada siis, kui üldkogumit tuntakse väga hästi, kuigi
seda võib-olla ei osata kvantitatiivselt väljendada Ekspertvalik ongi kvalitatiivse, fenomenoloogilise analüüsi iseloomulikuks
valikumeetodiks
18
Mittetõenäosuslikud valikud (4) Käepäraste elementide valik – valim kujuneb iseenesest kättesaadavatest
indiviididest, indiviidide otsimine ja valiku planeerimine jääb ära. Ajaleheküsitlused – vastab teatud hulk lugejaid, üldkogum konkreetse lehe
lugejate hulk Tänavaintervjuud – igaüks ei satu intervjueerimiskohale
Üldisemat laadi ja kirjeldavate ülesannete korral võiks sellist valikuviisi siiski
kasutada, kuid mittetõenäosuslike valikumeetodite korral ei saa valimi alusel
teha tõenäosuslikke järeldusi. Veahinnang toimub ekspertmeetodil, klassikaline “olulisuse nivoo statistika” ei
ole rakendatav, sest valik ei pruugi olla juhuslik. Valimit tuleb käsitleda kui üldkogumi analoogi ja kasutada ainult selles ulatuses
järelduste tegemiseks üldkogumi kohta
Andmete kogumise meetodidKüsimustiku koostamine
20
Küsimustiku koostamine Ankeeti koostada võib olla väga lihtne, kuid samas ka väga keeruline, olulisemad
asjad läbimõtlemiseks on: Ankeedi loogiline ülesehitus Küsimuste arusaadavus ja järjekord, filterküsimustest lähtuvad üleminekud Vastusevariantide kõikehõlmavus Mittevastamise lubamine või mittelubamine Küsimuste püstitus kujul, et vastused oleksid analüüsitavad ja annaksid
infotmatsiooni (100% “jah” vastuste vältimine) Kaudsed küsimustega olulise info saamiseks juhul kui otseküsimused ei
mõõda tegelikkust (alkoholi tarbimine, tundlikud teemad, ..) Ankeedi pikkus ehk ajakulu vastajale Abimaterjalid vastajale sõltuvalt meetodist kas pildid, kaardid, ettelugemised
21
Küsimustiku koostamine. Tehniline aruanne Kindlasti tuleb küsimustiku koostamise faasis jälgida uuringu põhieesmärke ja
seda, kas nimetatud küsimuste kogum ikka mõõdab seda, mida peab (küsimuste
valideerimine, pilootuuring) Kui uuringu üks eesmärke on üldkogumi kirjeldamine, peab sihtrühma
mittekuuluvate indiviidide kohta ka infot koguma Samuti peaks juba siin läbi mõtlema andmetöötluse ja andmete esitamise
põhimõtted – millisel kujul andmed saavad olema, mis tüüpi graafikuid, tabeleid,
kokkuvõtteid on võimalik sedatüüpi tunnustega saavutada Millistes sots-dem lõigetes andmeid analüüsitakse, kas kõik vajalikud
taustatunnused on ankeedis sees Kuidas ja kas on tagatud vastaja anonüümsus? Mil viisil saab kogu uuring dokumenteeritud – meetodid, kirjeldused, kuupäevad,
külastuskohad, intervjuude mittetoimumised, sihtrühma mittekuulumised
22
Andmete kogumise meetodid (1)
Kogumistehnika valikul on otstarbekas vaadelda meetodi kättesaadavust,
objektide valikureegli realiseerimise võimalikkust, meetodi kallidust,
andmekogumise aega ning tagasijõudvate andmete kvaliteeti Peamised andmekogumise võimalused on
Telefoniintervjuud Personaalintervjuud Internetiküsitlused Postiküsitlused
23
Andmete kogumise meetodid (2) Kui kõikide meetodite juures jälgitakse protseduurireegleid ja indiviidide
kättesaadavus lähenemisviisist ei sõltu, siis ei ole sisulist vahet, mil viisil
andmeid kogutakse Tihtipeale sõltub meetodi valik üldkogumi eripärast ja kontaktide olemasolust:
Veebiuuring võimaldab madalate kuludega korjata infot samaaegselt
paljudelt inimestelt, kuid e-postiaadressidega kaetus võib olla probleemiks.
Kuna personaalselt ei kohtuta, ei teata kas vastas õige inimene Telefon – kiire ja tänu programmile vigadevaene, kuid tavatelefonidega
kaetus ebaühtlane ning langevas trendis (2006.a TNS Emori omnibussid,
15-74a elanikud: telefon kodus 52%, mobiiltelefon 86%, ainult mobiiltelefon 44,5%
24
Andmete kogumise meetodid (3) Personaalintervjuu – võimaldab piltide näitamist, toodete edastamist,
juhuvalikureeglite head täitmist, kuid ajamahukas ja kallis. Kinniste uste
probleem Postiküsitlused – lihtne töösse anda, kuid töömahukas hilisemas faasis -
tagastamise määr, ebatäpselt täidetud ankeedid, vastamise korrektsus ei
ole kontrollitav, ei tea, kes tegelikult ankeedile vastas. Uuringu pikk
ajakava Andmete kogumise korrektsuse kontrollimise lihtsaim viis on järelkontroll
juhuslikult valitud uuringule vastanud indiviidide hulgas Järelkontrolli küsimustikus saab kontrollida intervjueerija käitumise korrektsust,
tehtud valikureeglite täitmist, mõne taustaküsimuse kokkulangemist Järelkontroll ei pea olema läbi viidud sama meetodiga, mis põhiuuring
Kasutatud kirjandus:Andmeanalüüs sotsiaalteadustes, L.-M. ToodingRakendusstatistika algkursus, E.-M. Tiit, M. MölsTõenäosuslik valikuuring, I.Traat, J. Inno
Suur tänu kuulamast ja kaasa mõtlemast!