2.2 data - is.muni.cz · umožňuje jména také popsat ve formě variable label (viz obr . 2...
Post on 03-Nov-2019
5 Views
Preview:
TRANSCRIPT
58
KapItOla 2
− Usložitějšíchvýpočtůvícerozměrnýchanalýzjepotřeba,abystesivšechnypříka-zykanalýzámuchovávalivesvémvýpočetnímarchivu .Nikdytotižnevíte,kdysibudetemusetověřit,zdali jstepostupovalisprávně–abezarchivacesyntaxevýpočtutohonebudeteschopni .
SPSSmápoměrněrozsáhlouadobřezpracovanounápovědu(Help),kteráobsahu-jeizákladníuvedenídoprogramu(Tutorial) .Rozhodněstojízaprohlédnutí .Společněsukázkovýmidatysetotižlzemnohémunaučitsámibezdotěrnéhoučitelea(špatně)napsanéučebnice .
2.2 Data
2.2.1 Matice dat
Přistatistickéanalýzedatpracujemesčíslicemi,kterémajíurčitývýznam(pracujemeskategorizovanýmidaty),nebosčísly .Abychommohlianalýzuprovádět,musímetatodatadostatdopočítačeavytvořitvněmdatovoumatici .Protožejdeozpracováníhromadnýchdat,pracujemeshodnotamiproměnných neboliskvantifikovanýmicha-rakteristikami/vlastnostmipřípadů– to je respondentůči jinýchobjektů,popřípadějevů .Maticitvořítedypřípady(obvykleřádkymatice)versusproměnné(obvyklesloupcematice)aobsahmaticetvoříhodnoty příslušných proměnnýchcharakteri-zujícíchjednotlivépřípady .
Případy jsoupopsánysvýmivlastnostmi(atributy)–variantaminebolihodnotamiproměnných,kteréjsoujejichlogickýmiuskupeními .Napříkladproměnnávzdělánímůže být uskupením možných nejvyšších dosažených stupňů vzdělání: základ-ní, středoškolské, vysokoškolské, které lze popřípadě dále členit: vysokoškolskénižšího typu (Bc .), vyššího typu (Mgr .), popř . s vědeckou hodností (PhDr ., Ph .D .apod .) .Každémupřípadupřidělujemevmaticijehoidentifikačníčíslo–ID–aideál-níje,máme-listejnýmčíslemoznačenýioriginálnídokument,zněhoždataopřípadu(nejčastějirespondentovi/respondentce–tedydotazníku)čerpáme .Jentakmůžemevpřípaděnejasnostíporovnatzdrojdatsjejichzáznamemvmatici(protodotazníkynikdyneničíme,alearchivujemeje)adatatakdodatečněkontrolovat .Ažesechybypřinahrávánídatvyskytují,jemnohokrátpotvrzenouzkušeností .47
Cojsouproměnné,jižvíme,stejnějakovíme,žeexistujíproměnnékategorizované(nominální a ordinální) a proměnné spojité (kardinální) . U nominálních proměnnýchje spojení číslice (numerického kódu) a vlastnosti zcela arbitrární, takže bychomproměnnou „rodinný stav“ mohli kódovat např . 1 = svobodný/á, 5 = ženatý/vdaná,6 = rozvedený/á a 9 = ovdovělý/á, u ordinálních proměnných číslice označují pozici
47 Cožjenomdálenahráváurčitéskepsiomožnostechměřenívsociálníchvědách .Jealepravda,žechybámpřinahrávánídatdopočítačesenevyhnouanipřírodnívědy .
59
pRÁCE s hROMaDNÝMI DatY pŘED aNalÝZOU
variantynaškále,anižbycokolivříkalyovzdálenostimezitěmitopozicemi(vzdělání:základní=1,střední=2,vysokoškolské=3apod .) .Jedobrésitotozvolenépřiřazeníčíslickcharakteristikámpamatovat:jesicejiždokumentovánovdotazníku,aledoněhonemůžemepřianalýzezčasovýchdůvodůneustálenahlížet,aprotopřidefinicimaticevSPSSmusímevedledefiniceproměnnýchtakéurčit,jakproměnnoupojmenujeme,kolikbudemít–vpřípaděspojitýchproměnných–desetinnýchmíst, jakýverbálnívýznammá jméno proměnné a číslice jejích hodnot v případě kategorizovaných proměnných .Uspojitýchproměnnýchjsoujejichhodnotykonkrétnímičísly,kterápřímovyjadřujímnožstvípříslušnévlastnosti,takžepopiskyjejichhodnotnejsoupotřebné .
Zopakujmesitedy:každýpřípadpředstavujevektorobsahujícíhodnoty příslušných proměnných(každávariantakaždéproměnnémápřiřazenučíslici) .48Vektoryplnímedomatice: co řádek, topřípad (např . respondent), a co sloupec, toproměnná .Všeilustrujeobr .2 .6 .
Obr. 2.6 Ukázka matice dat s pěti proměnnými a dvěma případy (respondenty) – smyšlený soubor
48 SPSSumožňujeizáznamhodnotyproměnnéveformětextu .Sohledemnato,žetutovariantupoužívámevsociálníchvědáchjenokrajově,znašichúvahjivynecháváme .
1 = muž2 = žena
1 = základní, nevyučen/a2 = základní, vyučen/a3 = středoškolské4 = vysokoškolské
1 = krajní levice2 = levice3 = střed4 = pravice5 = krajní pravice
PŘÍPAD (CASE/RESPONDENT) 1:pořadové číslo (ID) = 1080žena (pohlaví = 2)věk: 34 letvzdělání: vyučenápozice na škále politická levice či pravice = 1 signalizuje levicovou orientaci
PŘÍPAD (CASE/RESPONDENT) 2:pořadové číslo (ID) = 1081muž (pohlaví = 1)věk: 45 letvzdělání: vysokoškolsképozice na škále politická levice či pravice = 5 signalizuje pravicovou orientaci
60
KapItOla 2
Maticedatje,řečenojinak,souboremkódů,zanimižseskrývajíkonkrétníkvali-tativnínebokvantitativnívlastnostijednoteknašehovýzkumu .Tatodatamohoubýtdále upravována, například pomocí transformací proměnných či výběrem případůa–především–analyzována .
Podíváme-lisenynínadotazník,jenžjevsociologiiobvyklýmnástrojemsběrukvantitativníchúdajů,zhlediskaanalýzydat,jenutnokaždoujehootázku(položku)a navržený způsobměření (to je k ní přiřazenou stupnici hodnot) vnímat tak, jakukazujeobr .2 .7 .
36. S kým jsou podle Vás větší výdaje, se syny nebo s dcerami anebo je to stejné?
Obr. 2.7 Demonstrace otázky v dotazníku jako (kategorizované) proměnné z hlediska jazyka SPSS
pozn. Odpovídající jméno proměnné se obvykle neuvádí v dotazníku (proto zde absentuje), ale až při vytváření matice dat.
Každéotázcevdotazníku (neboliproměnné)musímepřiřadit technické jméno:vmaticidatsetotojménoobjevívoznačenísloupce .Jména(names)můžemedávatrůzná, ale SPSS má svá přísná pravidla, jak mohou vypadat . Především, každéjménomusízačínatpísmenem, jménabyalemělabýtpřiměřeněkrátká .49Ve jmé-nech můžeme používat písmena i číslice, jména tedy mohou být alfanumerická,alebezdiakritiky (např .P1,A26,X26), lzepoužívat ipodtržítko(např .P_01) .Přivymýšlení jmen simůžeme stanovit systém, který nám usnadní práci smaticí přianalýze .NapříkladrezervujemevšechnajménazačínajícípísmenemAproproměnné,kterézjišťovalydůvody,pročlidéchtějímítděti,písmenoBprodůvody,pročdětimítnechtějí .PísmenemDpakmůžemeoznačitdemografickécharakteristikyrespondentů(pohlaví, věk, rodinný stav apod .) Nebo můžeme používat i nápovědných jmenproměnných:např .sexpropohlaví(neprofrekvencikoitu),prijem,vzdel,job(po-volání) apod .Abychom věděli přesně, co tato technická jména znamenají, SPSS49 StaršíverzeSPSSumožňovalyužítjen8znaků .Jevhodnétentolimitnepřekračovat,protože
jinépaketymajítentolimitdodneška .
61
pRÁCE s hROMaDNÝMI DatY pŘED aNalÝZOU
umožňujejménataképopsatveforměvariable label(vizobr .2 .3)–vpodstatěsemmůžemevložitzkrácenouverziotázky .
Propopiskyvariantodpovědí(value labels)užmůžemevyužítdiakritickýchzna-mének(možnostpsátčeskysilzenastavitvmenuEdit – Options) .Doporučujeme,abytytopopiskybylypřiměřenékrátké(alevýstižné),neboťsezobrazujívevýstupníchtabulkáchajejasné,žekaždátabulkamápřitiskunaplošestránkyformátuA4jenomezený prostor . Jednotlivým value labels odpovídají příslušné hodnoty (values),vnašempříkladuto jsouhodnoty1,2a3 .Ochybějícíhodnotě(missing value)sezmiňujemeníže .
Vněkterýchpřípadechmajíotázkyvdotazníkupodobutzv .baterieotázek,cožilustrujeobr .2 .8 .
1. Řekněte prosím o každé z následujících skutečností, jak je ve Vašem životě důležitá:
Velmi důležitá
Dost důležitá
Ne příliš důležitá
Vůbec ne důležitá
NevíNeodpo-věděl(a)
a práce 1 2 3 4 −1 −2 Q1a
B Rodina 1 2 3 4 −1 −2 Q1b
C přátelé a známí 1 2 3 4 −1 −2 Q1c
D Volný čas 1 2 3 4 −1 −2 Q1d
E politika 1 2 3 4 −1 −2 Q1a
F Náboženství 1 2 3 4 −1 −2 Q1f
Obr. 2.8 Demonstrace baterie otázek v dotazníku jako sady (kategorizovaných) proměnných
V této tabulce je každý řádek proměnnou s variantami/oboremhodnot <1; 4>;zdejsmezvolilinázvyQ1aažQ1f(mohlobybýttakéQ1_1ažQ1_6)proto,abyna-povídaly,ževšech6proměnnýchtvoříjednuspolečnoubateriiotázek,žetedyměříněcospolečného .Zápornéhodnotyuodpovědí„neví“a„neodpověděl(a)“představujísvým způsobem chybějící údaje neboli chybějící hodnoty (missing values) –vždyckymusíme totiž předpokládat, že někteří respondenti na naše otázky neod-poví .Ichybějícíúdajejedobrékódovat,volbakódujelibovolná,kódvšaknesmímíthodnotu,kteroumůženabývatpříslušnáproměnná .Umissing valuesjenavícněkdyužitečnérozlišovat,kdyúdajchybíproto,žerespondentnaotázkuodmítlodpovědět,kdyproto,žesehonetýká(cožjepřípadvnašítabulce),popřípaděžechybějícíúdajvzniklopomenutímtazateleapod .50
50 Vněkterýchsituacíchmátotižsmyslanalyzovatitytochybějícíodpovědi,zvláštěkdyžsejichuněkterýchpoložekobjevímnoho:analýzanámumožnízjistit,jakýtyprespondentůodpověďodmítl,cožmůžebýtprointepretacivýsledkůdůležitáinformace .
62
KapItOla 2
2.2.2 Definice jednotlivých proměnných
Abychommohlimaticinaplnitdaty,musímeji,jakjsmenaznačilivýše,nejprvedefino-vat .DějesetakvokněVariable View,kteréjsmeukázalijižnaobr .2 .3 .Jdeotytoúkony:– Připsání technického jména proměnné, určení jejího místa v matici (sloupce/
sloupců) .– Definicecharakteruproměnnéjakočíselné(numeric)čitextové(string);textovou
proměnnoupočítačchápejakooznačeníaneprovádísnípočetníoperace,jakojesčítáníčinásobení .
– Připsáníširšího/podrobnějšíhooznačení proměnné(variable labels) .– Připsáníverbálníhooznačení jednotlivým hodnotám(kategorizované)proměnné
(value labels) .Tyzpřehledňujítištěnévýstupy,neboťpřiřazujíkejménůmproměn-nýchivysvětlujícípopis .Např .q1_2můžebýtjménoproměnnénebolivariable namea„důležitostrodinyvživotě“můžebýtvysvětlujícípopisekjménatétopro-měnnénebolivariable label .Jejívarianty„velmidůležitá“,„dostidůležitá“,„nepří-lišdůležitá“,„vůbecnedůležitá“a„neví“jsoupakvalue labelsdanéproměnné .
Pozor:Vpřípaděspojitýchproměnnýchnedávajívalue labelssmyslanepoužívámeje!
– Určenípočtudesetinnýchmíst(vpřípaděspojitýchproměnných) .– Definováníuživatelských chybějících hodnot(tzv .user missing values) .51Někdy
domissing value přeřazujeme některé hodnoty proměnných při jejich transfor-maci .Týkásetonapříkladvarianty„nevím“,kterásiceněkdymůžebýtsoučástíordinálníproměnné jakožto její středováhodnota (1= svládou jsemspokojen,2=nevím,3=svládoujsemnespokojen),častějšíjsoualepřípady,kdyjipoužívá-mejenproto,abychomnenutilirespondenta/respondentkuzaujímatpostoj,kterýnemá .Vdalšíanalýzesepakčastosoustřeďujeme jenna ty,kdopostojzaujaliavmoduluTransform – Recodepřiřadímeodpovědím„nevím“číslicioznačujícíchybějícíhodnotu(missing value) . Častojetozápornáhodnota .52
– RozumnéjeurčitukaždéproměnnévkolonceMeasureúrověňměření .Tatoinfor-macetotižuněkterýchstatistickýchoperacírozhodujeovolběpočítanýchstatistik .
NěkterésloupcevokněVariable view(vizobr .2 .9)můžemevyplnitpřímovepsánímpříslušnéhotextu,jinénámnabídnoupokliknutípředdefinovanévolby .PřímovyplňujemesloupceNameaLabel,vostatníchpokliknutívyskočírozbalovacíokno .
51 SPSS zná i systémové chybějící hodnoty (system missing value) .Ty se zobrazují v datovématicijakotečkyaznamenají,žeprodanouproměnnouadanýpřípadneníkdispozicižádnáhodnota(např .vdotazníkunenízaškrtnutažádnáodpověď) .
52 Ktomu,jaksevněkterýchkonkrétníchstatistickýchtechnikáchzacházísmissing value,seještěvrátíme .Většinou se s případy obsahujícímimissing value nepracuje (s výjimkou uvedenouvpozn .48) .
63
pRÁCE s hROMaDNÝMI DatY pŘED aNalÝZOU
Obr. 2.9 Okno pro popis proměnných
Klikneme-linasloupecValues,můžemevrozbalivšímseokněvepsatpopiskyje-jichhodnot(vizobr .2 .10) .DokolonkyValuevepíšemečíslicihodnoty,tabulátoremčipomocímyšipřejdemedokolonkyLabelavepíšemepopisek .Spodnítlačítkanámumožnítaktodefinovanýlabelpřidat(volbaAdd)avseznamulabelspakprovádětzměny(volbyChangečiRemove) .NakonecvšeodsouhlasímekliknutímnaOK .
Obr. 2.10 Okno pro popis variant znaků (Value Labels)
Podobněmůžeme definovat i uživatelské chybějící hodnoty (missing values), cožjsouhodnoty,kterénevcházejí(pokudsitovýslovněnepřejemeanezadámepříkazem)do analýzy . SPSS nám k tomu nabízí speciální okno, jehož ukázku uvádí obr . 2 .11 .
64
KapItOla 2
Zdejsmerozhodli,žeprochybějícíhodnotybudemerezervovatvýrazy−1,−2a−3 .Jistěpodleukázkypřijdetesaminato,jakédalšímožnosti, jakdefinovatmissing values,senabízejí .53
Obr. 2.11 Okno pro definování chybějících hodnot
2.2.3 Plnění matice dat
Datamůžemedostatdomaticerůznýmizpůsoby .Důležitéjsoupronászejména:− Plněnínámidefinovanématicenašimidaty .− Importdat ze souboru jiného typu (z textovéhoeditoru,databázeči tabulkové-hoprocesoru–spreadsheetu–,např .programu,jakojeExcel) .Můžeme ovšem také použít i dříve nebo někým jiným vytvořenou matici dat
(tzv . systémový soubor) .Nejčastějším případem je plnění námi definovanématicedatpřepisemúdajůzdotazníkůnebojinýchzáznamovýcharchů .
2.3 Práce se systémovými souboryExistující datové soubory otvíráme stejně jako jakékoliv soubory v jiných progra-mech .TedypospuštěníprogramuSPSSklikámepostupněnatlačítkaFile – Open – Data,votevřenémokněpaknajdemetosprávnémístonadisku(popř .naexternímdiskuneboflashdisku),kdemámesouboruložen(vizobr .2 .12) .
Máme-limaticinaplněnounašimidaty,snažímesetutomaticizachovatprodalšízpra-cování tím, že ji uložíme jako systémový soubor .SPSS takovýmsouborůmpři jejichuloženípřidávápříponu .sav–podlenítytosouborymůžeteidentifikovat(obr .2 .13) .
53 SPSSjevmožnostidefinovatmissing valuesnesmírněflexibilní,jinéstatistickébalíkyumožňujízpravidladefinovatpouzejedinouhodnotujakochybějící .
top related