kuti lipecz leiro peldatar 2012 jan 24

Upload: vivien-szucsanyi

Post on 18-Jul-2015

968 views

Category:

Documents


1 download

TRANSCRIPT

LTALNOS VLLALKOZSI FISKOLA

LER STATISZTIKAALAPSSZEFGGSEK S SZMTSI GYAKORLAT

BUDAPEST, 20121

Az elmleti sszefoglalkat rta: Lipcz Gyrgy A feladatokat sszelltotta: Kuti va

Szakmai lektor ???

ISBN: @ ltalnos Vllalkozsi Fiskola

2

TARTALOMTMUTAT A TANANYAG HASZNLATHOZ .............................................................. 6 E FEJEZET: ELMLETI SSZEFOGLALK ........................................................................ 8 E.1. Bevezets, alapfogalmak ................................................................................................ 8 E.1.1. Nhny fontosabb alapfogalom ............................................................................... 8 E.1.2. Az ismrvek mrhetsgi tulajdonsgai (Mrsi sklk s tulajdonsgaik)............ 9 E.1.3. A statisztikai adat fogalma. .................................................................................... 10 E.1.4. Az adatgyjts mdjai ........................................................................................... 10 E.1.5. Statisztikai tblk s grafikonok ............................................................................ 11 E.2. Viszonyszmok ............................................................................................................. 12 E.2.1. Megoszlsi viszonyszm........................................................................................ 12 E.2.2. Koordincis viszonyszm .................................................................................... 12 E.2.3. Intenzitsi viszonyszm. ........................................................................................ 12 E.2.4. Terleti sszehasonlt viszonyszmok. ................................................................ 12 E.2.5. Dinamikus (idbeli sszehasonlt) viszonyszmok ............................................. 12 E.3. A sokasg elemzse egy ismrv szerint: Egyedi s csoportostott adatok, helyzetmutatk, kzprtkek, szrds .............................................................................. 15 E.3.1. A sokasg csoportostsa ....................................................................................... 15 E.3.2. A csoportostott sokasg jellemzse. ..................................................................... 15 E.3.3. A gyakorisgi sorok brzolsa. A hisztogram ..................................................... 17 E.3.4. Kzprtkek s helyzetmutatk egyedi s csoportostott adatok esetn .............. 19 E.3.5. A szrds fogalma s mutati ............................................................................. 25 E.3.6. Az empirikus eloszlsok alakja............................................................................. 28 E.4. Indexszmts................................................................................................................ 29 E.4.1. Alapfogalmak, egyedi indexek .............................................................................. 29 E.4.2. Az rtkvltozs felbontsa kt sszetevre: az rvltozs s a volumenvltozs hatsra. Az (egyttes) rtk-, volumen- s rindex. ....................................................... 30 E.5. Ftlagok sszehasonltsa standardizls segtsgvel ............................................... 34 E.5.1. Bevezets ............................................................................................................... 34 E.5.2. Klnbsg-elemzs ................................................................................................ 35 E.5.3. Hnyados elemzs.................................................................................................. 37 E6. Asszocici .................................................................................................................... 39 E.6.1. Alapfogalmak ......................................................................................................... 39 E.6.2. Az asszocici elemzse kombincis tbla segtsgvel ..................................... 39 E.6.3. Az asszocici szorossgnak jellemzse .............................................................. 41 E.7. Vegyes kapcsolat .......................................................................................................... 43 E.7.1. Alapfogalmak ......................................................................................................... 43 3

E.7.2 A H-ngyzet mutat felptse ............................................................................... 43 E.8. Korrelci, regresszi ................................................................................................... 46 E.8.1. A korrelci fogalma ............................................................................................. 46 E.8.2. A kovariancia (egyttingadozs) s a lineris korrelcis egytthat .................. 46 E.8.3. A regresszis fggvny meghatrozsa ................................................................. 47 E.8.4. Az illeszkeds jsga, ill. a kapcsolat szorossga. ............................................... 49 E.9. Idsor ............................................................................................................................ 51 E.9.1. Alapfogalmak ......................................................................................................... 51 E.9.2. A trend meghatrozsa.......................................................................................... 51 E.9.3 A szezonok hatsa .................................................................................................. 52 E.9.4 A vletlen hats elklntse ............................................................................... 54 E.9.5. Elrejelzs (extrapolci) ...................................................................................... 54 B FEJEZET: A TPUSFELADATOK MEGOLDSNAK RSZLETES BEMUTATSA 55 B.1.Viszonyszmok .............................................................................................................. 55 B.1.1. Dinamikus viszonyszmok .................................................................................... 55 B.1.2. Megoszlsi viszonyszmok ................................................................................... 56 B.1.3. Intenzitsi viszonyszmok ..................................................................................... 57 B.2. Empirikus eloszlsok elemzse .................................................................................... 58 B.2.1.Abszolt s relatv gyakorisg, kumullt gyakorisgok ......................................... 58 B.2.2. Abszolt s relatv rtksszeg, kumullt rtksszeg mutatk............................ 59 B.2.3. tlagszmts......................................................................................................... 60 B.2.4. A szrds mutatinak kiszmtsa ....................................................................... 64 B.2.5. Az empirikus eloszls srsgdiagramja: a hisztogram ........................................ 66 B.2.6. Helyzeti kzprtkek ........................................................................................... 68 B.2.7. A koncentrci elemzse ....................................................................................... 72 B.2.8. Az empirikus eloszls aszimmetrijnak kiszmtsa ........................................... 73 B.3. Indexek ......................................................................................................................... 74 B.4. Standardizls ............................................................................................................... 86 B.4.1. Standardizls a ftlagok kztti eltrs alapjn ................................................. 86 B.4.2. Standardizls indexek segtsgvel ...................................................................... 91 B.5. Asszocicis kapcsolat ................................................................................................. 98 B.6. Vegyes kapcsolat ........................................................................................................ 100 B.7. Korrelcis kapcsolat ................................................................................................. 103 B.8. Idsorok elemzse ...................................................................................................... 108 B.8.1. Trendszmts ...................................................................................................... 108 B.8.2. Szezonlis eltrsek meghatrozsa .................................................................... 109 B.8.3. Szezonindexek kiszmtsa ................................................................................. 111 4

G. FEJEZET: TMAKRNKNT CSOPORTOSTOTT GYAKORL FELADATOK. 113 G.1.Viszonyszmok ........................................................................................................... 113 G.2. Empirikus eloszlsok elemzse .................................................................................. 116 G.3. Indexek ....................................................................................................................... 123 G.4. Standardizls ............................................................................................................. 128 G.5. Asszocicis kapcsolat ............................................................................................... 134 G.6. Vegyes kapcsolat ........................................................................................................ 137 G.7. Korrelcis kapcsolat ................................................................................................. 139 G.8. Idsorok elemzse ...................................................................................................... 143 V. FEJEZET: VEGYES GYAKORL FELADATOK ......................................................... 146 V.1. Feladatok .................................................................................................................... 146 V.2. Eredmnyek ................................................................................................................ 171 FELHASZNLT IRODALOM ............................................................................................. 182 KPLETGYJTEMNY ...................................................................................................... 183

5

Kuti va Lipcz Gyrgy: Ler statisztika. Hasznlati tmutat

TMUTAT A TANANYAG HASZNLATHOZEz a ktet nem szokvnyos tanknyv, de nem is egyszeren feladatgyjtemny. Megtallhatk ugyan benne a szmtsi eljrsokat lpsrl lpsre ismertet bemutat feladatok (B fejezet) s a tmakrnknt csoportostott gyakorl pldk (G fejezet), de kiegszlnek a szmtsok elmleti htternek rvid sszefoglalsval (E fejezet). Ezeknek a klnbz, de egymssal szorosan sszetartoz elemeknek az egy ktetbe rendezsvel az a clunk, hogy segtsk a hallgatkat (ezen bell is klnsen a levelez tagozatosokat) a ler statisztikai tananyag elsajttsban, a zrthelyi dolgozatokra s a vizsgra val felkszlsben. Fontosnak tartjuk azonban hangslyozni, hogy a pldatr nem helyettesti az rkon elhangz tanri magyarzatokat s a tanknyvben (Kerkgyrtn et al., 2009) tallhat tbboldal trgyalst, rszletesebb levezetseket. A hallgatknak teht azt javasoljuk, hogy az raltogats s a tanknyv tanulmnyozsa mellett, ne pedig azok helyett ljenek a ktetben szerepl pldk knlta gyakorlsi lehetsggel. Szintn szeretnnk mr bevezetben eloszlatni azt az illzit, hogy a megoldott pldk gyors tnzsvel sikeresen fel lehetne kszlni a szmonkrsekre. A statisztikai elemzs mdszereinek elsajttsa nem egyszeri nekirugaszkodst, hanem folyamatos munkt kvn; nem szmtsi eljrsok lpseinek betanulst, hanem a vizsgland krdsek tudatos vgiggondolst ignyli. A kiindulsi pont mindig az kell legyen, hogy mi az elemzs clja, s milyen krben, milyen adatokra, informcikra tmaszkodva tudjuk elvgezni a szmtsokat. A hallgatk gyakran kvetik el azt a hibt, hogy nem a feladatban megfogalmazott tartalmi krdsekre koncentrlnak, hanem formai jegyekre alapozva prbljk azonostani a pldatpust s a hozz tartoz megoldsi algoritmust. Ez nemcsak azrt kros, mert az gy szlet megoldsok igen srn bizonyulnak tvesnek, hanem elssorban azrt, mert a gyakorlati statisztikai munkban nem ilyen iskols megkzeltsre van szksg (Hrchern, 2007, 207. old.). Mrpedig a fiskolai tanulmnyok elsdleges clja mgiscsak azoknak a kszsgeknek az elsajttsa, amelyeknek a jvbeni munkahelyeken hasznt lehet majd venni az zleti dntsek megalapozsban (Rappai, 2001) s a trsadalmi krdsek vizsglatban (Babbie, 1998). Az elemzsi kszsgek kialaktst a statisztikai feladatok csak akkor tudjk eredmnyesen szolglni, ha azokat a hallgatk nem megoldsra vr pldaknt kezelik, hanem olyan empirikus informcik sszessgeknt, amelyekre alapozva kzelebb juthatnak egy jelensg megrtshez, specilis jellemzinek megragadshoz. Ennek megfelelen az els s legfontosabb lps minden statisztikai feladat esetben annak tisztzsa, hogy milyen sokasg vizsglatrl van sz; milyen egysgek (szemlyek, trgyak, szervezetek, esemnyek, trtnsek) alkotjk a sokasgot; ezeknek az egysgeknek milyen jellemzit ismerjk (mennyisgi, minsgi, idbeli, terleti ismrvek); mit tudunk a sokasg nagysgrl s klnbz ismrvek szerinti sszettelrl (abszolt vagy relatv gyakorisgok); mi az, amit ki akarunk derteni; milyen statisztikai mutatk alkalmasak az adott krds vizsglatra, s ezek kzl a rendelkezsre ll adatok alapjn melyeket lehet kiszmtani. Ezeknek a krdseknek a megvlaszolshoz a feladat teljes szvegnek alapos elolvassa s a kpletgyjtemny rt hasznlata mellett az nll erfeszts is nlklzhetetlen. Azt tancsoljuk teht a pldatr felhasznlinak, hogy mr a bemutat feladatok ttanulmnyozsa sorn is figyeljenek az egyes szmtsi lpsek mgtt rejl tnyleges 6

Kuti va Lipcz Gyrgy: Ler statisztika. Hasznlati tmutat

tartalomra. Ebben a rvid elmleti sszefoglalk nagy segtsgkre lesznek. Ezt kveten clszer a megismert mdszerek alkalmazst a tmakrnknt csoportostott feladatok megoldsa sorn begyakorolni. Vgl, a zrthelyi vagy a vizsga eltti utols egy-kt napot felttlenl meg kell hagyni arra, hogy akkor mr egyedl a kpletgyjtemnyre tmaszkodva azokra a feladatokra koncentrljanak, amelyek a pldatr utols rszben (V fejezet) minden csoportosts nlkl szerepelnek. Kizrlag ezekkel a vegyes feladatokkal szembeslve kerlnek ugyanis olyan helyzetbe, amelyben csakgy, mint a vizsgaszituciban illetve a gyakorlati munkban maguknak kell eligazodniuk. Az nll eligazods kpessgnek megszerzse nemcsak azt garantlja, hogy a szmonkrsek sorn helyesen azonostsk a pldatpust s a megadott vltozkat, jl vlasszk meg a kpleteket, s gy j dolgozatokat rjanak, hanem annak is fontos felttele, hogy a megismert statisztikai mdszereket a ksbbiekben magabiztosan s kreatvan alkalmazzk. szintn remljk, hogy a pldatr segteni fogja s hatkonyabb teszi a hallgati munkt. Minden megjegyzst, kritikt szvesen fogadunk, s igyekezni fogunk az sszelltott anyag tkletestse rdekben felhasznlni.

7

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

E FEJEZET: ELMLETI SSZEFOGLALKE.1. Bevezets, alapfogalmakA statisztika a tmegjelensgek szmszer jellemzsvel foglalkozik, ezrt a statisztika alapfogalma a sokasg, (populci, halmaz, sszessg). Kevs adattal is lehet statisztikai elemzst vgezni, de a statisztika mint nll tudomny jellemzen nagy tmeg adattal dolgozik. Feladata az, hogy egy tmegjelensg, egy nehezen ttekinthet adattmeg nagysgt, vltozst, sszettelt, bels sszefggseit, egyb fontos jellemzit a matematika eszkzeivel meghatrozza, lerja, ttekinthetv, szemlletess tegye. A statisztika mint tudomnyg az alkalmazott matematika krbe tartozik. A statisztika sz jelenti az alkalmazhat matematikai sszefggsek, mdszerek sszessgt, magt az elemz tevkenysget, s annak eredmnyt is. A statisztikai tevkenysgbe a szkebb rtelemben vett statisztikai elemzsen tl, szlesebb rtelemben beletartozik az adatok sszegyjtse, trolsa, klnbz ignyek szerinti csoportostsa s hozzfrhetv ttele is. A ler statisztika a statisztikai elemzs egyszerbb mdjait tartalmazza, a sokasg egszt figyelembe vve. A kvetkeztet statisztika (ms nven matematikai vagy induktv statisztika) valsznsg-szmtsi alapon a mintbl (a sokasg alkalmasan kivlasztott rszsokasgbl) kvetkeztet a sokasg egszre (Hunyadi, 2001).

E.1.1. Nhny fontosabb alapfogalomA statisztikai sokasg A (statisztikai) sokasg az elemzs trgyt kpez sszessg. a) A trsadalom- s gazdasg-statisztikban a sokasg jellemzen a megfigyels trgyt kpez elemek (esemnyek, jelensgek, szemlyek, szervezetek sszessgt jelenti, mint pl. egy fiskola beiratkozott hallgatinak sszessge vagy egy adott napon bekvetkezett balesetek sszessge. De statisztikai sokasgrl beszlnk akkor is, ha ismtld jelensgekre vonatkoz adatok, megismtelhet ksrletek eredmnyeinek sszessgrl van sz. Pl. a dobkocka fels lapjn szerepl szmrtkek 100 dobs sorn. b) A sokasg nem mindig bonthat elklnlt rszekre, egyedekre, csak nknyesen megllaptott egysgekre, ilyen pl. a srfogyaszts, adott idszakban lehullott csapadk mennyisge. c) Sokszor csak a mrt adatok sszessge jelenti a sokasgot, mint amikor pl. a Duna vzllsrl van sz. Az ismrv Az ismrvek (ms nven statisztikai vltozk) a sokasg egysgeinek (csoportjainak, rszsokasgainak) jellemzi, azok a kritriumok, amelyek szerint a sokasg egysgei, egyedei jellemezhetk, csoportosthatk, sszehasonlthatk. A mennyisgi ismrv (mrses jellemz, kvantitatv vltoz) a sokasg egyedeinek (vagy egyes csoportjainak) szmszer jellemzje. Az ismrv (a vltoz) ltal felvehet rtkek az ismrvrtkek, vagy rviden: rtkek. Pl. ha a vizsglat trgyt kpez sokasg egy fiskola hallgatinak sszessge, akkor mennyisgi ismrv a hallgatk letkora, a tanulmnyi tlageredmny, a testmagassg, 8

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

stb. A hallgatk letkora mint ismrv annyi ismrvrtket vesz fel, ahny hallgat van. (Ezek kztt persze lehetnek azonosak is) A minsgi ismrvek a nem-szmszer jellemzk (minstses jellemzk), a felvehet rtkek (kimenetelek) az ismrv-vltozatok. Pl. A hallgatk fontos jellemzje, hogy milyen szakra jrnak, ekkor az ismrv a szak, az ismrv vltozatok pedig: pnzgyi szak, szervez szak, stb. Egy msik ismrv a nem, ennek kt vltozata van: fi vagy lny.

Egy msik kiemelend ismrv-pros az idbeli s a trbeli (terleti, illetve fldrajzi) ismrvek. Az olyan ismrvek, akr mennyisgi, akr minsgi ismrvrl van sz amelyeknek csak kt lehetsges rtke, illetve vltozata van, az alternatv ismrvek. Pl. Ilyen a fentebb emltett nem mint ismrv, amelynek kt vltozata a frfi s a n; vagy a gazdasgi aktivits, amelynek kt vltozata az aktv s az inaktv. Diszkrt s folytonos ismrvek. A mennyisgi ismrvet diszkrt ismrvnek nevezzk, ha csak vges szm klnbz rtket vehet fl, mint az indexben a vizsgajegyek, vagy egy raktrban az dts vegek trfogata, amely lehet 0,2 vagy 0,33, vagy 1, vagy 1,5 literes Folytonos ismrv a Duna vzszintje vagy a srfogyaszts ves nagysga; ezek az ismrvek egy adott intervallumon bell, a kerektsektl eltekintve brmilyen vals rtket felvehetnek. ll, mozg sokasg. A statisztikai elemzs szempontjbl fontos megklnbztets hogy egy adott idpontra vonatkoz valamilyen llapotot, vagy egy idtartam alatti vltozst akarunk jellemezni, megragadni. Sokszor a sokasg is ilyen megklnbztets szerint adhat meg, pl. egy megadott idpontban (napon) a Magyarorszgon tartzkod klfldi turistk sszessge ll sokasg, egy adott hnap sorn a hatr-tlpsek szma (pontosabban: a be- s kilpsek egyenlege) mozg sokasg. A mozg sokasg mindig esemnyekbl, trtnsekbl ll. A kzgazdasgtanban is hasznlatos ez a megklnbztets, ott stock s flow mennyisgekrl (llomny, kszlet jelleg, ill. folyamat, ramls jelleg mennyisgekrl) szoks beszlni. Megjegyzend, hogy nem minden sokasg, nem minden kzgazdasgi mennyisg sorolhat be a kt kategria valamelyikbe. A statisztikai osztlyozs, csoportosts A megklnbztet ismrvek segtsgvel vgezhet a sokasg osztlyozsa, illetve a csoportostsa. Magnak az alapsokasgnak a pontos megadsa egy kzs ismrv segtsgvel lehetsges. Ennek tovbbi rszleteivel 3. fejezetben s az azt kvet fejezetekben foglalkozunk.

E.1.2. Az ismrvek mrhetsgi tulajdonsgai (Mrsi sklk s tulajdonsgaik)Az ismrvek vltozatai, rtkei mrs ill. megfigyels rvn llapthatk meg. Gyakran mrsnek nevezik a minsgi ismrvek megfigyelst is, ami mgtt az a gondolatmenet ll, hogy a mrs nem ms, mint rtkek, szmok, ismrv-vltozatok hozzrendelse egy adott 9

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

ismrvhez. Ez a hozzrendels lehet nknyes, amikor a minsgi ismrvvltozatokat a rvidsg s egyszersg kedvrt szmkddal ltjuk el, pl. a fiknak 1-es, a lnyoknak 2-es kdot adva; s lehet (a mrtkegysg megvlasztstl eltekintve) objektve egyrtelmen meghatrozott, mint pl. a testmagassg ismrvnl. A kt szls eset kztt a mrhetsgnek tbb fokozata is van, ezt a mrsi sklk (mrck) tpusainak is nevezik. Nominlis (megnevezsi) sklrl van sz, ha a mrce szmai csak azonostsra szolglnak. Ekkor nem is igazi szmok, valjban csak nevek, illetve kdok. Csak annyiban hasonlthatk ssze, hogy azonosak-e vagy sem. Pl. a fiskolai szakokat szmokkal jellve kt hallgat azonos szakra jr, ha szakot jelz szmuk azonos, s nem ugyanarra a szakra jrnak, ha jelzszmuk nem azonos. Ms mveletet a kdszmokkal nem lehet vgezni, nincs rtelme pl. a nagyobb relcinak vagy a kt szm klnbsgnek, hnyadosnak, stb. Az ordinlis (sorrendi) skln sorszmok szerepelnek. Egy ilyen ismrv alapjn, amelynek ismrv-rtkei sorszmok, a sokasg egyedei sorba rendezhetk, pl. egy sportversenyen elrt helyezsek. Tovbbra sincs rtelme azonban kt szm klnbsgnek s hnyadosnak. Olyan ismrv-vltozatok is betltik ezt a szerepet, amelyek rangsort fejeznek ki, pl. egy kzvlemny-kutatsban egy megllaptssal val egyetrts mrtkre: teljesen egyetrt, vagy csak rszben, vagy egyltaln nem. Intervallum-skla (klnbsgi skla). Ezen olyan szmok szerepelnek, amelyek kztt a klnbsg rtelmezhet, de kt szm hnyadosa nem. Ilyen skla a hmrskleti skla s a naptri idszmts. A skla 0-pontja s mrtkegysge szabadon megvlaszthat. Ha 10 Celsius fokrl 15 fokra melegedett az id, akkor mondhatjuk, hogy 5 fokot melegedett, de nincs rtelme azt mondani, hogy msflszeresre ntt a hmrsklet. Ugyanazt a hmrskletet ms mrtkegysgben s ms 0 ponthoz viszonytva is kifejezhetjk. Hasonl a helyzet az idszmtssal, a klnbz naptri rendszerekkel is. Arnyskln szerepl szmok esetn mr van rtelme kt szm hnyadosnak is. Ilyen a kereset, a ltszm, a testsly, stb. A skla 0-pontja nem vlaszthat meg szabadon. A 0 rtk az adott tulajdonsg hinyt jelenti. A mrtkegysg megvlaszthat, de brmely kt mrszm arnya fggetlen a mrtkegysgtl. A minsgi ismrvek nominlis skln mrhetk. A mennyisgi ismrvek klnbsgi vagy arny-skln mrhetk, ill. fordtva: a klnbsgi vagy arny-skln (sszefoglalan: metrikus skln) mrhet ismrvek a mennyisgi ismrvek.

E.1.3. A statisztikai adat fogalma.A matematika absztrakt objektumokkal, absztrakt szmokkal dolgozik. A statisztika mindig konkrt, kzzelfoghat jellemzkkel foglalkozik. A statisztikban hasznlt konkrt szmok, jellemzk az adatok. Vgs soron az ismrv-vltozatokat illetve az ismrvrtkeket nevezzk adatnak. Az alapadatokbl tovbbi gynevezett szrmaztatott adatok kpezhetk, ezek legfontosabb fajti a statisztikai mutatszmok.

E.1.4. Az adatgyjts mdjaiA megfigyels (mrs) kre szerint az adatfelvtel (Kish, 1989) lehet: o Teljes kr 10

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

o Rszleges (mintavtelen alapul). Az adatfelvtel mdjai: o Kikrdezs o Szemlyes megkrdezs, interj (pldul: npszmlls) o Postai vagy internetes megkrdezs (pldul: munkagyi statisztika) o Megfigyels (pldul: vasti forgalomszmlls) o Ksrlet (pldul: ksrleti llatok reakciinak tudomnyos mrse) Az adatfelvtel clja szerint o Elsdleges (primer) adatgyjts statisztikai clra o Msodlagos (szekunder) adatgyjts: nem statisztikai clbl keletkezett informcik sszegyjtse

E.1.5. Statisztikai tblk s grafikonokA statisztikai tblk tpusai o Egyszer tbla: csoportostst nem tartalmaz Pldul: Magyarorszg npessge 2000 s 2010 kztt venknt (ezer f) o Csoportost tbla: egy ismrv szerinti csoportostst tartalmaz Pldul: A budapesti mozik szma befogadkpessg szerint, 2004. janur 1. o Kombincis tbla: egyszerre tbb ismrv szerint csoportost Pldul: Egy fiskola hallgatinak ltszma vfolyamok s szakok szerint. A grafikus brzols A grafikus brzols clja az adatok idbeli, vagy trbeli alakulsnak, egymshoz viszonytott nagysgrendjnek, arnyainak rzkeltetse, szemlltetse. A grafikus brzols trtnhet o vonalak, o terlet, o trbeli alakzat s o kpszimblumok segtsgvel. Fontosabb bra tpusok, (ezekkel a kvetkez fejezetekben is gyakran tallkozunk majd): o Vonaldiagram o Botdiagram o Poligon o Oszlop- s svdiagram o Hisztogram o Terletdiagram o Krdiagram o Rddiagram, mrtani testek o Piktogram o Kartogram A fentiek kzl az egyik legfontosabbal, a hisztogrammal elmleti jelentsge miatt rszletesen foglalkozni fogunk.

11

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

E.2. ViszonyszmokA viszonyszm kt egymssal tartalmi (logikai) kapcsolatban lv adat hnyadosa.

A viszonyszmok fontosabb tpusai: a megoszlsi s koordincis, az intenzitsi, valamint a dinamikus viszonyszmok.

E.2.1. Megoszlsi viszonyszm.A sokasg egy rsznek a sokasg egszhez viszonytott arnyt fejezi ki. Pldul: A csoporton bell a nk arnya 60%. Magyarorszgon 2008-ban a kiadott knyvek 18,6%-a volt tanknyv.

E.2.2. Koordincis viszonyszmKt rsz-sokasg arnyt fejezi ki, pl. a nk msflszer tbben vannak, mint a frfiak.

E.2.3. Intenzitsi viszonyszm.Klnbz fajta, rendszerint klnbz mrtkegysg adatbl szmtott viszonyszm, azt fejezi ki, hogy az egyik mennyisgbl mennyi jut a msik egy egysgre. Pldul: o az 1 lakosra jut napi tejfogyaszts 0,5 liter/f/nap; o az egy fre jut napi termels egy cgnl, ms szval a termelkenysg 5db/f/nap; o 2008-ban haznkban a 100 lakosra jut mozi ltogatsok szma 99 db/100f/v volt. Nyers s tiszttott viszonyszm. Nyers viszonyszm: az sszehasonltsban szerepl mennyisget a teljes sokasghoz viszonytjuk, (pl. 1 csaldra jut gyerekszm). Tiszttott viszonyszm: az sszehasonltsban szerepl mennyisget a sokasg azon rszhez viszonytjuk, amellyel szorosabb logikai kapcsolatban van (ha pl. csak a gyerekes csaldokat vesszk figyelembe.)

E.2.4. Terleti sszehasonlt viszonyszmok.Klnbz fldrajzi terletek azonos ismrv (vagy azonos tpus mutatszm) szerinti sszehasonltsa. Pl. o Magyarorszg terlete 1,18-szorosa Csehorszg terletnek. (Mskppen: 18%-kal nagyobb) o 2007-ben az 1000 lakosra jut internet felhasznlk szma Hollandiban 62%-kal nagyobb volt, mint Magyarorszgon.

E.2.5. Dinamikus (idbeli sszehasonlt) viszonyszmokA dinamikus viszonyszm, ms nven index kt idpont vagy idszak hasonl adatnak hnyadosa. Mskppen fogalmazva, egy szorzszmrl van sz, amely megmutatja, hogy a trgyidszak adata hnyszorosa a bzisidszak adatnak. Pldul: Magyarorszgon a kiadott knyvek szma 2008-ban tbb mint msflszer annyi volt, mint 2000-ben. (Az index rtke kt tizedes pontossggal: 1,61. A knyvek szma teht az adott idszakban 61%-kal ntt.)

12

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

Az idsor Az egymst kvet idpontok vagy idszakok adatai idsort alkotnak. Az idpontokra vonatkoz adatsor az llapot-idsor, az idszakokra vonatkoz adatsor a tartam-idsor. Az idsorok elemzsnek egyszer, de nagyon hasznos s a leggyakrabban alkalmazott mdja a viszonyszmok kpzse. A viszonytsi alaptl fggen beszlnk bzis- s lncviszonyszmokrl. (Az idsorok magasabb szint elemzsre egy nll fejezetben visszatrnk.) Bzis- s lncindexek Bzisviszonyszm: az idsor rtkeit egy rgztett idpont vagy idszak (a bzis) rtkhez viszonytjuk. Pl. Egy orszg lakosainak szma 2008-ban s 2009-ben viszonytva a 2000-es lakossgszmhoz.

Lncviszonyszm: egy adott idszakra vonatkoz rtket a megelz idszakot jellemz rtkkel osztjuk (pl. a GDP adott vi nominlis rtke viszonytva az elz vi GDP-hez.)

PLDA: Egy fiskola beiratkozott hallgatinak szma 2001-ben s az azt kvet vekben a kvetkezkppen alakult: 2000-ben 800 f; 2001-ben 1200 f; 2002-ben 1500 f; 2003-ban 1040 f Tblzatosan az alapadatok valamint az ezekbl szmtott lnc- s bzisviszonyszmok:v 2000 2001 2002 2003 Ltszm (F) 800 1200 1500 1040 Elz v = 1 (Lncindexek) 1,5 1,25 0,6933 2001 = 1 (Bzisindexek) 1 1,5 1,875 1,3

A viszonyszmokat, indexeket szzalkban is kifejezhetjk, akkor tblzatunk gy vltozik:v 2000 2001 2002 2003 Ltszm (F) 800 1200 1500 1040 Elz v = 100 % (Lncindexek) 150 % 125 % 69,33 % 2001 = 100 % (Bzisindexek) 100 % 150 % 187,5 % 130 %

A tblzatbeli adatok a kvetkezkppen rtelmezhetk, pl. a 2002-es vre: a beiratkozott hallgatk szma 2002-ben 1500 f volt, 25%-kal tbb, mint az elz vben. 2002-ben a ltszm a 2000-esnek 187,5 %-a volt, azaz: kt v alatt 1,875-szrsre ntt vagy: 87,5 %-kal emelkedett. 13

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

2003-ra a ltszm valamivel tbb, mint 30%-kal cskkent (az elz vinek kzel 70%-ra). A bzis- s lncviszonyszmok sszefggse Knnyen belthat az albbi kt fontos sszefggs: 1. Brmely bzisviszonyszm felrhat egymst kvet lncviszonyszmok szorzataknt. Pl. ha y0 a bzis, akkor a bzisv utni 3-ik vben b3 lesz a bzis viszonyszm, s erre fennll: y y y y b3 = 3 = 1 2 3 = l1 l 2 l3 y 0 y0 y1 y 2 2. Az i-edik idszaki lncviszonyszm felrhat kt bzisviszonyszm (az i-edik s a megelz idszaki bzisviszonyszm) hnyadosaknt. Pl. a 3-ik vben, ha y0 a bzisv adata: y3 y y b l3 = 3 = 0 = 3 y2 y2 b2 y0 tlagos nvekedsi rta (tlagos lncindex): A lncindexek mrtani tlaga az tlagos nvekedsi rta: l = n l1 l2 ... ln Ha a nulladik s az n-edik idszak kztti lncindexeket minden idszakra az tlagos nvekedsi rtval helyettestennk, akkor az n-edik bzisindex, a bn ugyanaz maradna. A bzis s lncviszonyszmok sszefggse alapjn az tlagos nvekeds gy is rhat:l = n bn

PLDA. A fenti plda szmaival l = 3 l1 l 2 l3 = n 1,5 1,25 0,6933 = 1,0914 azaz: 2000 s 2003 kztt tlagosan vi 9,1 %-kal ntt a hallgatk szma. Azt is mondhatjuk, ha minden vben 9,1%-kal ntt volna a ltszm, akkor is 1040 fre ntt volna 2003-ra a hallgatk szma.

14

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

E.3. A sokasg elemzse egy ismrv szerint: Egyedi s csoportostott adatok, helyzetmutatk, kzprtkek, szrdsE.3.1. A sokasg csoportostsaA csoportosts a sokasg valamely ismrv szerinti tagolsa. A csoportosts kzenfekv kvetelmnye, hogy tfeds mentesnek s teljesnek kell lennie. Azaz: minden adatnak (a sokasg minden egysgnek, egyednek) pontosan egy csoportba kell tartoznia. A csoportost ismrv lehet Minsgi ismrv: Pl. a hallgatk csoportostsa szakok szerint, a lakossg csoportostsa teleplstpus szerint. Terleti ismrv: pl. a lakossg csoportostsa aszerint, hogy melyik megyben van az lland lakhelyk Idbeli ismrv: pl. szletsi v, letkor, stb. Mennyisgi ismrv. o Az egyszerbb eset, amikor diszkrt ismrvrtkekrl van sz: pl. csaldok csoportostsa gyerekszm szerint, a hallgatk csoportostsa a statisztika vizsgajegyk szerint, ami lehet 1, 2, 5. o folytonos rtkek esetn az rtk szerint sorba rendezett sokasg intervallumokba, osztlykzkbe sorolhat. Pl. egy cg alkalmazottai kereseti intervallumok szerint csoportosthatk. Ehhez kapcsoldik az empirikus eloszls fogalma amit az albbiakban rszletesen krljrunk hogyan oszlik el a sokasg az egyes csoportok kztt. Az albbiakban elszr egyetlen ismrv szerinti csoportostssal foglalkozunk. A tbb ismrv szerinti elemzsrl az ismrvek kztti sztochasztikus kapcsolatok fogalomkrn bell a 6. s az azt kvet fejezetekben lesz sz.

E.3.2. A csoportostott sokasg jellemzse.A csoportostott sokasgrl az els fontos informci, hogy az egyes csoportokban hny egyed, hny adat van. Ez a gyakorisg. Abszolt gyakorisg, relatv gyakorisg. o A gyakorisg (fi) azt adja meg, hogy az i-edik csoportba a sokasgnak hny egysge tartozik. o A relatv gyakorisg (gi) azt adja meg, hogy az i-edik csoportba a sokasgnak hnyad rsze (hny szzalka) tartozik. f f g i = m i = i ahol gi az i-edik csoport relatv gyakorisga, m a csoportok n fii =1

szma, n a sokasg elemszma. Kumullt gyakorisgok. A kumulls halmozott (gngyltett) sszeadst jelent. 15

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

o Kumullt gyakorisg: az els k csoportba a sokasgnak hny egysge tartozik.fi '= fii =1 k

o Kumullt relatv gyakorisg: az els k csoportba a sokasgnak hnyad rsze tartozik.

g k ' = gii =1

k

Ugyanez a kumullt abszolt gyakorisgokbl is szmthat: f f gk '= m i = i n fii =1

Megklnbztethet felfel s lefel kumullt gyakorisg. Ha magasabb i rtkhez magasabb ismrvrtkek tartoznak (pl. magasabb sorszm osztlykzbe magasabb kereset dolgozk tartoznak), akkor: o a felfel kumullt gyakorisgok ( f k ' ) s relatv gyakorisgok ( g k ' ) azt mutatjk, hogy az els k osztlykzben hny adat, illetve az adatok hnyad rsze tallhat o a lefel kumullt gyakorisgok ( f k" s g k" ) azt mutatjk, hogy a k-adik s az azt kvet osztlykzkben hny adat, illetve az adatok hnyad rsze tallhat. rtksszeg. Fontos szmtott adat az rtksszeg, az egy csoportban szerepl rtkek sszege. Jele: si . Az rtksszeg szmtsa: s i = f i x i Relatv rtksszeg: Egy rtksszegnek a teljes rtksszegen belli rszarnya: f x zi = m i i f i xii =1

Mind az abszolt, mind a relatv rtksszegekbl kpezhetk kumullt sorok.

Statisztikai sorok. A statisztikai adatok felsorolsa az ismrvek megjellsvel a statisztikai sor. Ezeket clszeren tblzatos formban szoks megadni. Pl. A gyakorisgi adatok felsorolsa a csoportok megnevezsvel a gyakorisgi sor. Hasonlan beszlnk relatv gyakorisgi sorrl vagy kumullt relatv gyakorisgi sorrl, s ugyangy relatv rtksszeg sorrl, stb.

PLDA. Egy raktrban az albbi tblzat szerint 200 doboz gymlcsl van, ngy fle rtartalommal. (A trfogat deciliterben)rtkek Trfogat (dl) xi Gyakorisg fi 110 Relatv gyakorisg gi (%) 55 Kumullt gyakorisg f110 160 185 200

Kumullt rel.gyakorisg g (%)55,0 80,0 92,5 100,0

2 3,3 10 20sszesen

5025 15 200

2512,5 7,5

100

-

-

16

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

rtelmezsek a 3. sorra: 10 dl-es gymlcslbl 25 doboz van, ez az sszes doboz 12,5 %-a. A legfeljebb 10 deciliteres dobozok szma 185, ez az sszes doboz 92,5%-a.rtkek Trfogat (dl) xi Gyakorisg fi 110 rtksszeg si220 165 250 300

Relatv rtksszeg zi (%)23,5 17,6 26,7 32,1

Kumullt rtksszeg s220 385 635 935

Kumullt rel.rt.sszeg z (%)23,5 41,2 67,9 100,0

2 3,3 10 20sszesen

5025 15 200

935

100

-

-

rtelmezsek a 3. sorra: A 10 dl-es dobozokban sszesen 250 dl gymlcsl van, ez az sszes gymlcsl-trfogat 26,7 %-a. A legfeljebb 10 dl-es dobozokban sszesen 550 dl gymlcsl van, ez az sszes gymlcsl-trfogat 67,9 %-a.

E.3.3. A gyakorisgi sorok brzolsa. A hisztograma) Az abszolt gyakorisgok brzolsra egyszer alapesetekben az oszlopdiagram szolgl.

A hallgatk szma az egyes szakokon egy fiskoln (F)120 100 100 80 60 40 20 0 Pnzgy szak Kereskedelmi szak Szociolgia szak Nemzetkzi szak Menedzser szak 50 90 80 80

17

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

b) A relatv gyakorisgok brzolsra jl hasznlhat a krdiagram

A hallgatk ltszmarnya az egyes szakokon (F)Menedzser szak 20%

Pnzgy szak 22%

Nemzetkzi szak 25%

Kereskedelmi szak 20%

Szociolgia szak 13%

c) Osztlykzs gyakorisgi sor ill. az adatok megoszlsnak legalkalmasabb brzolsi mdja a hisztogram. Lnyege, hogy az oszlopok terlete arnyos a (relatv vagy abszolt) gyakorisggal, teht nem az oszlopok magassga. Ilyen mdon egy oszlop magassga a tglalap terletnek s alapjnak hnyadosa lesz. A tglalap terlete nem ms, mint az (abszolt vagy relatv) gyakorisg, fi, illetve gi. Tglalap alapja az osztlykz szlessge hi. gy az oszlopmagassg az egysgnyi osztlykzre jut gyakorisg lesz, azaz: a srsg. Azt adja meg, milyen srn helyezkednek el az adatok az adott osztlykzben: vagy Ennek klnsen akkor van jelentsge, ha az osztlykzk nem egyforma szlesek.

18

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

PLDA: Hallgatk pontszm-intervallumok szerinti eloszlsa:Osztlykz rtkhatrok Gyakorisg szlessge Srsg (Osztlykzk) fi hi fi / hi 0 30 30 30 1 30 50 60 20 3 50 60 80 10 8 60 80 120 20 6 110 80 100 20 5,5 sszesen 400

A hallgatk eloszlsa pontszm szerint Hisztogram9 8 8 7 6 6 5 4 3 3 2 1 1 0 0 - 30 30 - 50 50 - 60 60 - 80 80 - 100 5,5

A legnagyobb gyakorisg osztlykz a negyedik, a legsrbb viszont a harmadik. A nyitott osztlykz kezelse. Ha az els vagy az utols osztlykz nyitott, s egyb informci nem ll rendelkezsre, akkor a szomszdos osztlykz szlessgvel szoktk a srsget szmolni, s a hisztogramot megrajzolni.

E.3.4. Kzprtkek s helyzetmutatk egyedi s csoportostott adatok esetnAz adathalmazok, az empirikus eloszlsok jellemzsre szolgl mutatk kzl elszr a helyzeti kzprtkeket: a mdusz s a medin fogalmt s szmtst mutatjuk be, majd a helyzetmutatknak egy a medinhoz hasonl csaldjt, a kvantiliseket.

19

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

Ezutn az tlagok fbb fajtit ismertetjk (szmtani, harmonikus, mrtani s a ngyzetes tlag, ezek mindegyike lehet egyszer s slyozott). Az tlagokat szmtott kzprtkeknek is nevezik, szembelltva a helyzeti kzprtkek fogalmval.

Helyzeti kzprtkek s ms helyzetmutatk.a) A mdusz fogalma diszkrt adatok esetn egyszer s kzenfekv: a leggyakoribb rtk. Tipikus rtknek is nevezik. PLDA: Ha egy vfolyam kzgazdasgtan vizsgajegyeit vesszk, s a 4-es jegybl van a legtbb, akkor a vizsgajegyek mdusza a 4-es. A mdusz nem mindig egyrtelm, lehet kt vagy tbb mdusza is egy adathalmaznak. Folytonos ismrvrtkeknl nincs rtelme leggyakoribb rtkrl beszlni, ez esetben a mdusz fogalma a srsggel (adatsrsggel) hatrozhat meg (lsd a b) pontot.) A valsznsgszmtsban a srsgfggvny maximumhelye a mdusz. b) A mdusz fogalma osztlykzs csoportostott adatok esetn: az a modlis osztlykz, amelyben az adatok srsge a legnagyobb. PLDA: Ha egy vfolyam ZH pontszmait elemezzk, ahol 100 pont volt a maximum, s a 60 s 80 pont kztti intervallumban helyezkednek el legsrbben az adatok, akkor ez a modlis osztlykz. Mivel elfordulhatnak azonos srsg osztlykzk, ezrt a modlis osztlykz meghatrozsa nem mindig egyrtelm. A hisztogram segtsgvel jl szemlltethet a modlis osztlykz: ez az az osztlykz, amelyhez a legmagasabb oszlop tartozik c) A mdusz becslse. A modlis osztlykzben ki szoktak jellni egyetlen rtket, amelyrl azt mondhatjuk, hogy felteheten e krl srsdnek leginkbb az adatok. A legegyszerbb lehetsg, hogy mdusznak a modlis osztlykz kzept vlasztjuk, de a gyakorlati tapasztalatok alapjn jobb becslsnek tnik, ha a kt szomszdos intervallum srsgt is figyelembe vesszk, gy gondolvn, hogy a mdusz az intervallumnak ahhoz a szlhez ll kzelebb, amelynek a srsge kzelebb van a modlis srsghez. A szmts ennek alapjn: hatrozzuk meg, hogy a kt szomszdos osztlykz adatsrsge mennyivel kisebb, mint a modlis osztlykz srsge. Jelljk ezeket a klnbsgeket k1 s k2-vel, s vlasszuk a modlis osztlykzbl azt az rtket mdusznak, amely az intervallumot k1 : k2 arnyban osztja kett. Ennek alapjn a mdusz becslt rtke a kvetkez kplettel hatrozhat meg: k1 Mo = xi 0 + hi k1 + k 2 ahol az xi 0 a modlis osztlykz als hatra, hi pedig a modlis osztlykz szlessge. PLDA. Korbbi pldnkhoz visszatrve: k1 s k 2 rtke 5 s 2, a modlis osztlykz als hatra pedig 50, az osztlykz szlessge 10, gy a mdusz becslt rtke: 5 Mo = 50 + 10 57,7 5+ 2

20

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

A hisztogramon szemlletesen:

Hallgatk eloszlsa pontszmok szerint A mdusz helye9 8 7 6 Srsg 5 4 3 2 1 0 -1 0 - 30 30 - 50 Mo = 57,7 50 - 60 60 - 80 80 - 100 3 8

k2 k1

6

rtelmezs: a pontszmok az 57,7-es rtk krl srsdnek a legnagyobb mrtkben. d) Medin. A medin a sorba rendezett adatok kzl a kzps rtk; vagy mskppen: a medin az az rtk, amely a sorba rendezett adatokat kt egyenl rszre osztja. Ha a sokasg elemeinek szma pratlan, akkor az imnti meghatrozs egyrtelm, mert akkor van egy kzps adat, amely eltt ugyanannyi adat van, mint utna. Pros szm elem esetn kt kzps adat van, ez esetben a kett kzti brmelyik rtk medinnak tekinthet. A gyakorlatban a kt rtk szmtani kzept szoktk megadni. A kt esetet egyszerre figyelembe vve a medin defincija: A medin az az rtk, amelynl az adatok legfeljebb 50%-a kisebb s legfeljebb 50 %-a nagyobb. e) A medin meghatrozsa osztlykzs gyakorisgi sor esetn. Azt az rtket keressk, amely a sorba rendezett adatokat kt egyenl rszre osztja. Ez is csak becsls, mivel nem ismerjk az alapadatokat, csak a gyakorisgi sort.

o Elszr meghatrozzuk a medint tartalmaz osztlykzt. Ez knnyen megtehet, ha figyelembe vesszk, hogy a medint tartalmaz osztlykz eltti osztlykzkre s az azt kvet osztlykzkre is igaz, hogy azokban az adatoknak legfeljebb a fele tallhat. A medint tartalmaz osztlykz indexe legyen i. o Az i-edik osztlykzben azt a pontot kell meghatroznunk, ahov a sokasg kzps eleme esik. Nzzk meg, hogy az i-edik osztlykzbe hny adat tartozik az sszes adat els felbl, s ez hnyad rsze az i-edik osztlykz gyakorisgnak. Vegynk ugyanennyied rszt az i-edik intervallumbl, s ezzel mr meg is hatroztuk a medint.A szmts menete ennek alapjn a kvetkez, ha mr tudjuk, hogy az i-edik osztlykz tartalmazza a medint: 21

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

Az i-ediket megelz i1 osztlykzben f 'i 1 darab adat van. Az i-edik n osztlykzbl pedig mg f 'i 1 szm adatot kell vennnk, hogy eljussunk 2 az adatok felig Nzzk meg, az i-edik osztlykzbl vett adatok szma hnyad rsze az i-edik osztlykz gyakorisgnak, s vlasszunk egy rtket, amely ugyanilyen arnyban osztja kett az i-edik osztlykzt. Ez az rtk, amely ezt a kettosztst megvalstja, lesz a medin. Azaz: n f 'i 1 Me = xi 0 + 2 hi fi Vagy ugyanez relatv gyakorisgokkal:

Me = xi 0 +

0,5 g 'i 1 hi gi

Itt az xi 0 a medint tartalmaz osztlykz als hatra, hi pedig ennek az osztlykznek a szlessge. f) A medin rokonfogalmai, a kvantilisek: kvartilisek, decilisek, percentilisek. A medin mint lttuk a kzps rtk: a sorba rendezett adatok 50%-a ennl kisebb, a msik 50%-a ennl nagyobb. Ehhez hasonlan ms helyzetmutatkat is definilhatunk, megkrdezhetjk, milyen rtk tallhat az adatok egy negyednl, vagy -nl vagy ltalnosan valamilyen p hnyadnl. Az ltalnos kplet a p hnyad kvantilis meghatrozsra:

Kvant( p) = xi 0 +

p g 'i 1 hi gi

A gyakoribb hnyadok, kvantilisek kln nevet kaptak, ezek kzl nhny: Als kvartilis: az adatok negyede ennl kisebb, az adatok -e ennl nagyobb:

Q1 = xi 0 +A kzps kvartilis maga a medin.

0,25 g 'i 1 hi gi

A fels kvartilis: az adatok -e ennl kisebb, az adatok -e ennl nagyobb:

Q3 = xi 0 +

0 ,75 g'i1 hi gi

A fels decilis: adatok 9/10-e ennl kisebb, az adatok 1/10-e ennl nagyobb A fels percentilis: adatok 99 %-a ennl kisebb, az adatok 1%-a-e ennl nagyobb.

A szmtott kzprtkek (tlagok) egyedi adatok s osztlykzs gyakorisgi sorok esetnA ler statisztikban a szmtani tlagok tbbnyire intenzitsi viszonyszmok, azaz, eltren a matematika elvont definciitl, az adatoknak, s ennek megfelelen az tlagoknak is mindig konkrt tartalmuk, mrtkegysgk van, pl. egy fre es jvedelem, (ezer Ft / f).

22

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

Szmtani tlag egyedi (nem csoportostott) adatok esetn. Az egyszer vagy slyozatlan tlagEgy xi adatsor esetn (i = 1, 2, n) az x tlag az xi rtkek sszegnek a sokasg egy egysgre jut rszen

n Az egyedi adatokbl szmolt tlag az egyszer vagy ms nven slyozatlan tlag.Szmtani tlag diszkrt ill. csoportostott adatok esetn. A slyozott tlag Ha ismtld adatokrl van sz, (mint pl. egy vfolyam vizsgajegyei), akkor mind az ttekinthetsg, mind a szmtsok egyszerstse rdekben rdemes az adatokat csoportostani. Ha k csoportot kpeztnk, s az i-edik csoport gyakorisga fi, akkor szmtani tlag: x =

x=

xi =1

i

fi =1 k i =1

k

i

xii

f

A csoportostott adatokbl szmolt tlagot slyozott tlagnak nevezik, a fenti kpletben a az fi gyakorisgok jelentik a slyokat. f Figyelembe vve, hogy g i = k i fii =1

az tlag a relatv gyakorisgokkal gy rhat:

x=

g xi =1 i

k

i

gi =1

k

.i

Itt a g i relatv gyakorisg, a sly. Ha g i tizedes trtben van adva, akkorx = g i xii =1 k

gi =1

k

i

= 1 s akkor az tlag gy rhat:

Szmtani tlag osztlykzs gyakorisgi sor esetnOsztlykzs gyakorisgi sornl a fentebbi (b) pontbeli kpleteket lehet hasznlni. Ha egyb informci nem ll rendelkezsre, az xi rtknek az osztlykzepet szoktk venni, az osztlykz als s fels hatrnak egyszer szmtani tlagt.

A harmonikus tlag csoportostott adatok esetn.Harmonikus tlag:xh =

si =1 k i =1

k

i

x

sii

=

zi =1 k i =1

k

i

x

zii

23

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

Harmonikus tlag akkor hasznlatos, ha a nevezbeli rtelmezhet.

si rtkek, ill. ezek sszege xi

Mrtani tlag(Ld. a dinamikus viszonyszmoknl )

A szmtani tlag tulajdonsgai:a) Egyedi rtkek helybe a szmtani tlagot rva a teljes rtksszeg vltozatlan marad. Mskppen fogalmazva: az tlag n-szerese a teljes rtksszeggel egyenl.n x = xii =1 n

b) Az egyedi rtkek mindegyikhez ugyanazt a d konstanst hozzadva a szmtani tlag d-vel vltozik. (d negatv szm is lehet.)

= x+d n n n c) Az egyedi rtkek mindegyikt ugyanazzal a k konstanssal szorozva az szmtani tlag is k-szorosra vltozik. (k negatv szm is lehet)i =1 i =1 i =1 i =1

xj =

(xi + d ) xi + d xi + nd= =

n

n

n

n

=kx n n d) Ha minden adat egyforma, a szmtani tlag is ugyanennyi. Egybknt a szmtani tlag a szls rtkek kz esik: x min < x < x maxi =1 i =1

xj =

k xi

n

=

k xi

n

e) A szmtani tlag ngyzetes minimumtulajdonsga: a

akkor n minimlis, ha x = A. Ha az A rtk d-vel tr el (akrmilyen irnyban) az tlagtl, akkor a szrsngyzetnl ppen d 2 -tel nagyobb szmot kapunk.

(x A)i

2

f) Rsztlagok s a ftlag kapcsolata. Csoportostott adatok esetn, ahol a j-edik csoportban nj adat van s a j-edik csoport tlaga x j , a teljes sokasgra vonatkoz szmtani tlag (az x ftlag) a rsztlagokbl is meghatrozhat mint a rsztlagok slyozott tlaga:

nj xjx=j =1

k

n=j =1

k

j

xj

nj =1

k

n

=j =1

k

nj n

xj .

j

A slyok jelentsge. A slyok lehetnek az adatok gyakorisgai (vagy relatv gyakorisgai), mint a szmtani tlagnl, s lehetnek az rtksszegek (vagy relatv rtksszegek) mint a harmonikus tlagnl. De a slyok lehetnek nknyesen megllaptott fiktv slyok is, amelyek egy adatcsoport vagy rsztlag jelentsgt, fontossgt hivatottak kifejezni. Pl. egy fiskola megadhatja, hogy a zrvizsga vgs eredmnybe a szakdolgozat eredmnyt milyen sllyal szmtja be. Vagy lehet a vizsgaeredmnyeket a kreditekkel slyozni, stb. 24

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

E.3.5. A szrds fogalma s mutatiA szrds az adatok klnbzsgt jelenti. Ha minden adat egyforma, akkor az adatok nem szrdnak. A szrds tbbflekppen is jellemezhet, szmszersthet. A leggyakrabban hasznlt mutatk: Terjedelem, R. A sokasg legnagyobb s legkisebb elemnek a klnbsge.R = x max x min

tlagos abszolt eltrs, (egy kzprtktl, az tlagtl vagy a medintl szmtva) Az egyes adatoknak a szmtani tlagtl val eltrsbl szmolva:

d=

fi =1

k

i

xi xk

fii =1 k

=

gi =1

k

i k

xi xi

gi =1 k

A medintl val eltrsekbl szmtva:

=

i =1

f i xi Me

fii =1

k

=

gi =1

i

xi Mek i

gi =1

A rtke akkor a legkisebb, ha a Me-tl val tvolsgokat sszegezzk. Ez azt jelenti, ha a fenti kpletben Me helybe brmely ms a Me-tl eltr, illetve Me-nak nem tekinthet kzprtket vagy konstanst runk, akkor az abszolt eltrsre nagyobb rtket fogunk kapni.

Szrsngyzet (variancia) s szrs. A szrds jellemzsre szolgl legfontosabb s leggyakrabban alkalmazott mutat a szrsngyzet (latinosan variancia), s ennek ngyzetgyke, a szrs. (A szrs teht megklnbztetend a szrds ltalnos fogalmtl.) A variancia az tlagtl val eltrsek ngyzeteinek tlaga, a szrs ennek ngyzetgyke.A szrsngyzet: =

i =1

k

f i ( xi x )2

i =1

k

=

gi =1

k

i

( xi x )2

fik

gi =1

k

i

Szrs: =

f (x x)i =1 i i

k

2

fi =1

k

=

g (x x)i =1 i i

2

i

gi =1

k

i

Relatv szrs: szoks mg relatv szrst is szmolni:

V =

x

, 25

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

ez azt fejezi ki, hogy a szrs az tlagnak mekkora hnyadt teszi ki. Mskppen: az adatok az tlag hnyadrszvel szrnak az tlag krl.

A szrs tulajdonsgai. Nagyon fontosak s knnyen belthatk a szrs albbi matematikai tulajdonsgai.a) Ha az egyedi rtkeket egy konstanssal megnveljk, a szrs nem vltozik b) Ha az egyedi rtkeket megszorozzuk k-val, a szrs k -szorosra n. c) A variancia felrhat mint az x2 tlagnak s az x ngyzetnek a klnbsge.

2 = x2 x 2d) Az tlag fogalmnl emltettk, hogy a

kifejezs rtke akkor minimlis, n ha x = A. Ha az A rtk d-vel tr el (akrmilyen irnyban) az tlagtl, akkor a szrsngyzetnl ppen d 2 -tel nagyobb szmot kapunk.

(x A)i

2

e) Ha tbb csoportra bontjuk a sokasgot, akkor a csoportok kztti klnbsget a kls szrsngyzettel, a csoporton belli ingadozsokat a bels szrsngyzettel lehet jellemezni. Ezek sszege a teljes szrsngyzet. (Ezzel rszletesebben a Vegyes kapcsolat c. fejezetben fogunk foglalkozni)

PLDK: a) Ha egy cgnl minden dolgoz kap 100 fizetsemelst, akkor a fizetsek szrsa nem vltozik. (Az tlagfizets 100 -val n.) b) Ha egy cgnl minden dolgoz kap 20%-os fizetsemelst, akkor a fizetsek szrsa is 20%-kal n. (Az tlagfizets is 20%-kal n.) c) Hrom testvr letkora 6, 12, 15 v. A testvrek tlagletkora 11 v. A szrsngyzet:

2 =

(6 11)2 + (12 11)2 + (15 11)232 2

= 14

A msik sszefggssel szmolva:

62 + 122 + 152 =x x = 112 = 135121= 14 32

d) Vegyk a c)-beli 3 testvrt. Ha szrsngyzet (eredeti kplet szerinti) szmtsnl nem a 11 ves tlagtl, hanem (pl. egy szmolsi hiba miatt) 13 vtl val eltrsekkel szmoljuk, akkor azt kapjuk:

(6 13)2 + (12 13)2 + (15 13)2 = 18 .3

Az tlag helyre 2-vel nagyobb rtket rtunk a

kpletbe, s gy az eltrsngyzetek tlagra 22=4-gyel nagyobb rtket kaptunk. e) Ld. a Vegyes kapcsolat c. fejezetet

A koncentrci rtelmezse, elemzse. A Lorenz-grbe. Koncentrcirl akkor beszlnk, ha az rtksszeg egyenetlenl oszlik el a sokasg egysgei kztt. A sokasg nagyobb hnyadra a teljes rtksszeg kisebb hnyada jut. A msik irnybl kzeltve: a sokasg kisebb hnyadra a teljes rtksszeg nagyobb hnyada jut. Vagy: a sorba rendezett adatok egyforma hnyadaira az rtksszeg nem egyforma hnyada jut. A Lorenz grbe egy olyan ngyzet alak diagram, amelynek26

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

a vzszintes tengelyn a kumullt relatv gyakorisgok, fggleges tengelyn a kumullt relatv rtksszegek szerepelnek Ha minden egyed (ill. a sokasg minden rszhalmaza egyformn rszesedik az rtksszegbl, akkor a Lorenz grbe a ngyzet tlja lesz; ha egyenltlensgek vannak a sokasgban, akkor a Lorenz grbe az tl alatt fut. Minl jobban eltr a grbe lefel az tltl, annl nagyobb az adott rtksszeg (jvedelem, vagyon, stb.) koncentrcija.

PLDA. Egy szerencsejtkban 200 ember nyert.110-en 2 Mft-ot 50-en 3,3 mFt-ot 25-en 10 mFt-ot 15-en 20 mFt-ot nyertek. Jellemezzk a nyeremnyek koncentrcijt Lorenz grbe segtsgvel.Nyeremnyrtkek (mFt) xi Gyakorisg fi 110 Relatv gyakorisg gi (%) 55 Kumullt Relatv Kumullt rel. rtksszeg rtksszeg rel.rt.sszeg gyakorisg si zi (%) z (%) f (%)55 80 92,5 100 220 165 250 300 23,5 17,6 26,7 32,1 23,50 41,1 44,3 100,0

2 3,3 10 20sszesen

5025 15 200

2512,5 7,5

100

-

935

100

-

A tblzat alapjn a koncentrci a Lorenz grbe segtsgvel gy brzolhat:

Lorenz grbe100 90 Kumullt relatv rtksszegek 80 70 60 50 40 30 20 10 0 0 20 40 60 80 100

Kumullt relatv gyakorisgok

27

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

E.3.6. Az empirikus eloszlsok alakja.A gyakorisgi eloszlsoknak, ill. ezek grafikus kpnek a jellemzsre tovbbi elemzsi eszkzk, mutatk is rendelkezsnkre llnak: A mdusszal kapcsolatban fontos ismeret, hogy egymdusz vagy tbb mdusz eloszlsrl van sz. Az aszimmetria (ferdesg) mutatja annak szmszerstsre szolgl, hogy az eloszls milyen mrtkben s milyen irnyban tr el a szimmetrikus eloszlstl. A Pearson-fle A mutat kiindulpontja az, hogy szimmetrikus esetben az tlag s a mdusz egybeesnek, ha teht eltrnek egymstl, akkor aszimmetrirl van sz: x Mo A=

Szimmetrikus esetben A rtke 0. Ha A negatv szmot ad eredmnyl, akkor jobboldali aszimmetrirl beszlnk, ellenkez esetben baloldalirl.

Egy msik mutat a kvantilisek egymshoz viszonytott helyzetbl indul ki. Szimmetrikus esetben a Q1 s a Q3 egyenl tvolsgra van a medintl:

Q3 Me = Me Q1Teht:

Ha a kt tvolsg nem egyezik meg, akkor (Q3 Me) (Me Q )1 0 , s ekkor aszimmetrirl van sz:

(Q3 Me) (Me Q)1 = 0

F-mutat:

F=

(Q3 Me) (Me Q1 ) (Q3 Me) + (Me Q1 )

Az F mutat egy (1) s 1 kz es szmot ad eredmnyl. Szimmetrikus esetben F rtke 0, s itt is rvnyes, hogy o ha ez a szm negatv, akkor jobboldali aszimmetrirl van sz, o ellenkez esetben baloldalirl.

28

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

E.4. IndexszmtsAz indexszmts heterogn ruhalmazra vonatkozan az rtk, r s volumen vltozsaival, a vltozst kifejez hnyadosokkal (sszetett dinamikus viszonyszmokkal) index-szmokkal foglalkozik Ezen bell a legfontosabb krds az rvltozsok s a mennyisgi vltozsok rtkvltozsra gyakorolt hatsnak a sztvlasztsa. Tbbnyire kt idszak kztti vltozsrl van sz: a trgyidszakot viszonytjuk a bzisidszakhoz. Ugyanezzel a logikval terleti indexek is szmthatk.

Egyetlen rura vonatkozan az sszefggsek egyszerek, ha azonban tbb klnbz ru sszessgre (heterogn ruhalmazra) is ki szeretnnk terjeszteni az elemzst, akkor mr szmos nehzsggel kell szembenznnk.

E.4.1. Alapfogalmak, egyedi indexekEgyetlen fajta rura vonatkozan az rtk, az r s a volumen fogalma kzenfekv. A volumen (q) egy ru adott mennyisge termszetes mrtkegysgben. (kg, db, liter, stb.) Az r (p) az ru egysgnyi mennyisgrt krt (vagy knlt, vagy tnylegesen megfizetett) pnzmennyisg (Ft/db, /kg, $/l ) Az rtk (v) az r (p) s a volumen (q) szorzatt jelenti (Ft; ; $) Az i-edik rura vonatkozan az rtk, r s volumen sszefggse: v v vi = qi pi qi = i pi = i pi qiAz egyszersg rdekben a tovbbiakban az ru azonostsra szolgl i indexet nem fogjuk feltntetni, v v v = qp q= p= p q Az index-szmok a kt idszak kztti vltozst hnyados formjban mutatjk. Az egyedi rtk-, r- s volumen-index fogalma is kzenfekv. Az egyedi volumenindex: iq = Az egyedi rindex : iq =

q1 q0

p1 p0 v qp Az egyedi rtkindex iv = 1 = 1 1 v0 q0 p0Az indexek kztti sszefggsek egyetlen rura vonatkozan: iv = iq ip A heterogn ruhalmazra vonatkoz egyttes indexek, mutatszmok meghatrozsnl az a cl, hogy a fentiekhez hasonl egyszer mutatszmokkal lehessen dolgozni. A nehzsget a klnbz fajtj, mrtkegysg ruk egyttes figyelembevtele, aggreglsa jelenti. Egyttes rtkindexet szmolni nem okoz nehzsget, az egyttes rindex s egyttes volumenindex meghatrozshoz azonban mint ltni fogjuk tovbbi elvi s gyakorlati megfontolsok szksgesek.

29

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

E.4.2. Az rtkvltozs felbontsa kt sszetevre: az rvltozs s a volumenvltozs hatsra. Az (egyttes) rtk-, volumen- s rindex.Indexen gy jelz nlkl ebben a fejezetben mindig egy heterogn ruhalmazra vonatkoz egyttes indexet rtnk.

a) Az rtkindex Egy ruhalmaz sszrtkt meghatrozni nem nehz, minden egyes ru mennyisgt (volument) megszorozzuk az rval, s ezeket a szorzatokat sszegezzk. v1 = q1 p1

v = q0

0

p0

A (szumma jel) a termkenknti sszegzsre vonatkozik: azt az utastst jelenti, hogy minden egyes rura hatrozzuk meg a qp szorzatokat, s adjuk ssze. Az als kis jelzszm azt adja meg, hogy melyik idszakra vonatkozik az sszegzs. Az rtkindexet gy kapjuk, hogy az 1-es idszaki (trgyidszaki) sszrtket elosztjuk a v q p bzisidszaki sszrtkkel: I v = 1 = 1 1 v0 q0 p0

b) A volumen- s az rindex meghatrozsnak elvi problmjaAz egyik idszakrl a msikra az rtknek ltalban mindkt tnyezje, a volumen is s az r is vltozik. Radsul minden egyes termk mennyisge is, ra is eltr irnyban s mrtkben vltozhat, ezrt nem knny st teljes egyrtelmsggel nem is lehet - vlaszolni arra a krdsre, hogy az rtk vltozsn bell mennyi volt az rvltozs hatsa, s mennyi a mennyisgek (a volumen) vltozsnak a hatsa. Az ruk aggreglsnak az rtksszeg meghatrozsa az alapja. Ha tbb heterogn termk esetn csak az egyik tnyez hatsra vagyunk kvncsiak, akkor megvizsglhatjuk, mi trtnt volna az sszrtkkel, ha a msik tnyez a kt idszak kztt nem vltozott volna. Ha pldul eladsrl van sz, fltehetjk azt a krdst, hogyan vltozott volna az rtk (a bevtelnk), ha csak az rak vltozst vettk volna figyelembe, azaz mindkt idszakban minden egyes termkbl ugyanannyit adtunk volna el. Az gy szmolt mutatszm az rak vltozst tkrzi, ezrt ezt nevezhetjk rindexnek. Hasonlkppen fltehetjk azt a krdst is, hogyan vltozott a volumen, azaz: hogyan vltozott volna a bevtelnk, ha az rak nem vltoztak volna a kt idszak kztt. gy jutunk el a volumenindexhez. Ez hasznlhat elv, csak nem egyrtelm. Ha a volumen vltozst vltozatlan rak mellett akarjuk egy indexszel jellemezni, tbb lehetsg kztt vlaszthatunk: mindkt idszakra azonos raknak vlaszthatjuk a termkek bzisidszaki rait is, a trgyidszaki rait is, de vlaszthatunk valamilyen minden egyes termkre kln meghatrozott tlagrat is. A volumenindex viszont szmszeren klnbzni fog aszerint, hogy melyik lehetsget vlasztottuk. 30

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

Egyrtelm mutatszm konstrulsra nincs lehetsgnk, de szmthatk olyan mutatk, amelyek a gyakorlati ignyeket jl kielgtik, akr egy vllalat bevteleinek elemzsrl, akr a makroszint mutatk pl. nvekedsi rta, inflcis rta meghatrozsrl van sz. sszefoglalva: az rindex s a volumenindex olyan hnyadosok, amelyeket az rtkindex megfelel talaktsval kaphatunk. Ezek valjban fiktv rtkindexek, amelyek azt mutatjk, hogy mennyi lenne az rtk vltozsa, ha a kt tnyez kzl az egyiket mindkt idszakra vonatkozan azonos rtkkel szerepeltetnnk a kpletben.

b) Volumenindex A volumenindex teht olyan talaktott rtkindex, amelyben a kt idszakra vonatkoz rtk-sszegeket azonos (vltozatlan) rakon szmoljuk ki. Ha mindkt idszakban a bzisidszak rait hasznljuk, akkor bzisidszaki vagy Laspeyresfle volumenindexrl beszlnk. L q1 p0 A Laspeyres-fle volumenindex: Iq = q0 p0Ha mindkt idszakban a trgyidszak rait hasznljuk, akkor ez a trgyidszaki vagy Paasche-fle volumenindex. P q1 p1 A Paasche-fle volumenindex: Iq = q0 p1 A kt fle volumenindex szmszeren ltalban nem egyezik meg, ezrt gyakran a mrtani tlagukat szmtjk: A Fisher-fle volumenindex:Iq =F

Iq IqL

P

c) rindex Az rindexek logikja ugyanaz. Az rindex is talaktott rtkindex, csak ez esetben a kt idszakra vonatkoz rtk-sszegeket azonos (vltozatlan) mennyisgeket felttelezve szmoljuk ki. Ha mindkt vre a bzis idszaki mennyisgekkel (volumenekkel) szmolunk, akkor a bzis idszaki vagy Laspeyres-fle rindexet kapjuk. Ha mindkt idszakban a trgyidszak mennyisgeit hasznljuk, akkor ez a trgy idszaki vagy Paasche-fle rindex.Laspeyres-fle rindex:Ip =L

q q

0

p1 p01 0

0

Paasche-fle rindex:

Ip =P

q p q p1 1L

Erre is rvnyes, hogy a ktflekppen szmtott index ltalban eltr, s ezrt gyakran a ktfle rindex mrtani tlagt hasznljk. Fisher-fle rindex:Ip =F

Ip Ip

P

d) Indexek kztti sszefggsek: Knnyen belthat, hogy a klnbz slyozs indexek kztt fennll az az sszefggs, hogy a volumenindex s az rindex szorzata megegyezik az rtkindexszel. L P P L Iv = Iq I p Iv = Iq I p31

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

Az els szorzatban az indexeket rszletesen kirva lthat, hogy a q1 p0 szorzatsszeggel egyszersteni lehet, s gy valban az rtkindex kpletre jutunk: q1 p0 q1 p1 = q1 p1 = I v q0 p0 q1 p0 q0 p0 Hasonlan lthat be a msik esetre is. Ezekbl kvetkezen ugyanez igaz a Fisher fle indexekre is: F F Iv = Iq I p

e) Az indexek mint tlagformulkAz eddigi indexek mindegyike felrhat egyedi indexek slyozott tlagaknt. Ezeknek az talaktott formknak gyakorlati jelentsge is van, a mindennapi statisztikai gyakorlatban sokszor csak ezekkel az tlagformulkkal lehet eredmnyre jutni.

Az rtkindex mint az iv egyedi rtkindexek slyozott szmtani tlaga:

Iv =A iv =

q p q p1 0

1 0

=

q p i q p0 0 0 0

v

q1 p1 kifejezsbl ugyanis q1 p1 = q 0 p 0 iv . q0 p0

Az rtkindex mint az iv egyedi rtkindexek slyozott harmonikus tlaga:Iv =

q p q p1 0

1 0

=

q q q

p1 q1 p1 = q p 1 p1 1i 1 1 p1 v q0 p 01

Itt az iv =

q1 p1 qp kifejezsbl a nevezt fejeztk ki: q0 p0 = 1 1 , s ezt q0 p0 iv

helyettestettk be az I v kpletbe.

A Laspeyres-fle volumen-index mint az iq egyedi volumenindexek slyozott szmtani tlaga. Az iq =

q1 kifejezsbl fejezzk ki q1 -et: q1 = q0 iq , s helyettestsk be az I qL q0 p0

kpletbe:I qL =

q q

1

0 p0

q p q = q p0 0 0 0

q10

=

q p i q p0 0 0 0

q

= w0 iq

32

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

ahol w0 =

q0 p0 q0 p0

Paasche-fle volumenindex mint az iq egyedi volumenindexek slyozott harmonikus tlaga. Az iq =

q1 q kifejezsbl fejezzk ki q0 -t: q0 = 1 , s helyettestsk be az I qP iq q0 kpletbe:I qP =

q q

1 0

p1 p1

=

q p q p i1 1 q

1 1

=

1 , w1 i q

q1 p1 q1 p1 Laspeyres-fle rindex:ahol w1 =Ip =L

q q

0

p1 p0

0

q p p = q p0 0 0 0

p10

=

q p i q p0 0 0 0

p

= w0 i p

ahol w0 =

q0 p0 q 0 p0i

Paasche-fle rindex:

Ip =P

q p q p1 1

1 0

==

q p q p i1 1 p

1 1

=

1 w i1 p

w1 =

q1 p1 q1 p1i

f) Makrogazdasgi index-fajtk A gyakorlatban hasznlt makrogazdasgi indexfajtk szmtshoz tovbbi megfontolsokra van szksg. Ezek a szmtsok intzmnyes keretek kzt folynak, nemzetkzi statisztikai szabvnyok szerint. Tbbnyire reprezentatv megfigyelseken alapulnak. mint a termeli rindexek, a fogyaszti rindex (CPI), a terleti rindexek pl. a vsrler parits (PPP), a tzsde-indexek (Dow-Jones, BUX, stb.) Az rindexekre vonatkozan rszletesebben lsd: (Kerkgyrtn et al., 2009; 5.2 s 5.3 alfejezetek, p. 168-169)

33

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

E.5. Ftlagok sszehasonltsa standardizls segtsgvelE.5.1. BevezetsA standardizls mdszere heterogn sokasgbl szmtott ftlagok, illetve sszetett intenzitsi viszonyszmok (mint pl. egy fre jut termels) sszehasonltsra, elemzsre szolgl. A ftlag ismert mdon a rsztlagokbl szmthat ki, azok slyozott tlagaknt. Mivel itt V = A/B viszonyszmok elemzsrl van sz, a fenti kpletet ilyen alakban szoktk felrni: illetve A ftlag nagysga s vltozsa teht o egyrszt a V -vel jellt rsztlagoktl o msrszt a B-vel jellt slyoktl, ms szval az sszetteltl fgg. Ha egy adott tpus tlagnak (tlagbrnek, termelkenysgnek) kt idszakra vagy kt terletre vonatkoz rtkt ssze akarjuk hasonltani, akkor rdekes lehet, hogy a klnbsg mennyiben tudhat be a rsztlagok, s mennyiben a slyok vltozsnak. A standardizlsnak ppen ez a clja: a rsztlagok (vagy rszviszonyszmok) klnbzsgbl s az sszettel (a slyok) klnbzsgbl add hatsok klnvlasztsa s mrse. Az alapgondolat a kvetkez: o Ha a ftlag kt idszakra vagy kt terletre vonatkoz kiszmtsnl a slyok azonosak lennnek mindkt idszakra vagy mindkt terletre, akkor a kt ftlag klnbsge csak a rsztlagok eltrsbl szrmazhatna. o Hasonlan, ha a rsztlagok lennnek azonosak mindkt idszakra vagy mindkt terletre vonatkozan, akkor a kt ftlag klnbsge csak a slyok eltrsbl (ms szval az sszettel eltrsbl) szrmazhatna. A ftlagok eltrsben tbbnyire mindkt sszetev szerepet jtszik, ltalban a rsztlagok is klnbznek s a slyok is. De fltehetjk azt a krdst, hogy mi lenne, o ha csak a slyok trnnek el egymstl, a rsztlagok mindkt esetben azonosak lennnek, valamilyen mindkt idszakra vagy terletre azonos standard rsztlaggal szmolnnk a valsgos helyett. o Vagy mi lenne, ha csak a rsztlagok trnnek el egymstl, a slyok mindkt esetben azonosak lennnek, azaz: valamilyen mindkt idszakra vagy terletre azonos standard slyrendszerrel szmolnnk a valsgos slyok helyett. Ez a szmtsi md egyszeren megvalsthat, csak azt kell eldnteni, mi legyen a mindkt esetre azonos sly (a standard sly), mi legyen a standard rsztlag. 34

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

Erre a krdsre nincs egyrtelm vlasz, ez elmleti alapon egyrtelmen nem dnthet el, de a gyakorlatban ahogy albb rszletesen bemutatjuk jl hasznlhat mdszerek llnak rendelkezsnkre.

E.5.2. Klnbsg-elemzsJellseink a kvetkezk lesznek: K a ftlagok (sszetett viszonyszmok) klnbsge ; ftlag (sszetett viszonyszm) V0 ; V1 rsztlagok (rszviszonyszm) B0 ; B1 rsztlaghoz tartoz slyok (pl. ltszm, vagy ltszm-arny) Als indexek: a kt sszehasonltott idszak vagy terlet jelzse

A ftlagok klnbsgnek felbontsa Maga a klnbsg (K) egyszeren szmthat: B1 V1 B0 V0 K = V1 V0 = B1 B0Ezt a klnbsget szeretnnk felbontani kt rszre, amelybl az egyiket o a rsztlagok klnbzsgnek, o a msikat pedig a slyok (az sszettel) klnbzsgnek tulajdonthatjuk.

A rsztlagok klnbzsgnek hatsa (K) A kt hats elklntsnek egyik lehetsges mdszere a kvetkez. A ftlag-klnbsg fenti kplett alaktsuk t: a klnbsg mindkt tagjban szerepeljenek ugyanazok a slyok, azaz, ugyanazok a B rtkek. Ez maga a standardizls mvelete. gy egy fiktv ftlagklnbsget kapunk, a standardizlt slyokkal kiszmtott ftlagok klnbsgt, amely mr nem tulajdonthat a slyok klnbzsgnek, hiszen azok a kpletekben mr azonosak, gy csak a rsztlagok klnbzsgnek tudhatk be.Bst-vel jellve a standard B rtkeket: B V B V K = V1 (Bst ; V ) V0 (Bst ; V0 ) = st 1 st 0 Bst BstA kvetkez krds, mit vlasszunk, mit vlasszunk Bst rtknek? A kvetkez lehetsgek merlnek fl: o Vlasszuk mindkt idszak (terlet) slyainak B0 rtkeket, Bst teht legyen B0. o Vlasszuk mindkt idszak (terlet) slyainak a B1 rtkeket, Bst teht legyen B1. o Vagy vlasszunk mindkt idszak (terlet) slyrendszernek egy harmadik slyrendszert, amelyet a B0 s a B1 rtkekbl szmtunk, pl. azok szmtani kzepeit. Az albbiakban gyakorlatias megfontolsokbl az els kt lehetsget fogjuk hasznlni.

B V B V B B B V B V K'= B BK'=0 1 0 0 0 1 1 1 0 1 1

0

35

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

Az sszettel klnbzsgnek hatsa (K) Az sszettel hatst a fentiek analgijra gy lehet klnvlasztani, hogy a ftlagok klnbsgt standard (mindkt idszakra illetve terletre azonos) rsztlag-rtkek mellett szmtjuk ki. Tekinthetjk standardnak: o a V1 rtkeket, o a V0 rtkeket, o a V1 s V0 rtkek valamilyen tlagt. Most is az els kt lehetsggel fogunk lni. Ha a V1 rtkeket vesszk standard rsztlagnak, akkor az sszettelhatst kifejez klnbsg: B1 V0 B0 V0 K''= B1 B0Ha a V0 rtkeket vesszk standard rsztlagnak, akkor az sszettelhatst kifejez klnbsg: B1 V1 B0 V1 K''= B1 B0

A fiktv (standardizlt) ftlagok A fenti szmtsokban a V0 s V1 ftlagok mellett szerepel kt olyan nem valsgos (fiktv), standardizlt ftlag, amelyben keverednek a 0-s s az 1-es als index B s V vltozk. Vst(B1; V0) Vst(B0, V1) Ezek azok az elvlaszt rtkek, amelyek a ftlag-klnbsget kt rszre osztjk. Az albbi bra ezt teszi szemlletess. A (B1; V0) adatokbl szmolt fiktv ftlaggal szmolva:

B V B0 0

0

B V B1 1

0

B V B1 1

1

B VK K

KA msik fajta standardizlt (fiktv) ftlaggal szmolva, mint knnyen belthat a kt sszetev flcserldik, s (ltalban) nagysguk is el fog trni a az elz vltozathoz kpest.

B V B0 0

0

B V B0 0

1

B V B1 1

1

B VK

K

K36

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

sszefggs a kt sszetev kztt. A ftlag-klnbsg flrhat a rsztlag-hats az sszettelhats sszegeknt, ha a kt tagban a standardeket ellenkezleg vlasztjuk meg.K = K ' + K"

E.5.3. Hnyados elemzsA vltozsok elemzse hnyadosok (indexek) segtsgvel is elvgezhet. Az alapgondolat vltozatlan, csak a kivons helyett osztani kell. Annyi az eltrs a lnyeg vltozatlansga mellett, hogy az oszts rvn egyszerstsi s tovbbi hasznos rtelmezsi lehetsgek addnak.

Ftlagindex:

I=

V1 V0

B V B = B V B1 1 0 0

1

0

A rsztlagindex, ha standardnak a B0 rtkeket vlasztjuk :

B V B I'= B V B0 0 0 0

1

0

Itt a B0 kifejezssel egyszersteni lehet a trtet, s gy egyszerbb alakra jutunk, (ami emlkeztet az indexszmts kpleteire).

I'=

B V B V0 0

1 0

Ezen tlmenen egyszer talaktssal a rsztlagindex felrhat az egyedi rsztlagindexek slyozott szmtani tlagaknt is: V B0 V0 V1 B0 V1 = 0 I'= B0 V0 B0 V0 Ha a standardnek a B1 rtkeket vlasztjuk, a rsztlagindexre a kvetkez formult kapjuk: B1 V1

I' =

B B V B1 1 1

0

Itt a

B

1

kifejezssel egyszersthetnk:

37

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

I'=

B V B V1 1

1 0

Ez a formula az egyedi rsztlagindexek slyozott harmonikus tlagaknt rhat fl: :I'=

B V B V1 1

1 0

=

B V B V V1 1 1

1 1

V0

Az sszettelhats indexe:

B V B I"= B V B1 1 0 0

1

vagy

1

B V B I"= B V B1 1 0 0

0

0

Ez a kplet is talakthat lenne, de egyszerstsi s tbbletrtelmezsi lehetsg itt nem addik.

sszefggs a kt sszetev kztt. A ftlagindex flrhat a rsztlagindex s az sszettelhats-index szorzataknt, ha kt tnyezben a standardokat ellenkezleg vlasztjuk meg.I = I' I"

38

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

E6. AsszociciE.6.1. AlapfogalmakA kvetkezkben (itt s a tovbbi fejezetekben) az ismrvek kztti sztochasztikus kapcsolatokkal foglalkozunk. A sztochasztikus jelz arra utal, hogy a kt ismrv kapcsolata nem egyrtelm, vletlenszer mozzanatokat is tartalmaz. A tbb ismrv szerinti elemzsek kzl ebben a fejezetben a kt nem mennyisgi ismrv kztti sztochasztikus kapcsolatot, az asszocicit mutatjuk be. A kvetkez forma (7. pont) egy minsgi s egy mennyisgi ismrv kapcsolata lesz, ez a vegyes kapcsolat. A harmadik, a legszlesebb elemzsi lehetsget nyjt kapcsolat (8. pont) a korrelci, amikor mindkt ismrv mennyisgi. Ennek egy kiemelten fontos terlett, az idsorok elemzst ismerteti a 9. pont. KIINDUL PLDK: o Fgg-e a beoszts a kpzettsgtl? Itt kt minsgi ismrv kztti kapcsolatrl van sz, ez az asszocici. o Fggnek-e a keresetek a nemtl (hogy frfirl, vagy nrl van sz)? A nem minsgi ismrv, a kereset mennyisgi. Ez vegyes kapcsolat. o Fgg-e a statisztika eredmny a matematika-tudstl, azaz, a matematika vizsgaeredmnytl? Kt mennyisgi ismrv kzti kapcsolat neve korrelci.

E.6.2. Az asszocici elemzse kombincis tbla segtsgvelAz asszocici elemzsnek leggyakrabban hasznlt kiindulpontja a ktdimenzis gyakorisgi tbla, az gynevezett kombincis tbla.

PLDA. Fgg-e a beoszts a kpzettsgtl? A sokasg megoszlst kpzettsg s a beoszts szerint az albbi tblzat tartalmazza.Beosztottak Alapfok Kzpfok Felsfok sszesen160 80 60 300

Kzp-vezetk10 40 70 120

Fels vezetk10 20 50 80

sszesen180 140 180 500

A kombincis tblban szerepl adatok jellse:j i

fij f. j

f i.n

Az i s a j a kt ismrv vltozatait jelli. A sokasg a kt ismrv szerint csoportokra van bontva.

39

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

A tblzat belsejben az fij gyakorisg azt adja meg, hogy az (egyik ismrv szerinti) i-edik csoportban hny elem van a (msik ismrv szerinti) j-edik csoportbl. Fordtva is mondhat: a j-edik csoportban hny egyed tallhat, amely egyidejleg a msik ismrv szerinti i-edik csoport tagja. A tblzat als sorban illetve utols oszlopban (a tblzat peremn) szerepelnek az f. j s az f i. peremgyakorisgok. Vizsgljuk meg a kt elvi szls esetet, amikor a kapcsolat determinisztikus (amikor az egyik ismrv egyrtelmen meghatrozza a msikat), s amikor a kt ismrv fggetlen egymstl.

A determinisztikus eset. Az albbi tblzat determinisztikus kapcsolatot mutat.

PLDAAlapfok Kzpfok Felsfok sszesen Beosztottak 0 0 300 300 Kzp-vezetk 0 120 0 120 Fels vezetk 80 0 0 80 sszesen 80 120 300 500

Ilyen nem tl valszer adatokkal kitltve lehetne azt mondani, hogy a kpzettsgi szint egyrtelmen (determinisztikusan) meghatrozza a beosztst.

Megjegyzend: abbl, hogy az egyik irnyban fennll az egyrtelm meghatrozottsg, nem kvetkezik, hogy a msik irnyban is fennll. Pldnkban kivtelesen fennll, mert a beosztsbl egyrtelmen lehet kvetkeztetni a kpzettsgi szintre. A fggetlensg esete Fggetlennek tekinthet a kt ismrv, ha minden els ismrv szerinti csoportban (s a teljes sokasgban is) ugyanolyan a msik ismrv szerinti egyedek megoszlsa.

PLDNKBAN: ha minden kpzettsgi csoportban (s a teljes sokasgot vve is) egyforma lenne a beosztottak s a vezetk arnya. Vagy fordtva: minden beosztotti kategriban (s a teljes sokasgban is) ugyanaz lenne a klnbz kpzettsgek megoszlsi arnya. Ebbl mr az is kvetkezik, hogy a fggetlensg szimmetrikus fogalom, ha az egyik ismrv fggetlen a msiktl, akkor a msik is fggetlen az elstl. 1 (A determinisztikus kapcsolat nem felttlenl szimmetrikus.) . Ha az f ij * jelenti a fggetlensg esetn rvnyes gyakorisgot, akkor fggetlensg esetn:f i. f. j n ; Ha adottak a peremgyakorisgok, akkor ezzel a kplettel meghatrozhatak a fggetlensg esetn rvnyes gyakorisgok: = f ij *

Az itt hasznlt fggetlensg-fogalom megegyezik a valsznsgszmtsban hasznlt fggetlensgfogalommal. Valsznsgszmtsi szempontbl itt kt esemnyrendszer fggetlensgrl van sz.

1

40

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

n A tblzat belsejben adott peremgyakorisg mellett ilyen gyakorisgoknak kellene lenni ahhoz, hogy a kt ismrvet fggetlennek lehessen mondani. Brmely cellra vonatkozan az f ij * meghatrozsa teht annyibl ll, hogy a cellhoz tartoz peremgyakorisgok szorzatt osztjuk a sokasg elemszmval.

f ij * =

f i. f . j

PLDA A fentebbi adatokbl a kvetkez fggetlensg esetn rvnyes tblt nyerjk:Beosztottak Alapfok Kzpfok Felsfok108 84 108 300

Kzp-vezetk43,2 33,6 43,2 120

Fels vezetk28,8 22,4 28,8 80 180 140 180 500

Az albbi tblzatokban a relatv (szzalkos) megoszlsokat is kiszmtottuk vzszintesen is, fgglegesen is. A msodik tblzatsorban a fggetlensg tartalma jl lthat, az els tblzatsorban viszont jl lthat hogy az eredeti adatok nem mutatnak fggetlensget a kt ismrv kztt.A K F Beoszt 160 80 60 300 rtkek 108,0 84,0 108,0 300,0 K. vez 10 40 70 120 Fels v. 10 20 50 80 180 140 180 500 53,3 26,7 20,0 100,0 % 8,3 33,3 58,3 100,0 % 36,0 28,0 36,0 100,0 12,5 25,0 62,5 100,0 36,0 28,0 36,0 100,0 88,9 57,1 33,3 60,0 % 5,6 28,6 38,9 24,0 % 24,0 24,0 24,0 24,0 5,6 14,3 27,8 16,0 100 100 100 100

f* A K F

43,2 33,6 43,2 120,0

28,8 22,4 28,8 80,0

180 140 180 500

36,0 28,0 36,0 100,0

36,0 28,0 36,0 100,0

36,0 28,0 36,0 100,0

60,0 60,0 60,0 60,0

16,0 16,0 16,0 16,0

100 100 100 100

E.6.3. Az asszocici szorossgnak jellemzseA kt elmleti szls eset kztt van a sztochasztikus kapcsolat. A kapcsolat szorossgt a tnyleges gyakorisgoknak s a fiktv f* gyakorisgoknak az eltrseibl kiindulva lehet szmszersteni. Az els lps a Khi-ngyzet meghatrozsa: Khi-ngyzet: = 2 i j

(f

ij

f ij f ij*

* 2

)

n ( s 1) ahol s a sorok s az oszlopok szma kzl a kisebbik. C rtkre: 0 1 Ez a mutatszm azt fejezi ki, hogy milyen szoros a kt ismrv kztt a kapcsolat: mennyire esnek tvol a tnyleges gyakorisgok a fggetlensg esetn rvnyes (elmleti) gyakorisgoktl.PLDNKBAN C rtke 0,486-nek addik, ami kzepesen ers kapcsolatnak nevezhet.

Cramer egytthat:

C=

2

41

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

42

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

E.7. Vegyes kapcsolatE.7.1. AlapfogalmakEgy minsgi s egy mennyisgi ismrv kzti kapcsolat a vegyes kapcsolat. A minsgi ismrv ltalban csoportost ismrvknt szolgl. A csoportost ismrv hatst vizsgljuk a mennyisgi ismrvre. A csoportost ismrv hatst a csoporttlagok eltrsvel lehet jellemezni, azaz a rsztlagok szrsval ill. szrsngyzetvel. Innen kiindulva a krds gy is fltehet, hogy az adatok teljes szrdsn bell vajon mekkora a csoportkpz ismrv hatsa, s mekkora az egyb tnyezk. Minl jobban szrdnak a rsztlagok, s minl kevsb szrdnak az adatok egy-egy csoporton bell, annl ersebb a csoportost ismrv hatsa. Ha a rsztlagok nem klnbznek egymstl, akkor azt mondhatjuk, hogy a csoportost ismrvnek nincs hatsa a mennyisgi ismrvre. Ha a rsztlagok klnbznek, de egy-egy csoporton bell minden adat azonos, akkor azt mondhatjuk, hogy a csoportost ismrv egyrtelmen (determinisztikusan) meghatrozza a mennyisgi ismrvet. A valsgos kapcsolatok tbbnyire a kt szls eset kztt helyezkednek el, ezek a sztochasztikus kapcsolatok.

PLDA: A kpzettsg egy gyakran hasznlt csoportost ismrv, s vizsglhatjuk, hogyan alakulnak a keresetek a klnbz kpzettsgi csoportok szerint. Ha a kereseti tlagok minden csoportban azonosak lennnek, akkor ez azt jelenten, hogy kpzettsg nincs hatssal a keresetek alakulsra. A kt ismrv kztt ez esetben nincs kapcsolat. Ha viszont egy-egy csoporton bell azonos lenne minden kereset, de a csoportok klnbznnek egymstl, akkor azt mondhatnnk: a kpzettsg egyrtelmen meghatrozza a kereseteket. Ez a determinisztikus kapcsolat. A kt szls eset kztt helyezkedik el a sztochasztikus kapcsolat, ami azt jelenti, hogy a kt ismrv kztt van kapcsolat, de az nem egyrtelm. A rsztlagok szrsngyzett kls szrsngyzetnek is nevezik, mert nem tkrzi az adatoknak az egyes csoportokon belli szrdst. Ez utbbi a bels szrsngyzet

E.7.2 A H-ngyzet mutat felptseA csoportost ismrv hatsnak szmszerstshez a csoportok kztti s a csoporton belli szrsngyzetek hasznlhatk.

Egy adat eltrse a ftlagtl kt rszre bonthat: az adat eltrse a sajt csoporttlagtl, s a csoporttlag eltrse a ftlagtl Kplettel: xij x = (x ij x j ) + (x j x )ahol xij az i-edik eleme a j-edik csoportnak; x j a j-edik csoport tlaga (a j-edik rsztlag); pedig a ftlag. d = dB + dK 43

x

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

Egy hasonl sszefggs rhat fl az eltrsngyzetekre illetve a szrsngyzetekre:

(xj i

ij

x ) = (xij x j ) + n j (x j x )2 2 j i j

2

ahol x a ftlag, ami a rsztlagokbl is szmthat: x = Mindkt oldalt n-nel osztva:

1 nj x j . n j

(

)

(xj i

ij

x)

2

(x=j i

ij

xj )

2

n (xj

j

x)

2

n

n

+

j

n

A baloldalon a teljes szrsngyzet ll: 2 =

(xj i

ij

x)

2

n

2 A jobboldalon az els tag a bels szrsngyzet: B =

(xj i

ij

xj )

2

n2 B =

ami a csoporton belli j szrsok ismeretben gy szmthat: A jobboldali msodik tag a kls szrsngyzet: 2 n j (x j x ) j 2 K = n Azt kaptuk teht, hogy

1 n j 2j n j

(

)

2 = 2 + 2 B KAzaz: a teljes szrsngyzet felrhat a bels s kls szrsngyzet sszegeknt. Ha a kls szrsngyzetet a teljes szrsngyzethez viszonytjuk, akkor egy 0 s 1 kz es szmot kapunk, a H-ngyzet mutatt. Ez mr sszehasonltsra is alkalmas mutatszm, mert a konkrt ismrvektl, a mennyisgi ismrv mrtkegysgtl fggetlen, dimenzi nlkli szm. Ennek segtsgvel a H-ngyzet mutat kplete: 2 2 K K 2 H = 2 = 2 2 B + K rtelmezse: a csoportost ismrv ilyen arnyban magyarzza az ismrvek szrdst. Figyelem! A szmtsok sorn nem szabad elfeledkezni arrl, hogy a ftlag s a szrsngyzetek kpletei mindig slyozott tlagok!

Jellegzetes szls esetek a kls s a bels szrsngyzet, ill. a szrsngyzet-hnyados fogalmaival: Ha a csoporttlagok egyenlk, akkor a csoportost ismrv nem volt hatssal a csoporttlagra. A kt ismrv kztt teht nincs kapcsolat. Ekkor a kls szrsngyzet44

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

k2 = 0, s a teljes szrsngyzet egyenl a bels szrsngyzettel, teht a teljesszrsngyzet a csoportokon belli ingadozsbl szrmazik. Ennek megfelelen H 2 = 0. Ha a csoporttlagok klnbzk, teht k2 > 0, viszont minden csoporton bell egyforma adatok vannak, azaz a bels szrsngyzet nulla, b2 = 0, akkor determinisztikus a kapcsolat, mert a csoportost ismrv egyrtelmen meghatrozza az rtket. Ennek megfelelen H 2 = 1. A valsgos kapcsolatok tbbnyire a kt szls eset kztt helyezkednek el, s ilyenkor 0 < H 2 < 1.

PLDA Egy nemzetkzi turistacsoport tagjairl fljegyeztk, hny veg srt rendeltek egy ht alatt. Krds, mennyire fgg a srfogyaszts a nemzetisgtl. A csoportok j Nemzet Rendelsek (veg) ltszma (f) Angol 4 2 5 2 3 1 Nmet 10 15 14 13 14 15 15 12 13 15 14 2 Magyar 6 9 7 6 9 8 9 3A 20 turista rendels-tlaga (a ftlag) 10 veg, a szrsngyzet (a teljes szrsngyzet) 20,2. A rsztlagok s a csoporton belli szrsok ngyzetei:j 1 2 3 nj 4 10 6

xj3 14 8

2 j1,5 1,0 1,33

A kls szrsngyzet a ftlag s a rsztlagok ismeretben knnyen meghatrozhat: 2 n j (x j x ) 4 (3 10 )2 + 10 (14 10 )2 + 6 (8 10)2 2 K = j = = 19 n 20

A bels szrsngyzet rtke a csoporton belli 2 szrsngyzetek ismeretben gy j szmthat:1 1 n j 2j = 20 (4 1,5 + 14 1 + 8 1,33) = 1,2 n j A teljes szrsngyzet2 B =

(

)

2 2 2 T = K + B = 20,2

Ez megegyezik az alapadatok sszessgbl szmolt szrsngyzettel. A H2 szorossgi mutat a kls s a teljes a szrsngyzet hnyadosaknt szmthat: 2 2 H 2 = K = 2 K 2 = 0,941 (94,1 %), 2 B +K ami nagyon szoros kapcsolatot jelent. gy is fogalmazhatunk, hogy a nemzeti jelleg 94 %ban hatrozza meg a srfogyaszts alakulst.45

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

E.8. Korrelci, regressziE.8.1. A korrelci fogalmaA mennyisgi ismrvek kztti sztochasztikus kapcsolatok elemzsre sokkal bvebbek a lehetsgek, s ennl fogva sszetettebbek, mint az asszocicinl s a vegyes kapcsolatnl.A szls s kzbens esetek: a determinisztikus kapcsolat, a sztochasztikus kapcsolat s a kapcsolat hinya. A leginkbb kzenfekv szls eset a determinisztikus kapcsolat, ami a fggvnykapcsolatot jelenti. Az egyik ismrv (vltoz) brmely rtkhez a msik vltoz egy adott rtke tartozik. A sztochasztikus kapcsolat azt jelenti, hogy nincs egyrtelm fggvnykapcsolat a kt ismrv rtkei kztt, de fennll egy tendenciajelleg kapcsolat, mint pl. a testmagassg s a testsly kztt. Kt vltoz esetn ez jl szemlltethet pontdiagrammal. A kapcsolat hinya (korrellatlansg, ill. fggetlensg): amikor mr tendenciajelleg kapcsolat sem llapthat meg.

Kt alapvet feladat: A kt ismrv kzti kapcsolat tendencijt ler regresszis grbe meghatrozsa. (A sztochasztikus kapcsolat kzeltse egy determinisztikus kapcsolattal, egy fggvnnyel) A kapcsolat szorossgnak jellemzse egyetlen mrszmmal. (Mi itt csak a lineris a korrelcis egytthatt ismertetjk.)

E.8.2. A kovariancia (egyttingadozs) s a lineris korrelcis egytthatKpezzk az egyes sszetartoz x s y rtkek eltrst az x-tlagtl, ill. az y-tlagtl. A kt eltrst szorozzuk ssze. Minden egyes (x, y) rtkprra kiszmthat az eltrsszorzat, s a kovariancia nem ms, mint ezen eltrsszorzatok tlaga. 1 n C XY = xi x yi y n i =1

(

)(

)

Kifejezi a kt vltoz egytt-ingadozst, egyttes szrst. Rvidebben rva:C=

d

x

dy

n Kiszmthat az albbi mdon is 1 n C XY = xi y i x y; n i =1

C = xy x y

46

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

A kovariancia tulajdonsgai: Az eljele mutatja a kapcsolat irnyt. Az ismrvek fggetlensge esetn C = 0. (Megfordtva nem ll: ha C=0, akkor a kapcsolat korrellatlan, de nem felttlenl fggetlen, a fggetlensg szigorbb feltteleket jelent, mint a korrellatlansg, ennek matematikai httervel itt nem foglalkozunk) C abszolt rtke akkor maximlis, ha x s y kztt lineris fggvnykapcsolat ll fenn, ez esetben C max = x y egybknt C < x y A kovariancia x s y szempontjbl szimmetrikus: rxy = ryx . A kovariancia kzeli rokona a variancinak (szrsngyzetnek). A variancia a kovariancia specilis esetnek tekinthet: ha kovariancia kpletbe y helybe x-et runk, a variancia kplett kapjuk.

Mivel C mrtkegysg-fgg, ezrt clszer elosztani a maximlis rtkkel, s akkor egy eljeles mutatt kapunk: a lineris korrelcis egytthatt: C xy d xd y ; kiszmthat gy is: rxy = rxy = x y d x2 d y2 rtke (1) s 1 kz esik: 1 rxy 1

Az rxy a lineris kapcsolat szorossgt mri, ha teht 0-hoz kzel ll rtket mutat, akkor lehet, hogy lineris a kapcsolat, de gyenge; de az is lehet, hogy szoros a kapcsolat, de nem lineris.

E.8.3. A regresszis fggvny meghatrozsaA regresszis fggvny a sztochasztikus kapcsolathoz valamilyen rtelemben legkzelebb ll determinisztikus kapcsolat (azaz fggvnykapcsolat). Meghatrozsa trtnhet grafikusan, szemmrtk alapjn: a pont-diagramba berajzolunk egy jl illeszked grbt. tlagszmts segtsgvel: ha minden egyes x rtkhez tbb y rtk tartozik, akkor minden egyes x rtkhez hozzrendelhetjk az adott x-hez tartoz y-rtkek tlagt. Ez a pontsor a tapasztalati regresszis fggvny. Analitikus ton hatrozzuk meg a legjobban illeszked grbe egyenlett. A j illeszkedsnek tbbfle kritriuma is lehet: a leggyakrabban hasznlt, jl bevlt kritrium a legkisebb ngyzetek elve. A grbeilleszts analitikus meghatrozsnak menete: a) elszr egy fggvny tpus megvlasztsa (pl. lineris fggvny, hatvny fggvny, exponencilis fggvny) attl fggen, hogy mit sugall az bra, vagy ms elzetes informcik alapjn.) b) az adott tpus fggvny paramtereinek meghatrozsa a legkisebb ngyzetek mdszervel. c) Alkalmas mutatszm segtsgvel, (a pontoknak a regresszis fggvnytl val eltrseibl ill. az eltrsngyzetek sszegbl kiindulva) szmszerstjk az illeszkeds jsgt. 47

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

Ha esetleg gy ltjuk, hogy a megvlasztott fggvny nem illeszkedik elg jl, akkor egy msik fggvnnyel is prblkozhatunk, jbl vgig jrva a fent lert utat. Azutn egy msik, esetleg harmadik fggvny tpussal elvgzend az elbbi kt mvelet. d) A klnbz fggvny tpusok kzl a legjobban illeszkedt vlasztjuk.

A lineris regresszi fggvny meghatrozsa a legkisebb ngyzetek mdszere alapjn.Vegyk a megfigyelt x s y rtkek alapjn ksztett pontdiagramot. Olyan egyenest szeretnnk a ponthalmazra illeszteni, amely a lehet legkzelebb esik a pontokhoz. rjuk fl az egyenes egyenlett ltalnos alakban, az egyelre ismeretlen egytthatkat jelljk b0 -lal ill. b1 -gyel. y = b0 + b1 x

Az a krds most, mennyi legyen b0 s b1 rtke ahhoz, hogy az egyenes a tapasztalati pontokhoz a legkzelebb essen. rjuk fl az i-edik pont fggleges tvolsgt, eltrst az egyenestl, ezt a tvolsgot ei vel jellik e i = y i y i = y i b0 b1 x

rjuk fl az eltrsngyzetek sszegt

ei =1

n

2 i

:

ei2 = ( y i b0 b1 xi )i =1 i =1

n

n

2

Itt az x i , y i rtkek ismert, konkrt szmok, s a b 0 , b1 rtkek a vltozk. rtkket gy kell meghatroznunk, hogy a mdszere. Ennek felttele, hogy a

ei =1 n i =1

n

2 i

minimlis legyen. Ez a legkisebb ngyzetek ngyzetsszeg b0 szerinti s a b1 szerinti

e

2 i

derivltja nulla legyen. Ebbl a felttelbl kiindulva kapjuk (miutn a derivlst elvgeztk, a derivltakat 0-val egyenlv tettk, s nmileg trendeztk az egyenleteket), az gynevezett normlegyenleteket

yi = n b0 + b1 xii =1 i =1

n

n

y xi =1 i

n

i

= b0 xi + b1 xii =1 i =1

n

n

2

A normlegyenletekbl b0 s b1 rtknek meghatrozsra a kvetkez kpleteket nyerjk.

b1 =

d x d y d2 x

=

C xy 2 x

=

xy x y x2 x 2

b0 = y b1 x

A konkrt szmtsok vgezhetk a normlegyenletekbl kiindulva, de a vgs formulk szerint is, attl fggen, hogy milyen rszeredmnyek llnak rendelkezsre. 48

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

Az elbbi esetben a normlegyenletekbe behelyettestjk a szumms kifejezsek rtkt, ekkor egy nagyon egyszer egyenletrendszert kapunk, amelyekbl a b0 s b1 vltozk knnyen kifejezhetk. A b1 s az r lineris korrelcis egytthat kplete nagyon hasonl egymshoz, az sszefggs kztk a kvetkez: b1 = r x y

A b1 rtelmezse: ha az x ismrv egy egysggel vltozik, akkor az y tendenciaszeren b1 -gyel fog vltozni. A b0 rtelmezse: b0 az eredmnyvltoz tendenciaszer rtke, ha az x ppen 0. De lehet, hogy az adott sszefggsben nincs rtelme az x = 0 rtknek.A regresszi egyenlet arra is alkalmas, hogy adott x0 rtk ismeretben az y rtkre kvetkeztessnk.

E.8.4. Az illeszkeds jsga, ill. a kapcsolat szorossga.A determincis egytthat (D) s rtelmezse. A determincis egytthat tbbvltozs lineris regresszi esetn is alkalmazhat br mi itt csak az egyvltozs esettel foglalkozunk. Az i-edik pont (fggleges irny) eltrse az y rtkek tlagtl felbonthat kt rszre: a regresszis egyenes tvolsga az y tlagtl. az i-edik pont tvolsga a regresszis egyenestl (ezt jelltk ei -vel) Kpletben: yi y = ( yi y ) + ( yi yi )

Megmutathat, hogy hasonl alak marad az sszefggs az eltrsngyzetek sszegeire vonatkozan is (Ez kzvetlenl a normlegyenletekbl kvetkezik) .

( y

i

y ) = + ( yi y ) + ( yi yi )2 2 2 2

2

( y

i

y ) = ( yi y ) + ei2

A jobboldali utols tagot rezidulis (maradk) ngyzetsszegnek is nevezik. Az eltrsngyzetek sszegt SS-sel jellve (Sum of Square)SS t = SS r + SS e

ahol a t index a teljes eltrsngyzetsszegre utal, r a regresszis fggvny eltrsre utal az y tlagtl, e a pontoknak a regresszis fggvnytl val eltrseire. Ha mindkt oldalt osztjuk a pontok szmval, n-nel: 2 t2 = 2 + e r A teljes szrsngyzet kt sszetevje teht: 49

Kuti va Lipcz Gyrgy: Ler statisztika. Elmleti sszefoglalk

a regresszis fggvny pontjainak szrsngyzete (az y tlag krl), ez a regresszis szrsngyzet s a pontoknak a regresszis fggvny krli szrsngyzete, ez a rezidulis szrsngyzet Minl kevsb szrdnak a pontok a regresszis fggvny krl, annl kzelebb van a kt ismrv kapcsolata a determinisztikus kapcsolathoz, azaz a fggvnykapcsolathoz. Ez ms