Download - Csehzabradi Statisztika Peldatar
-
8/19/2019 Csehzabradi Statisztika Peldatar
1/13
1
P É L D A T Á R(A zárójelben levő számok az elméleti összefoglaló fejezeteire utalnak)
1. feladat (1.2) 50 hallgató vizsgatesztjének eredménye (pontokban megadva)
63 57 63 69 53 63 79 68 51 6172 57 71 65 67 64 51 58 64 5258 66 63 64 65 58 64 67 57 7069 57 65 64 86 58 66 84 70 5976 64 71 75 79 59 67 66 65 51
Feladat : Alkalmas osztályszélesség megválasztásával készítsük el az adatok gyakoriságieloszlását, tapasztalati eloszlásfüggvényét!
Megoldás: 50 adatnál általában 7 – 10 osztályt célszerű létrehozni.A legnagyobb mintaelem: 86
A legkisebb mintaelem: 51Az osztályszélességet célszerű 5-nek választani és az alábbi osztályokat létrehozni:
50 – 54: 5 55 – 59: 10 60 – 64: 11 65 – 69: 1370 – 74: 5 75 – 79: 4 80 – 84: 1 85 – 89: 1
Gyakorisági eloszlás táblázattal:OH: osztályhatárVOH: valódi osztályhatárOK: osztályközépf i: osztály gyakoriságr i: relatív gyakoriság: (f i / n)
OH VOH OK f i ri ri (%)50 – 54 49,5 – 54,5 52 5 0,1 1055 – 59 54,5 – 59,5 57 10 0,2 2060 – 64 59,5 – 64,5 62 11 0,22 2265 – 69 64,5 – 69,5 67 13 0,26 2670 – 74 69,5 – 74,5 72 5 0,1 1075 – 79 74,5 – 79,5 77 4 0,08 880 – 84 79,5 – 84,5 82 1 0,02 285 – 89 84,5 – 89,5 87 1 0,02 2
Összesen n = 50 1 100
Forrás: http://www.doksi.hu
-
8/19/2019 Csehzabradi Statisztika Peldatar
2/13
-
8/19/2019 Csehzabradi Statisztika Peldatar
3/13
3
c.) Kumulatív gyakoriságA relatív gyakoriságok fokozatos összegzésével nyert gyakoriság a kumulatív
gyakoriság.Táblázattal:
Értékek Kumulatív gyakoriság Kumulatív relatív gyak (%)
54 alatt 5 1059 alatt 15 3064 alatt 26 5269 alatt 39 7874 alatt 44 8879 alatt 48 9684 alatt 49 9889 alatt 50 100
A kumulatív gyakoriságok grafikus ábrázolásával nyerjük a tapasztalati eloszlásfüggvényt.
2. feladat (1.3) Határozzuk meg az 1. feladat adatainak
D6 decilisét K 1 kvartilisét!Az 1. feladatban megadott gyakorisági eloszlás D6 decilise az adatok tengelyén az az
érték, amelyben a tengelyre emelt merőleges a hisztogram területét 6/10 : 4/10 = 3 : 2arányban osztja. Ha 1 adatot 1 egységnek veszünk, a hisztogram területe 50 egység lesz.
20:305
502:
5
50 ·32:3 =⋅= .
Az első három oszlop összterülete: T1 + T
2 + T
3 =5 + 10 + 11 = 26 egység, a negyedik
oszlop 13 egységnyi területéből 30 – 26 = 4 egység kell. Jelöljük a 4 egységnyi területűoszlop szélességét x-szel: x = D6 – 64,5.
Forrás: http://www.doksi.hu
-
8/19/2019 Csehzabradi Statisztika Peldatar
4/13
4
x : (69,5 – 64,5) = 4 : 13x = (5⋅4)/13 = 20/13 = 1,54D6 = 64,5 + x = 64,5 +1,54 = 66,04.
Hasonlóan számolható a K 1 kvartilis:
A hisztogram területe 50 egység. A K 1 – ben emelt merőleges ezt a területet: 3:143:
41 =
arányban osztja. 37,5:12,54
503:4
503:1 =⋅= . Az első oszlop területe 5 egység, tehát a
második oszlop 10 egységnyi területéből 12,5 – 5 = 7,5 egység kell. Jelöljük a 7,5 egységnyiterületű oszlop szélességét x-szel:
x = K 1 – 54,5x : (59,5 – 54,5) = 7,5:10x = (5 ⋅ 7,5) / 10 =3,75K 1 = 54,5 + 3,75 = 58,25.
3. feladat
Határozzuk meg az 1. feladatban megadott adatok mediánját, módusát, átlagát a gyakoriságieloszlás felhasználásával.
Modusz (2.1)A legnagyobb gyakoriságú osztály osztályközepe: Mo = 67
Medián (2.2)A definíció szerint Q5 kvantilis, de Q5 = D5 C50 = K 2. Az M mediánt a gyakorisági
eloszlás 50 egységnyi területéből az 50 ⋅ 0,5 = 25 egységet lemetsző egyenes metszési pontjaként kapjuk az adatok tengelyén. Az első két oszlop területe: T1 + T2 = 5 + 10 =15 egység, tehát a harmadik oszlop 1 egységnyi területéből 25 – 15 = 10 egység kell.Jelöljük a 10 egységnyi területű oszlop szélességét x-szel.
x = M – 59,5x : (64,5 – 59,5) = 10 : 11x = 50/11 = 4,54M = 59,5 4,54 = 60,4.
Átlag (2.3) számítása a 10 osztály adataiból:
4,6450
322050
871821774725671362115710525
10
1 ==⋅+⋅+⋅+⋅+⋅+⋅+⋅+⋅== ∑=n
y f x i ii
4. feladat
Határozzuk meg az 1. feladatban megadott adatok mediánját, módusát, átlagát osztályba sorolás nélkül.
Modusz (2.1): Mo = 64.Medián (2.2): A nagyság szerint sorba rendezett adatok közül a középső adat. Mivel azadatok száma páros (n = 50), ezért a két középső adat számtani közepe:
64.2
64642
xxM 2625 =+=+=
Forrás: http://www.doksi.hu
-
8/19/2019 Csehzabradi Statisztika Peldatar
5/13
5
Átlag (2.3):
64,6250
3231
50
x
x
10
1ii
==
∑
= = .
5. feladat Határozzuk meg az 1. feladatban a gyakorisági eloszlással megadott minta terjedelmét,interkvartilisát, szórását, a variációs együtthatóját.
Terjedelem (3.1): Mivel a minta gyakorisági eloszlással adott a terjedelem a valódi felsőosztályhatár és a legkisebb osztály valódi alsó osztályhatárának a különbsége.
T = 89, - 49,5 = 40.
Interkvartilis (3.2): IF = (K 3 – K 1)/2.A második feladatból K 1 = 58,25. A K 3-at hasonlóan számítva K 3 = 78,92.Így IF = (78,92 – 58,25)/2 = 15,67/2 = 7,835.
Szórás (3.3):
( )
11
22
−
⋅−=
∑=
n
xn y f s
k
iii
x A harmadik feladatból: 64,4x = .
A számítást segítő táblázat: (y i az i-edik osztályközép) yi f i yi
f i ⋅ yi
2
52 5 2704 1352057 10 3249 32490
62 11 3844 4228467 13 4489 5835772 5 5184 2592077 4 5929 2371682 1 6724 672487 1 7569 7569
Összesen: f i = 50 yi = 39692 f i⋅yi2 = 210580
8,149
64,450210580 2=
⋅−= x s .
Variációs együttható (3.4):
0,1258.64,4
8,1
x
xsxV ===
A minta változékony!
Forrás: http://www.doksi.hu
-
8/19/2019 Csehzabradi Statisztika Peldatar
6/13
-
8/19/2019 Csehzabradi Statisztika Peldatar
7/13
7
Táblázat a korrelációs koefficiens meghatározásához (5.2): x i yi ui vi ui
2 vi
2 ui vi
84 109 -16 -1 256 1 16108 113 8 3 64 9 2499 99 -1 -11 1 121 11
120 134 20 24 400 576 480114 121 14 11 196 121 15499 102 -1 -8 1 64 8
108 111 8 1 64 1 8105 105 5 -5 25 25 -25114 119 14 9 196 81 126111 110 11 0 121 0 0
Σui Σvi Σui 2
Σvi 2
Σui vi
62 23 1324 999 802
Előbb kiszámoljuk az átlagokat:
6,210
62
n
uu i ==
∑= 106,2u100x =+=
2,310
23
ni
vv ==
∑= 112,3v110y =+=
Majd a négyzetes közepeket:
( ) 939,66,2101394unuQQ 2210
1i
2
iux =⋅−=⋅−∑===
( ) 946,12,310999vnvQQ 2210
1i
2
ivy =⋅−=⋅−∑==
=
659,410
2362802
n
vu
vuQQ
10
1iii10
1iiiuvxy
=⋅
−=∑
−∑== ==
Tehát a korrelációs együttható értéke:
0,7946,1939,6
659,4
QQ
Q
QQ
Qr
vu
uv
yx
xy=
⋅==
⋅=
⋅
A korrelációs együttható értéke (0,7) hűen tükrözi a két változó kapcsolatát, amely közepeserősségű kapcsolatot jelez.
8. feladat A 7. feladatban bemutatott közepes erősségű kapcsolat a felvételi pontszám és a kreativitásközött szignifikáns-e?Eldöntése a korrelációs együtthatóra vonatkozó hipotézisvizsgálattal (7.3):
Nullhipotézis: ρ = 0, azaz az elméleti korrelációs együttható 0.Képezzük a t értéket:
2,770,71
80,7
r 1
2nr t
22 =−
⋅=−
−⋅=
5 %-os szinten (95 %-os biztonsággal számolva) a kritikus értéket táblázatból vévet 5% = 2,306.
Mivel a számolt t = 2,77 t 5% = 2,306 ez azt jelenti, hogy a kapcsolat 5 %-os szinten szignifikáns, azaz a két változó között kapcsolat van, azt nem a véletlen okozza.
Forrás: http://www.doksi.hu
-
8/19/2019 Csehzabradi Statisztika Peldatar
8/13
8
9. feladat
Határozzuk meg a 7. feladatban közölt adatok regressziós egyenesét (5.1)! A 7. feladatban kiszámolt értékek alapján számolhatjuk ki a lineáris regressziós egyenesegyenletét. Az együtthatók:
0,702939,6
659,4
Q
Q
ax
xy
=== 27,37112,30,702106,2xay b =⋅−=⋅−=
A lineáris regressziós egyenes egyenlete tehát: y = 0,702⋅ x + 27,37 .A két változó között pozitív irányú kapcsolat van, mivel az x változó (felvételi pontszám)értékének növekedésével az y változó (kreativitás) értéke is növekszik.
10. feladat
Egymintás t-próba (7.1)Véletlenszerűen kiválasztott 10 db 1 kg-os kenyeret dekagrammos pontossággal mértünk le.
Feltételezhetjük-e, hogy a véletlen okozza az eltérést, vagy az adagoló rendszer hibája? A mérés eredménye:
Kenyér sorszáma x i x i
1 98 96042 101 102013 97 94094 99 98015 101 102016 100 100007 98 96048 99 98019 99 9801
10 96 9216Σ x i = 988 Σ x i
2 = 97638
Alkalmazzunk t-próbát !A minta elméleti várható értéke: 100 dag (dkg).A nullhipotézis: µ = 100.
98,810
988
n
x
x
10
1ii
==
∑
= =
( ) 24976149763898,81097638xnxQ 2210
1i
2
ix =−=⋅−=⋅−∑==
1,632,669
24
1n
Qs xx
===−
=
2,33
10
1,63
10098,8
n
s
μxt =
−=
−=
A t táblázat értéke f = 9 szabadsági foknál 95 % biztonsági szinten t 95 = 2,262. 95%-os biztonsággal állíthatjuk, hogy szignifikáns az eltérés, nem a véletlen okozza ezt, az adagoló
rosszul van beállítva.
Forrás: http://www.doksi.hu
-
8/19/2019 Csehzabradi Statisztika Peldatar
9/13
9
11. feladat
u-próba (7.2) Adott egy gép, amely 80 mm hosszúságú huzalokat vág le. A gép „tévedése” szórása ± 2 mm.
Mintavételezés eredménye n = 30 adatból 78mm x = . A minta eltér a várható értéktől. Anullhipotézis µ = 80 mm. Feltételezhetjük-e, hogy az eltérés nem jelentős, azaz a véletlenokozza?
n = 30 µ = A = 80 σ = 2 78= x
5,485,482
230
2
8078n
σ
Axu −=⋅
−=⋅
−=⋅
−=
1,96u6u95 =>=
A feltevést 95 %-os biztonsági szinten elvetjük (99,9 %-os biztonsági szinten is). A gép beállítást igényel.
12. feladat
F-próba (7.4) Kétmintás t-próba (7.5) A gyermekek szókincsének fejlődését vizsgálták egy speciális személyiségteszt értékpontjaival. A véletlenszerűen kiválasztott 2 mintacsoport 8 fő két és féléves gyermekből és 10 fő hároméves gyermekből állt. Jelentősen magasabb-e a pontértéke, aktív szókincse a 3 éves
gyermeknek, mint a fiatalabbnak? Sorszám 2,5 éves csoport 3 éves csoport
x i x i
yi yi
1 27 729 50 25002 44 1936 33 10893 35 1225 43 1849
4 37 1369 61 37215 56 3136 25 6256 19 361 51 26017 32 1024 38 14448 45 2025 41 16819 35 122510 27 729
Σ x i = 295 Σ x i 2 =11805 Σ yi = 404 Σ yi
2 = 17464
Az összehasonlításra majd kétmintás t-próbát alkalmazunk.Az alkalmazás feltétele:
a.)
csoportok függetlensége (mintavétel biztosítja); b.) adatok normalitása (feltételezzük);c.) szórások megegyezése (F-próba).
F-próba a szórások egyenlőségére. Nullhipotézis a két minta szórása egyenlő.
36,98
295
n
xx i ==
∑=
( ) ( ) 912,136,9811805xnxQ 222
ix =⋅−=∑ ⋅−=
130,3
7
912,1
1n
Qs x2
x ==
−
=
Forrás: http://www.doksi.hu
-
8/19/2019 Csehzabradi Statisztika Peldatar
10/13
10
40,410
404
n
yy i ==
∑=
( ) ( ) 1142,440,41017464ynyQ 222
iy =⋅−=∑ ⋅−=
126,991142,41n
Qs y2y ==
−=
( ) 1,027126,9
130,3
s
sF 2
y
2
x7,9 === .
A nagyobbik szórásnégyzetet osztottuk a kisebbik szórásnégyzettel, avagy a szórást aszórással. Az F indexében a számláló és nevező szabadsági fokát tüntettük fel. Az F-eloszláskritikus értékei a p szignifikancia szinten p/2 valószínűségnél találhatók a táblázatban. Azaz 5% értéknél a 2,5 % melletti érték keresendő.
F (7,9)tábl,95 = 4,20
F (7,9)tábl,95 = 4,20 > F (7,9) számított = 1,027.Tehát a két szórás közti különbség 95 % biztonsággal nem szignifikáns. Nincs eltérés.
Kétmintás t-próba:Mivel az F-próba a szórások egyezését bizonyította, ebből az átlagok egyezőségére iskövetkeztethetünk.
0,650,225128,4
3,5
10
1
8
1
16
1142,4912,1
40,436,9
m
1
n
1
2mn
QQ
yxt
yx
−=⋅
−=
+⋅+
−=
+⋅−+
+
−=
A t-táblázatban f = n +m – 2 = 16 szabadsági foknál 5%-os szignifikancia szinten a kritikus
érték t 16 táblázat, 95% = 2,12 > t számított = 0,65. A hipotézis teljesül, azaz ezen teszt alapján nincsszignifikáns különbség 95%-os biztonsági szinten a két gyermekcsoport aktív szókincseközött.A t-táblázatot vizsgálva, csak 30%-os biztonsági szinten tételezhető fel számottevőkülönbség. Ez a szint azonban nem elfogadható!
13. feladat (8.1) A testnevelés szakkollégiumba felvett 42 hallgató közül 18 fiú és 24 lány. Levonható-e ennekalapján az a következtetés, hogy a lányok aránya más szakkollégiumban is nagyobb?A probléma a fiúk és lányok eloszlásának vizsgálatát jelenti.
A nullhipotézis H0 : p = P(F) = P(L) = 0,5.H0 vizsgálatára χ2 –próbát alkalmazunk.
Az alkalmazás feltétele: N⋅ p ≥ 5 és N⋅(1-p) ≥ 5 teljesül, mert 42⋅0,5 > 5. n1 = 18.
( )( )
( )0,86
10,5
9
0,50,542
0,54218
p1 p N
p Nnχ
22
12 ==⋅⋅
⋅−=
−⋅⋅
⋅−= .
2 értéke 5%-os szignifikancia szinten f = 1 szabadsági fok mellett χ 2 95, táblázat = 3,841. Mivel χ2 szám = 0,86 χ
2 95, táblázat = 3,841. A nullhipotézist megtartjuk, azaz a lányok aránya
nem szignifikánsan különböző.
Forrás: http://www.doksi.hu
-
8/19/2019 Csehzabradi Statisztika Peldatar
11/13
11
14. feladat (8.2) Különbözőségre vonatkozó vizsgálat (homogenitás-vizsgálat).66 véletlenszerűen kiválasztott főiskolai hallgató fizikai állóképességét a következőúgynevezett kontingencia táblázat mutatja:
Fizikai állóképesség Együttmegfelelt nem felelt meg
Férfi 30 10 40Nő 15 11 26
Összesen 45 21 66
Előbbi adatok alapján különbözőnek tekinthető-e a nők és a férfiak között azok aránya, akikmegfelelő állóképességgel rendelkeznek.Végezzük el a változók kétértékű χ2 próbáját!
Nullhipotézis: a nemek közötti fizikai állóképesség aránya azonos.
Alkalmazás feltétele:(a1 + b1) ⋅ (a2 + b2) > 5 ⋅ n és (a1 + a2) ⋅ (b1 + b2) > 5 ⋅ n(30 + 10) ⋅ (15 + 11) > 5 ⋅ 66 és (30 + 15) ⋅ (10 + 11) > 5 ⋅ 66
teljesül.
( )( ) ( ) ( ) ( )
( )2,18
982800
18066
21452640
1510113066
b baa ba ba
a b banχ
22
21212211
2
21212 =⋅
=⋅⋅⋅
⋅−⋅⋅=
+⋅+⋅+⋅+
⋅−⋅⋅= ,
amely 1 szabadsági fokú 2 eloszlást követ. Táblázatból 95%-os biztonsági szinten, 2 kritikus értéke 1 szabadsági foknál: χ 2 95, táblázat = 3,841.Mivel χ2 szám = 2,18 χ
2 95, táblázat = 3,841. A nullhipotézist megtartjuk, szignifikánsan nincs
különbség férfiak és nők közt abban, hogy az állóképességük megfelelő-e a főiskolaihallgatók populációjában.
15. feladat (8.3)Véletlenszerűen kiválasztott főiskolai hallgatók közül néhányan 1 hónapig anyanyelvikörnyezetben tanultak idegen nyelvet. A nyelvvizsga eredményét az alábbi táblázat mutatja:
Nyelvvizsga eredménye Együttmegfelelt nem felelt meg
Anyanyelvikörnyezetben tanult
igen 50 10 60nem 20 15 35
Együtt 70 25 95
Van-e kapcsolat a tanulási módszer és az eredményesség között? Nullhipotézis: a két csoportban a megfeleltek aránya azonos. Nincs kapcsolat a tanulásimódszer és az eredményesség között, azaz függetlenek.Végezzük el a változók kétértékű χ2 próbáját ! (8.3)Alkalmazás feltétele:
(a1 + b1) ⋅ (a2 + b2) > 5 ⋅ n és (a1 + a2) ⋅ (b1 + b2) > 5 ⋅ n(50 + 10) ⋅ (20 + 15) > 5 ⋅ 95 és (50 + 20) ⋅ (10 + 15) > 5 ⋅ 95
teljesül.
Forrás: http://www.doksi.hu
-
8/19/2019 Csehzabradi Statisztika Peldatar
12/13
12
( )( ) ( ) ( ) ( )
( )7,8
3675000
28737500
25703560
2010155095
b baa ba ba
a b banχ
2
21212211
2
21212 ==⋅⋅⋅
⋅−⋅⋅=
+⋅+⋅+⋅+
⋅−⋅⋅= ,
amely 1 szabadsági fokú 2 eloszlást követ. Táblázatból 95%-os biztonsági szinten, 2 kritikus értéke 1 szabadsági foknál: χ 2 95, táblázat = 3,841.
Mivel χ2 szám = 7,8 χ2 95, táblázat = 3,841 az anyanyelvi közegben végzett nyelvtanuláshatékonysága (83%-os sikeres vizsgaeredmény) áll fenn, azaz a nullhipotézist elvetjük, vagyisnincs függetlenség a tanulási módszer és az eredményesség között.A kapcsolat szorosságát kifejezi az asszociációs együttható is:
0,58950
550
20101550
20101550
ba ba
ba baψ
1221
1221==
⋅+⋅
⋅−⋅=
+
−= .
Másrészt szintén a kapcsolat szorosságát mutatja a kontingencia együttható:
0,8n
χ 2==ϕ .
A kapcsolat fennáll, azonban a ψ és ϕ viszonylag alacsony értékéből laza szorosságrakövetkeztethetünk. Azaz nincs szoros kapcsolat a tanulási módszerek és az eredményességközött csak hatásos az anyanyelvi környezetben töltött időszak.
16. feladat
Megváltozás vizsgálat (8.4) Egy adott iskola 4. osztályaiban nyári szünidő előtt és után mérték az erőnlétet egy pontrendszer alapján. Eredmények:
Erőnlét tanév elejénmegfelelő nem megfelelő Összesen
Erőnlét tanévvégén megfelelő 25 45 70nem megfelelő 8 22 30Összesen 33 67 100
Változott-e a gyerekek erőnléte? Végezzük el a változók kétértékű χ2 próbáját a megváltozás vizsgálatára!
Nullhipotézis: az eloszlás mindkét helyzetben ugyanaz.Alkalmazás feltétele:
b1 + a2 ≥ 10 45 + 8 ≥ 10
( ) ( )25,8
845
845
2a1 b
2a1 b
χ
22
2=
+
−=
+
−= , amely 1 szabadsági fokú χ2 eloszlást követ. A
táblázatból vett kritikus érték 99%-os biztonságnál: χ2 99, táblázat = 6,635. Mivel χ2 szám = 25,8
χ
2 99, táblázat = 6,635, ezért jelentős megváltozás történt az erőnlétben a nyári szünidő alatt, az
adatokat vizsgálva romlott a gyerekek erőnléte.
17. feladat (9.1) Becslés: Az iskola 4. osztályos tanulóinak magasságátlagát kell megbecsülnünk. Válasszunk ki véletlenszerűen 10 tanulót.Magasságértékek (cm-ben): 145, 155, 138, 155, 144, 146, 142, 151, 140, 136.
A minta jellemzői:
Forrás: http://www.doksi.hu
-
8/19/2019 Csehzabradi Statisztika Peldatar
13/13
13
145,210
1452x ==
( )6,68
9
401,6
1n
xnxs
22
i==
−
∑ ⋅−= .
A t értéke 95%-os megbízhatósági szinten f = n – 1 = 9 szabadsági foknál t 95, táblázat = 2,262.
A tanulók átlagos testmagassága µ 0,95 valószínűséggel
9
6,682,262145,2μ
9
6,682,262145,2 ⋅+≤≤⋅−
150,2μ140,2 ≤≤ intervallumba esik.A minta elemszámának növelésével az intervallum szélessége csökken.
18. feladat (9.2) Egy alkatrész hosszát szeretnénk megbecsülni.
A mintavételezés eredménye n = 16 mérésből x = 66 mm. A mérőeszköz szórása ± 2 mm. Avárható érték nagysága 95%-os megbízhatósági szinten:
n
σuxμn
σux p p
⋅+≤≤⋅−
16
21,9666μ
16
21,9666 ⋅+≤≤⋅−
66,98μ65,02 ≤≤ .Látható, hogy a minta szélessége elemszámának növelésével a várható érték intervallumánakszélessége csökken.
Összeállította: Dr. Cseh Sándorés Zábrádi Antal
Forrás: http://www.doksi.hu