statistika 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. ·...
TRANSCRIPT
![Page 1: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/1.jpg)
STATISTIKA
5. predavanje
Doc.dr. Tadeja Kraner Šumenjak
![Page 2: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/2.jpg)
PORAZDELITVE VZORČNIH
STATISTIK
Imejmo vzorec velikosti n. Na tem vzorcu ima
spremenljivka X vrednosti: x1, x2,…, xn.
Vzorčna statistika je poljubna funkcija
vzorčnih vrednosti f(x1, x2,…, xn). Poznamo veliko
vzorčnih statistik: kvantili, mere sredine, mere
variabilnosti.
Nekatere vzorčne statistike so zelo pomembne.
![Page 3: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/3.jpg)
X je številska statistična spremenljivka, za katero sta
najpomembnejši vzorčni statistiki:
Vzorčna aritmetična sredina:
Vzorčni standardni odklon:
1
1 n
i
i
x xn
2 2
1
1( )
1 1
n
i
i
ns x x
n n
![Page 4: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/4.jpg)
Če za X privzamemo normalno porazdelitev
N(M, ), je ocena za M, s pa ocena za σ. To
spoznanje posreduje matematična statistika.
Posebno vlogo pri statističnem sklepanju ima z-
statistika
in t-statistika, ki je znana pod imenom
Studentova statistika
x
x Mz
n
x Mt
s
n
![Page 5: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/5.jpg)
Spomnimo se populacije vseh vzorcev velikosti n,
vemo da je ta številka lahko ogromna. Na vsakem
od teh vzorcev ima vzorčna statistika svojo
vrednost.
Vzorčni statistiki u priredimo slučajno
spremenljivko U, njeno poznavanje je potrebno
za sklepanje iz vzorca na populacijo.
Pogledali bomo verjetnostno porazdelitev za
nekaj najpomembnejših vzorčnih statistik.
![Page 6: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/6.jpg)
Porazdelitev vzorčnih aritmetičnih
sredin
IZREK
Če je slučajna spremenljivka X na populaciji
porazdeljena N(M,σ), potem je slučajna
spremenljivka na populaciji vseh vzorcev
velikosti n porazdeljena .
OPOMBA: ta izrek velja, ko gre za vzorčenje z
vračanjem enot. Razlika pa je zanemarljiva,če je
populacija zelo velika, zato v praksi ne ločujemo.
X
( , )N Mn
![Page 7: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/7.jpg)
Izrek nam pove, da so tudi aritmetične sredine vzorcev
z n elementi porazdeljene normalno. Ob tem sta
aritmetična sredina osnovne množice in aritmetična
sredina aritmetičnih sredin vzorcev enaki. Standardni
odklon porazdelitve aritmetičnih sredin je enak
kvocientu standardnega odklona osnovne statistične
množice in korena iz števila enot v vzorcu.
![Page 8: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/8.jpg)
CENTRALNI LIMITNI IZREK
Slučajna spremenljivka se pri velikih vzorcih porazdeljuje
približno normalno tudi tedaj, ko verjetnostna porazdelitev
slučajne spremenljivke X na osnovni populaciji ni normalna.
Centralni limitni izrek lahko uporabimo v praksi, če je velikost
vzorca večja od 30.
X
![Page 9: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/9.jpg)
Primer
Psihologi trdijo, da je v populaciji IQ porazdeljen normalno
N(100,15).
Tvorimo vzorce velikosti 4. Potem velja IQ (100,7,5).
115 100( 115) ( ) ( 2) 0,0228
7,5
2,3% vzorcev velikosti 4 ima vzorčno aritmetično sredino nad 115.
Tvorimo vzorce velikosti 25 in si zastavim
N
P IQ P Z P Z
o enako vprašanje.
![Page 10: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/10.jpg)
Primer
Iz populacije, ki je normalno porazdeljena M=50 in σ=10 so
vzorčili vzorce velikosti n=25. Pri kolikšnem odstotku vzorcev
lahko pričakujemo vrednosti aritmetičnih sredin med 48,2 in
51,7? V katerih mejah je 90 % vseh vrednosti?
![Page 11: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/11.jpg)
Porazdelitev t-statistik
Spoznali smo že dejstvo: če je ( , ), je ( , ).
XPosledično je spremenljivka Z= (0,1).
Če poznamo oba parametra normalne porazdelitve M in , iz vzorca velikosti
izračunamo x in nato vredno
X N M X N Mn
MN
n
n
st z-statistike:
x Z= .
M
n
![Page 12: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/12.jpg)
Angleški statistik W. Gosset, znan pod psevdonimom Student,
je v izrazu za z nadomestil parameter z njegovo vzorčno
oceno s in tako opredelil -statistiko:
x.
Ugotovil je, da se pri majhnih vzor
t
Mt
s
n
cih verjetnostna porazdelitev
t-statistike bistveno loči od standardizirane normalne porazdelitve,
pri velikih vzorcih pa je ta porazdelitev zelo blizu standardizirane
normalne porazdelitve.
![Page 13: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/13.jpg)
Izrek Na populaciji vzorcev velikosti je slučajna spremenljivka
porazdeljena po Studentovi porazdelitvi z n-1 prostostnimi stopnjami.
Zapišemo T ( 1).
n
X MT
S
n
t SP n
![Page 14: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/14.jpg)
Lastnosti
Gostota verjetnosti za t-porazdelitev je po obliki
podobna gostoti verjetnosti za N(0,1). Funkcija je
zvezna, definirana na celotni realni osi. Je
simetrična okoli 0.
Parameter imenujemo stopnje prostosti, ki
določajo njeno obliko.
V limiti je Studentova porazdelitev enaka
standardizirani normalni porazdelitvi.
![Page 15: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/15.jpg)
Porazdelitev vzorčnih varianc
2
2 2
1
2
Naj bo ( , ). Zamislimo si, da na vsakem vzorcu
velikosti izračunamo vzorčno varianco :
1( ) .
1
Vsak vzorec generira svojo vrednost. Tem vrednostim
priredimo slučajno spremenljivko S .
n
i
i
X N M
n s
s x xn
Zanima nas njena
verjetnostna porazdelitev.
![Page 16: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/16.jpg)
Izrek
Slučajna spremenljivka X je porazdeljena normalno
s povprečno vrednostjo M in standardnim odklonom
σ. Na populaciji vzorcev velikosti n je porazdelitev za
S2 podana s -porazdelitvijo z n-1 prostostnimi
stopnjami:
2
2 2
2
1( 1)
nS SP n
![Page 17: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/17.jpg)
Lastnosti
Je zvezna porazdelitev, definirana na pozitivnem
delu realne osi.
Stopnje prostosti določajo obliko porazdelitve. Za
SP=1 in SP=2 ima posebno obliko.
Ko je SP majhno število, je porazdelitev
asimetrična v desno, ko se SP povečuje, se
asimetrija zmanjšuje.
S povečevanjem SP(gre proti neskončno), postaja
čedalje bolj podobna normalni porazdelitvi
N(SP,SP0.5).
![Page 18: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/18.jpg)
F-porazdelitev
Naj bosta X in Y neodvisni spremenljivki. Če je
spremenljivka X porazdeljena po zakonu 2(m) in
spremenljivka Y porazdeljena po zakonu 2(n),
je slučajna spremenljivka
ZnX
mY
porazdeljena po zakonu F(m, n).
Porazdelitev F(m, n) je določena z dvema prostostnima
stopnjama m in n.
![Page 19: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/19.jpg)
![Page 20: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/20.jpg)
OCENJEVANJE PARAMETROV-OCENJEVANJE
ARITMETIČNE SREDINE
Spomnimo se:
![Page 21: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/21.jpg)
Glivenkov izrek: Porazdelitvena funkcija vzorca
z naraščanjem števila enot v vzorcu z verjetnostjo
1 konvergira k porazdelitveni funkciji osnovne
statistične množice.
Navedeni izrek nam pove, da čim večje je število enot v
vzorcu, bolj je frekvenčna porazdelitev vzorca podobna
frekvenčni porazdelitvi osnovne statistične množice.
Zato se bosta pri dovolj velikem številu enot v vzorcu (n
je vsaj 100) aritmetična sredina in standardni odklon
vzorca le malo razlikovala od aritmetične sredine in
standardnega odklona celotne množice.
![Page 22: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/22.jpg)
S pomočjo dosedanjih ugotovitev določimo z vzorcem n
enot aritmetično sredino osnovne statistične množice.
To lahko naredimo na dva načina in sicer na osnovi:
•točkovne ocene
•intervalne ocene
•Za točkovno oceno je zaželena nepristranskost.
Ocena je nepristranska, če je povprečje vseh vzorčnih
ocen enako ocenjevanemu parametru. Zato je
je nepristranska ocena za M
je nepristranska ocena za
x
s
![Page 23: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/23.jpg)
Intervalna ocena parametra
Intervalna ocena parametra je t.i. interval zaupanja. To je
slučajni interval, vezan na pripadajoči slučajni vzorec.
Definicija:
1 2
1 2
Naj označuje parameter, ki ga ocenjujemo, vrednost
je vnaprej predpisana verjetnost, 0< 1. Interval (L , )
imenujemo interval zaupanja za parameter , če velja:
P(L < ) 1 .
L
L
V našem primeru
bo to M.
![Page 24: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/24.jpg)
Komentar
Standardne vrednosti, ki jih uporabljamo za
verjetnost α, so: 0,05, 0,01 ali 0,001. Verjetnost
1- α imenujemo zaupanje. Običajno zaupanje
izražamo v %, govorimo npr. o 95% zaupanju.
L1 oz. L2 je spodnja oz. zgornja meja intervala
zaupanja, L1 oz. L2 sta slučajni spremenljivki.
Pri vsakem vzorcu imata drugo vrednost. Vsak
slučajni vzorec generira svoj interval
zaupanja (l1,l2).
![Page 25: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/25.jpg)
V populaciji vseh vzorcev velikosti n je odstotek
intervalov, ki vsebujejo parameter Θ, enak
100(1-α).
Za posamezni interval zaupanja ne vemo, ali je
parameter Θ vsebovan v tem intervalu ali ne.
Trdimo lahko, da je ta interval z verjetnostjo (1-α)
eden tistih, ki vsebujejo parameter Θ.
![Page 26: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/26.jpg)
INTERVAL ZAUPANJA ZA POVPREČNO
VREDNOST
Ločimo:
Osnovna statistična množica porazdeljena
normalno po zakonu N(M, ) in je znana.
Osnovna statistična množica porazdeljena
normalno po zakonu N(M, ) in ni znana.
Veliki vzorci.
![Page 27: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/27.jpg)
•Ta situacija v praksi le redko nastopa, vendar je
zaradi konstrukcije intervala zaupanja najlažja.
•Izpeljava temelji
N(M, ) in je znana
2 2
Spoznali smo že dejstvo: če je ( , ), je ( , ).
XPosledično je spremenljivka Z= (0,1).
( ) 1
X N M X N Mn
MN
n
P z Z z
Z=1,96 pri 5% tveganju
![Page 28: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/28.jpg)
Širino tega intervala lahko zapišemo z obrazcem:
2 2
x z M x zn n
![Page 29: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/29.jpg)
Stopnja Delež v celotni populaciji
tveganja obeh osenčenih
delov
samo enega osenčenega
dela
5 % 0,05 0,025
1 % 0,01 0,005
0,01 % 0,001 0,0005
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
x
p(x)
Porazdelitev aritmetičnih sredin
vzorcev.
Pri 5 % tveganju ena osenčena površina
0,025-ti del celotne površine.
![Page 30: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/30.jpg)
Če iščemo 95% interval zaupanja za aritmetično
sredino populacije, tedaj s pomočjo tabel za
standardizirano normalno porazdelitev, določimo
vrednost za Z tako, da bo veljalo:
H(Z)=0,475
Z=1,96
Interval je z verjetnostjo 0,95 eden tistih, ki vsebuje
povprečno vrednost celotne populacije.
x
nM x
n196 196, , 5% tveganje
![Page 31: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/31.jpg)
Če iščemo 99% interval zaupanja za aritmetično
sredino populacije, tedaj s pomočjo tabel za
standardizirano normalno porazdelitev, določimo
vrednost za Z tako, da bo veljalo:
H(Z)=0,495
Z=2,58
pri 1% tveganju
nxM
nx 58,258,2
![Page 32: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/32.jpg)
Če iščemo 99,9% interval zaupanja za aritmetično
sredino populacije, tedaj s pomočjo tabel za
standardizirano normalno porazdelitev, določimo
vrednost za Z tako, da bo veljalo:
H(Z)=0,4995
Z=3,29
pri 0,1% tveganju
nxM
nx 29,329,3
![Page 33: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/33.jpg)
Primer
Izračunajmo 90% in 95% interval zaupanja za
povprečno maso zdravila v stekleničkah, pri čemer
je
1, 9 in 10,5.n x
![Page 34: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/34.jpg)
N(M, ) in ni znana
Standardni odklon ni podan, ampak ga ocenimo
iz podatkov. Interval zaupanja izpeljemo enako
kot pod prvo točko, le da standardizirano
normalno porazdelitev nadomesti Studentova
porazdelitev z n-1 prostostnimi stopnjami:
2 2
s sx t M x t
n n
Odčitaš pri (n-1) prostostnih
stopnjah.
![Page 35: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/35.jpg)
Veliki vzorci
Če so vzorci tako veliki, da velja centralni limitni
izrek, izračunamo interval zaupanja za
povprečno vrednost takole
2 2
s sx z M x z
n n
![Page 36: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/36.jpg)
PRIMER
Denimo, da želimo ugotoviti, s 5 % tveganjem,
povprečno maso 21 dni starih piščancev. V ta
namen smo, namesto vseh piščancev, stehtali
vzorec 105 piščancev in dobili frekvenčno
porazdelitev mas prikazano v preglednici:
Masa piščancev (g) Število piščancev
nad 550 do 580 2
nad 580 do 610 8
nad 610 do 640 8
nad 640 do 670 18
nad 670 do 700 16
nad 700 do 730 20
nad 730 do 760 20
nad 760 do 790 8
nad 790 do 820 5
![Page 37: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/37.jpg)
Masa piščancev (g) fk xk fkxk f xk k
2
nad 550 do 580 2 565 1130 638450
nad 580 do 610 8 595 4760 2832200
nad 610 do 640 8 625 5000 3125000
nad 640 do 670 18 655 11790 7722450
nad 670 do 700 16 685 10960 7507600
nad 700 do 730 20 715 14300 10224500
nad 730 do 760 20 745 14900 11100500
nad 760 do 790 8 775 6200 4805000
nad 790 do 820 5 805 4025 3240125
Skupaj 105 73065 51195825
x
nf xk k
1 73065
105695 86,
95,57
15,335886,695105
511958251
2
2222
ss
xxfn
s kk
xs
nM x
s
n196 196, ,
105
95,5796,186,695
105
95,5796,186,695 M
![Page 38: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/38.jpg)
![Page 39: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/39.jpg)
Primer
Izračunajmo 95% in 99% interval zaupanja za
povprečno oceno na kolokviju.
Dani so rezultati za vzorec:
12,45,23, 67, 68,90, 34,0, 45,77.
![Page 40: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/40.jpg)
Primer
Z vzorcem 150 zabojev smo dobili naslednje podatke:
Z 1 % tveganjem ocenite povprečni procent gnilega sadja v
osnovni množici. Pri tem predpostavite, da je standardni
odklon osnovne množice enak standardnemu odklonu
vzorca. Nalogo rešite tudi brez te predpostavke. Narišite
še gornjo frekvenčno porazdelitev!
% gnilega sadja število zabojev
do 1
nad 1 do 3
nad 3 do 6
nad 6 do 10
nad 10 do 15
59
43
26
17
5
![Page 41: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/41.jpg)
SKLEPI
Na širino intervala vpliva:
-zaupanje
-variabilnost proučevane spremenljivke, ki jo
izraža s
-število enot v vzorcu
Če želimo, da se širina prepolovi moramo, moramo
zvečati število enot v vzorcu vsaj za 4-krat.
V izrazu za odklon je izraz
s
nStandardna
napaka ocene.
![Page 42: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/42.jpg)
PARAMETRIČNI PREIZKUSI ZNAČILNOSTI
Parametrični preizkusi značilnosti so
namenjeni testiranju parametričnih hipotez,
to je domnev o vrednosti neznanih parametrov
statistične spremenljivke X. Na primer praviloma
testiramo ničelno hipotezo H0, ki pravi, da je
parameter q=q0, proti alternativni hipotezi H1, ki
pravi q≠q0 , na stopnji značilnosti testa α. Na
osnovi tega pri preizkusu značilnosti ničelno
hipotezo H0:
bodisi zavrnemo,
bodisi ne zavrnemo.
![Page 43: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/43.jpg)
V prvem primeru rečemo, da med hipotetičnimi in eksperimentalnimi podatki obstaja značilna razlika (ali razlika je signifikantna) in hipotezo H0 zavrnemo.
V drugem primeru pa razlika med hipotetičnimi in eksperimentalnimi vrednostmi ni značilna oz. ni statistično pomembna, zato hipoteze H0 ne zavrnemo.
Pri testu značilnosti lahko naredimo samo t.i. napako prve vrste, to pomeni, da smo zavrnili pravilno hipotezo H0. Verjetnost za to napako je predpisana, s stopnjo značilnosti α in znaša običajno 0,05 ali 0,01.
![Page 44: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/44.jpg)
ZAPOMNI SI:
Pri preizkusu značilnosti H0 proti H1 , ničelno
hipotezo H0 ali zavrnemo (torej sprejmemo H1) ali o
njej ne odločimo!
![Page 45: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/45.jpg)
PARAMETRIČNI PREIZKUSI ZNAČILNOSTI POTEKAJO VEDNO NA
NASLEDNJI NAČIN:
1. Postavimo ničelno in alternativno hipotezo. Opravka imamo
bodisi z dvostranskim testom
H0 (q=q0) proti H1 (q≠q0)
bodisi z enim od enostranskih testov
H0 (q=q0) oz. H0 (q≤q0) proti H1 (q>q0),
H0 (q=q0) oz. H0 (q≥q0) proti H1 (q<q0).
2. Izberemo stopnjo značilnosti testa α (običajno 0,05 ali 0,01).
3. Glede na velikost vzorca ali obravnavanega problema izberemo primerno testno statistiko U.
![Page 46: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/46.jpg)
4. Glede na porazdelitev statistike U in
parameter α določimo kritično območje testa w0,
to je podmnožica realnih števil izbrana tako, da
je verjetnost dogodka, da ob pravilni hipotezi H0
vrednost testne statistike U leži v njej, manjša
ali enaka α.
5. Izračunamo eksperimentalno vrednost testne
statistike ue. Če ue pripada w0, potem hipotezo
H0 zavrnemo. Če ue ≠w0, potem hipoteze H0 ne
zavrnemo.
![Page 47: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/47.jpg)
KOMENTAR
Če pade izračunana vrednost za testno statistiko
zunaj 95% intervala, potem ničelno hipotezo pri
5% tveganju zavrnemo, čeprav je gotovo, da v 5%
vseh primerov neizbežno pade ven (napaka prve
vrste).
Kritično območje testa
![Page 48: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/48.jpg)
Zakaj ne sprejmemo ničelne hipoteze?
Zagrešimo pa lahko še eno napako, sprejmemo
ničelno hipotezo, ko je napačna. Verjetnost za to
napako ne poznamo. Tej napaki pravimo napaka
druge vrste. To pomeni, da drži ena od
alternativnih hipotez. To pomeni, da naša
izračunana vrednost pripada neki drugi vzorčni
distribuciji.
![Page 49: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/49.jpg)
TESTI, KI JIH BOMO OBRAVNAVALI:
Testiranje hipotetične aritmetične sredine (standardni odklon populacije je znan ali veliki vzorci
Testiranje hipotetične aritmetične sredine (mali vzorci)
Testiranje enakosti dveh aritmetičnih sredin (neodvisni vzorci)
Testiranje enakosti dveh aritmetičnih sredin (odvisni vzorci)
Analiza variance….
)s
![Page 50: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/50.jpg)
TESTIRANJE HIPOTETIČNE ARITMETIČNE
SREDINE (VELIKI VZORCI)
Primer
Stroj polni neko snov v stekleničke in sicer je
norma 50 mg na stekleničko. Zaradi slučajnih
vplivov odmerki nihajo. Privzeti smemo, da so
odmerki porazdeljeni normalno. Če stroj dela v
skladu s predpisi, za maso odmerka velja
Zanima nas ali je M=50mg?
mg)mg,X~N( 550
![Page 51: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/51.jpg)
Izvedemo naslednji postopek. S slučajno izbiro
izberemo določeno število steklenic v kontrolni
vzorec. Naj bo n=25. V vsaki steklenici stehtamo
odmerek in dobimo vzorčno aritmetično sredino .
Formuliramo dve hipotezi:
Ničelna: M=50
Alternativna:M≠50
Privzemimo, da poznamo standardni odklon
populacije =5.
x
H
H
MMH
MMH
:
:
1
0
![Page 52: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/52.jpg)
Preizkušanje statističnih domnev izhaja iz
predpostavke, da je ničelna domneva pravilna. Če je
to res je porazdelitev vzorčnih aritmetičnih sredin
v kontrolnih vzorcih velikosti 25 normalna, njeno
povprečje je 50mg, standardni odklon pa .
To porazdelitev imenujemo ničelna porazdelitev. Za
to porazdelitev velja: približno dve tretjini vzorcev
velikosti 25 ima med 49 in 51, približno 95%
vzorcev ima med 48 in 52. Če bi za določen vzorec
dobili 55, bi zagotovo zavrnili ničelno domnevo, ker
izjemno malo tvegamo, ko zavrnemo to hipotezo.
x
125
5
n
x
x
![Page 53: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/53.jpg)
Vnaprej določimo α, imenujemo tudi stopnja
značilnosti. Na osnovi α razdelimo vrednosti
za na dve območji:
Območje, kjer osnovno hipotezo zavrnemo.
Območje, kjer osnovno hipotezo obdržimo.
Vrednost, ki razločuje obe vrednosti se imenuje
kritična vrednost.
x
![Page 54: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/54.jpg)
n
Mxz H
H0 obdržimo H0 zavrnemo H0 zavrnemo
Kritična
vrednost
Za naš primer naj bo α=0,05. Kritična vrednost je z=1,96. Torej
ničelno domnevo obdržimo, če je v intervalu 50 1,96∙1mg.
Testno statistiko z izračunamo po formuli (standardizirana
normalna porazdelitev vzorčnih aritmetičnih sredin):
x
![Page 55: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/55.jpg)
Primer:
Poglejmo podatke iz enega kontrolnega vzorca:
Upoštevajmo, da je =5mg.
61,0 51,2 47,8 49,9 50,3 49,0 50,1 49,9 47,5 51,2
52,1 60,1 46,6 52,1 62,2 54,2 53,1 51,1 49,9 47,9
53,3 53,0 49,0 49,8 50,2
1
1
H sprejmemo tveganju 5% pri 96,1
H zavrnemo tveganju 5% pri 96,1
z
z
7,1
25
5
507,51z
Rezultati niso statistično značilni. Ničelne hipoteze ne
moremo zavrniti.
![Page 56: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/56.jpg)
Sedaj pa izhajamo iz dejstva, da standardnega odklona populacije ne poznamo, kar je v bistvu bolj realistično.
Če je vzorec dovolj velik, potem upoštevamo, da je
in postopamo enako kot v prejšnjem primeru (n>100).
Pri malih vzorcih pa z-statistiko nadomesti Studentova t-statistika, ki je porazdeljena po Studentovi porazdelitvi z n-1 stopnjami prostosti.
s
n
s
Mxt H
![Page 57: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/57.jpg)
PRIMER
Za prejšnji primer ocenimo standardni odklon
populacije iz podatkov: s=4,026
Izračunamo testno statistiko
112,2
25
026,4
507,51t
0247,4
1979,1624
257,51
24
67211
67211
22
2
s
s
xi
![Page 58: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/58.jpg)
Iz tabel odčitamo testno statistiko:
tveganju5% pri 064,2)24(kritt
Sprejmemo alternativno hipotezo. Rezultati so
statistično značilni.
![Page 59: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/59.jpg)
p-vrednost je najmanjša stopnja značilnosti pri
kateri še lahko zavrnemo ničelno hipotezo.
Če je p-vrednost manjša od predpisane α, ničelno
domnevo zavrnemo.
![Page 60: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/60.jpg)
Semenarna zagotavlja, da je kalivost semena
95 %. Z vzorcem velikosti 100 enot smo dobili
povprečno kalivost 94 %. Varianca populacije
znaša 16. Preverite z 1 % tveganjem, če je
trditev semenarne pravilna!
![Page 61: STATISTIKA 5. predavanjefkbv.um.si/images/stories/matematika/5pred.pdf · 2012. 4. 20. · PORAZDELITVE VZORČNIH STATISTIK Imejmo vzorec velikosti n.Na tem vzorcu ima spremenljivka](https://reader033.vdocuments.net/reader033/viewer/2022060822/609aec82300d2173847c1296/html5/thumbnails/61.jpg)
Oglejmo si primer, ko želimo ugotoviti ali imajo v
hlevu s piščanci pasme Hubbard po 21 dneh vzreje
povprečno maso 687 gramov, kot jo za to starost
navaja selektor.
666 859 769
692 492 773
515 822 760
706 669 824
719 608 606
768 592 709
655 624 633
653 678 633