wykład 5 standardowy błąd a odchylenie standardowe
DESCRIPTION
Wykład 5 Standardowy błąd a odchylenie standardowe. Odchylenie standardowe z próby s: Służy do oceny zmienności w zbiorze danych Gdy n wzrasta s zbliża się do odchylenia standardowego w populacji Używane do przewidywań dotyczących indywidualnych obserwacji. - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: Wykład 5 Standardowy błąd a odchylenie standardowe](https://reader031.vdocuments.net/reader031/viewer/2022020201/56814b74550346895db86176/html5/thumbnails/1.jpg)
Wykład 5Standardowy błąd a odchylenie standardowe
• Odchylenie standardowe z próby s:– Służy do oceny zmienności w zbiorze danych– Gdy n wzrasta s zbliża się do odchylenia
standardowego w populacji – Używane do przewidywań dotyczących
indywidualnych obserwacji
![Page 2: Wykład 5 Standardowy błąd a odchylenie standardowe](https://reader031.vdocuments.net/reader031/viewer/2022020201/56814b74550346895db86176/html5/thumbnails/2.jpg)
• Błąd standardowy średniej SE = :– Służy do oceny niepewności związanej z
estymacją średniej w populacji– Maleje do zera wraz ze wzrostem n– Używane do przewidywań dotyczących
średniej
sn
![Page 3: Wykład 5 Standardowy błąd a odchylenie standardowe](https://reader031.vdocuments.net/reader031/viewer/2022020201/56814b74550346895db86176/html5/thumbnails/3.jpg)
Jak duża powinna być próba?
• Poprzez wybór odpowiedniego n możemy uzyskać PU o odpowiedniej (dowolnie małej) szerokości
• Możemy estymować z zadaną precyzją • Przykład: znajdź rozmiar próby taki, aby
95% PU dla średniej miał szerokość 5.
![Page 4: Wykład 5 Standardowy błąd a odchylenie standardowe](https://reader031.vdocuments.net/reader031/viewer/2022020201/56814b74550346895db86176/html5/thumbnails/4.jpg)
Załóżmy, że =10. Wtedy
• Na ogół nie znamy, możemy jednak wykonać badanie wstępne (mała próba) i użyć s.
![Page 5: Wykład 5 Standardowy błąd a odchylenie standardowe](https://reader031.vdocuments.net/reader031/viewer/2022020201/56814b74550346895db86176/html5/thumbnails/5.jpg)
Podstawowe założenie (jeszcze raz)
• Próba musi być losowa:
– każdy element w populacji ma jednakową szansę być wybranym
– poszczególne wybory są od siebie niezależne• Jeżeli to założenie nie jest spełnione to
wzrost n może nie gwarantować zmniejszenia SE.
![Page 6: Wykład 5 Standardowy błąd a odchylenie standardowe](https://reader031.vdocuments.net/reader031/viewer/2022020201/56814b74550346895db86176/html5/thumbnails/6.jpg)
Przedział ufności dla frakcji w populacji
• Estymujemy p za pomocą • Chcemy skonstruować przedział ufności dla p• Moglibyśmy skorzystać z rozkładu
dwumianowego, ale wymagałoby to uciążliwych rachunków.
• Korzystamy z przybliżenia rozkładu Bernoulliego rozkładem normalnym
• Gdy Y ma rozkład dwumianowy (n, p) i n jest duże, wtedy Y ma w przybliżeniu rozkład normalny
p̂
, (1 )N np np p
![Page 7: Wykład 5 Standardowy błąd a odchylenie standardowe](https://reader031.vdocuments.net/reader031/viewer/2022020201/56814b74550346895db86176/html5/thumbnails/7.jpg)
• = Y/n ma wartość oczekiwaną=
i =
• Zatem ma w przybliżeniu rozkład
p̂
p̂
![Page 8: Wykład 5 Standardowy błąd a odchylenie standardowe](https://reader031.vdocuments.net/reader031/viewer/2022020201/56814b74550346895db86176/html5/thumbnails/8.jpg)
Przedział ufności dla p
• Będziemy korzystali z przybliżonego przedziału ufności Agrestiego-Coula (patrz np. Brown, Cai i DasGupta, Annals of Statistics, 2002):
– Środkiem przedziału będzie (modyfikacja ) – Przypomnijmy, że Z/2 jest taką liczbą, że
Pr(Z < - Z/2) = Pr(Z > Z/2) = /2
– Dla 95% PU, = 0.05 i Z/2 = 1.96
p p̂
![Page 9: Wykład 5 Standardowy błąd a odchylenie standardowe](https://reader031.vdocuments.net/reader031/viewer/2022020201/56814b74550346895db86176/html5/thumbnails/9.jpg)
• Definiujemy
• SE dla definiujemy jako
• Np. dla 95% PU wstawiamy Z0.025 = 1.96 i dostajemy
2/ 20.5
2/ 2
y Zp
n Z
p 2/ 2
(1 )p
p pSEn Z
2
2
0.5(1.96 ) 1.92 23.84 41.96
y y ypn nn
2
(1 ) (1 ) (1 )3.84 41.96p
p p p p p pSEn nn
![Page 10: Wykład 5 Standardowy błąd a odchylenie standardowe](https://reader031.vdocuments.net/reader031/viewer/2022020201/56814b74550346895db86176/html5/thumbnails/10.jpg)
![Page 11: Wykład 5 Standardowy błąd a odchylenie standardowe](https://reader031.vdocuments.net/reader031/viewer/2022020201/56814b74550346895db86176/html5/thumbnails/11.jpg)
Przedział ufności dla p (cd.)• Skonstruujemy przybliżony przedział ufności dla
p, z centrum w • Użyjemy kwantyli z rozkładu normalnego Z/2
• Dla 95% PU użyjemy Z0.025 =1.96
• Dla 90% PU użyjemy Z0.05 =1.65; dla 99% PU użyjemy Z0.005=2.58.
• przybliżony 95% PU dla p wynosi
p
11.96 1.96
4p
p pp SE p
n
![Page 12: Wykład 5 Standardowy błąd a odchylenie standardowe](https://reader031.vdocuments.net/reader031/viewer/2022020201/56814b74550346895db86176/html5/thumbnails/12.jpg)
Przykład:
• Złapano 125 myszy i 6 z nich ma brzuszki nakrapiane na biało
• p = frakcja myszek w całej populacji, które mają nakrapiane na biało brzuszki
• 95% PU dla p:
![Page 13: Wykład 5 Standardowy błąd a odchylenie standardowe](https://reader031.vdocuments.net/reader031/viewer/2022020201/56814b74550346895db86176/html5/thumbnails/13.jpg)
90% PU dla p
![Page 14: Wykład 5 Standardowy błąd a odchylenie standardowe](https://reader031.vdocuments.net/reader031/viewer/2022020201/56814b74550346895db86176/html5/thumbnails/14.jpg)
• Sformułowanie konkluzji:Mamy 90% pewności że frakcja myszek w tej
populacji, które mają brzuszki nakrapiane na biało zawiera się w przedziale między a .
• Zauważmy, że 90% PU jest niż 95% PU i że przedziały te mają różne środki.
![Page 15: Wykład 5 Standardowy błąd a odchylenie standardowe](https://reader031.vdocuments.net/reader031/viewer/2022020201/56814b74550346895db86176/html5/thumbnails/15.jpg)
Klasyczny przybliżony przedział ufności (informacja)
• Klasyczny przedział ufności uzyskuje się biorąc za jego środek i zastępując p przez we wzorze na i błąd standardowy.
• Klasyczne przedziały ufności zachowują się źle, gdy liczba sukcesów (Y) jest bliska zeru lub n. Może się wtedy zdarzyć np., że klasyczny PU zawiera ujemne wartości.
p̂p̂
![Page 16: Wykład 5 Standardowy błąd a odchylenie standardowe](https://reader031.vdocuments.net/reader031/viewer/2022020201/56814b74550346895db86176/html5/thumbnails/16.jpg)
Jak duża powinna być próba ?• Chcemy aby 95% PU miał długość nie większą od
zadanej. Jak ustalić rozmiar próby? • Idea: długość przedziału zależy od n, skąd można
wyznaczyć wystarczający rozmiar próby.• Uwaga – długość przedziału zależy też od , którego nie
znamy.• Jeżeli wiemy w przybliżeniu, jakie jest p, to możemy tej
przybliżonej wartości użyć w równaniu na długość przedziału (skąd wyznaczymy n)
• Jeżeli nie mamy żadnych wstępnych informacji, to użyjemy p = 0.5. Prowadzi to do ostrożnego wyboru n: szerokość PU skonstruowanego w oparciu o próbę o wyliczonym rozmiarze nie będzie większa od założonej, a może być dużo mniejsza. (Czy to dobrze?)
p
![Page 17: Wykład 5 Standardowy błąd a odchylenie standardowe](https://reader031.vdocuments.net/reader031/viewer/2022020201/56814b74550346895db86176/html5/thumbnails/17.jpg)
Przykład
• Chcemy aby SE było równe 0.005 (95% PU będzie miał długość około 0.02).
• Przypuszczamy, że prawdziwe p jest bliskie 0.05. Rachunki:
• Konkluzja: „Proszę złapać myszy.”
![Page 18: Wykład 5 Standardowy błąd a odchylenie standardowe](https://reader031.vdocuments.net/reader031/viewer/2022020201/56814b74550346895db86176/html5/thumbnails/18.jpg)
• Obliczenia, gdy nie wiemy nic o p:
• Konkluzja: „Proszę złapać myszy.”
![Page 19: Wykład 5 Standardowy błąd a odchylenie standardowe](https://reader031.vdocuments.net/reader031/viewer/2022020201/56814b74550346895db86176/html5/thumbnails/19.jpg)
• Asymptotyczne przedzialy ufnosci dla estymatorow najwiekszej wiarogodnosci – patrz tablica