teoretickÉ modely některých diskrÉtnÍch nv

21
Teoretické modely diskrétních náhodných veličin Veličiny, kterými se zabýváme, bývají nejrůznější povahy. Přesto však existují skupiny náhodných veličin, které mají podobně rozloženou pravděpodobnostní funkci a lze je tedy popsat přibližně stejným modelem rozdělení pravděpodobnosti. Typové modely takových rozdělení byly stanoveny teoreticky a jejich platnost pro různé náhodné veličiny byla ověřena experimentálně. Mějme naměřená reálná (empirická) data - obvykle výběrový soubor z nějaké populace. Snažíme se nalézt teoretické rozdělení a stanovit jeho parametry tak, aby co nejlépe odpovídalo našemu reálnému rozdělení četností. Jinými slovy: Vybíráme takový „model rozdělení“, který vystihuje povahu našich reálných (empirických) dat.

Upload: lisandra-church

Post on 30-Dec-2015

35 views

Category:

Documents


4 download

DESCRIPTION

TEORETICKÉ MODELY některých DISKRÉTNÍCH NV. Veličiny, kterými se biolog, lékař, zemědělec, historik, … zabývá, bývají nejrůznější povahy. - PowerPoint PPT Presentation

TRANSCRIPT

Teoretické modely diskrétních náhodných veličin

Veličiny, kterými se zabýváme, bývají nejrůznější povahy.Přesto však existují skupiny náhodných veličin, které mají podobně rozloženou pravděpodobnostní funkci a lze je tedy popsat přibližně stejným modelem rozdělení pravděpodobnosti.

Typové modely takových rozdělení byly stanoveny teoreticky a jejich platnost pro různé náhodné veličiny byla ověřena experimentálně.

Mějme naměřená reálná (empirická) data - obvykle výběrový soubor z nějaké populace. Snažíme se nalézt teoretické rozdělení a stanovit jeho parametry tak, aby co nejlépe odpovídalo našemu reálnému rozdělení četností.Jinými slovy: Vybíráme takový „model rozdělení“, který vystihuje povahu našich reálných (empirických) dat.

Rovnoměrné diskrétní rozdělení

Náhodná veličina má rovnoměrné diskrétní rozdělení, jestliže k - hodnot, kterých může nabývat, se vyskytujes pravděpodobností

Rozdělení je modelem pokusů házení mincí (k=2) nebo házení hrací kostkou (k=6)

Střední hodnota je

a rozptyl je var(X)=E[X-E(X)]2 = E(X2) - [E(X)]2

kik

xXP i ...,,2,1,1

)(

k

iii

k

ii x

kxXPxXE

11

1)()(

2

112

2 11)var(

k

ii

k

ii x

kx

kX

Příklad: Rovnoměrné diskrétní rozdělení

Hod mincí 1. stranu označíme 1 2. stranu označíme 2

Hod kostkou

5,12

3

2

1)(

2

1

i

ixXE

5,36

21

6

1)(

6

1

i

ixXE

25,04

9

2

5

2

1

2

1)var(

22

1

2

12

2

ii

ii xxX

92,236

441691

36

21

6

91

6

1

6

1)var(

226

1

6

12

2

ii

ii xxX

Binomické rozdělení Bi (n; π)

Toto rozdělení má náhodná veličina X, která vznikne jako součet n nezávislých alternativně* rozdělených náhodných veličin se stejným parametrem π (pravděpodobnost úspěchu).

Diskrétní náhodná veličina X má binomické rozdělenís parametry n, π, π Є (0, 1), resp.nabývá-li hodnoty x = 0, 1, 2, .., n s pravděpodobností

Střední hodnota:

Rozptyl:

*Alternativně - mají jen 2 možné výsledky: úspěch x neúspěch

xnx

x

nxXP

1)(

nXE )(

)1()(var nX

),(),( nBnBi

Příklad: Hokejisté mají proměnit 5 trestných střílení. Jsou vybráni hráči, u nichž pravděpodobnost vstřelení branky je 0,8. Jaká je pravděpodobnost, že vstřelí branku ze všech pěti pokusů?

Podle pravidla násobení pravděpodobností: p = 0,8*0,8*0,8*0,8*0,8

Jaká by byla pravděpodobnost, že vstřelí branku jen ve třech stříleních? Z definice binomického rozdělení: p = počet možností * (0,8)3 * (0,2)2

Binomické rozdělení je rozdělením nezávislých pokusů alternativní veličiny se stejnou pravděpodobností úspěchu.

Binomické rozdělení Bi (n; π)

xnx

x

nxXP

1)( 353 8,018,0

3

5)3(

XP

Binomické rozdělení Bi (n; π)

Máme alternativní veličinu např. indikující, že daná osoba

trpí diabetem s pravděpodobností p = π a osoba je zdravá s pravděpodobností p = 1 - π

Předpoklady: všechny osoby mají stejnou pravděpodobnost výskytu onemocnění

výskyt diabetes je u jednotlivých osob nezávislý(nejedná se o nakažlivou chorobu)

Sledovaná populace: n osob Ve výběru bude: x nemocných

Pravděpodobnost, že X = x

xnx

x

nxXP

1)(

Binomické rozdělení - grafické znázornění

0 10 20 30

π=0,5 π=0,01 π=0,2 π=0,95

xnx

x

nxXP

)1()(

X … náhodná veličinax … hodnota NV, které dosáhne (např. pro 30 měření 0, 1, 2, …, 30)π … pravděpodobnost, s jakou je jev pozorován1-π … pravděpodobnost, s jakou jev nenastane

Alternativní (Bernoulliho) rozdělení

je zvláštním případem Binomického rozdělení a nazývá se Alternativní neboli Bernoulliho rozdělení.

Alternativní veličina – indikátor nemoci, symptomu, … .

NV může nabývat pouze hodnoty 1 s pravděpodobností pnebo hodnoty 0 s pravděpodobností (1-p)

Střední hodnota E(X) = pRozptyl var(X) = p(1-p)

PŘ1: počet lvů při hodu 1 mincí - buď padne 1 lev nebo žádný, p = 0,5

PŘ2: riziko onemocnění, pravděpodobnost výhry, ...

Kde a … počet pozitivních odpovědí (nemocných, losů, které vyhrávají). b … počet negativních odpovědí (počet zdravých, losů bez výhry)

ba

ap

),1( Bi

U předchozího binomického rozdělení jsme sledovali soubor konečného, často malého rozsahu. Ale často se stává, že sledovaná populace může být velmi rozsáhlá nebo dokonce „nekonečná“, např. sledujeme počet onemocnění klíšťovou encefalitidou v populaci ČR v každém týdnu aktuálního roku.

Parametr n v tomto případě neznáme a rozdělení veličiny můžeme popsat vzorcem , kde

λ je jediným parametrem tohoto rozdělení a vyjadřuje pravděpodobnost, že ve výběru bude x nemocných.Rozdělení se nazývá Poissonovo rozdělení.

Poissonovo rozdělení

ex

xXPx

!)(

Bortkiewicz počet úmrtí po úrazu kopnutí koněm u vojenských jednotek

Diskrétní náhodná veličina X má Poissonovo rozdělenís parametrem λ > 0, nabývá-li hodnot x = 0, 1, 2, …

s pravděpodobností

Základní charakteristikystřední hodnota a rozptyl:

Distribuční funkce (kumulativní pravděpodobnosti):

Poissonovo rozdělení je rozdělením řídkých jevů.

ex

xXPx

!)(

)(var)( XXE

Poissonovo rozdělení )(Po

xt

t

texF

!)(

Bortkiewicz počet úmrtí po úrazu kopnutí koněm u vojenských jednotek

Spolu s Binomickým rozdělením se používá nejčastěji pro popis veličin, které vyjadřují počet nalezených objektů našeho zájmu:

- počet hovorů za jednotku času v telefonní ústředně- počet vadných výrobků- počet kazů na látce- počet částic v jednotce objemu

Pro velká n a malá p lze Binomické rozdělení aproximovat Poissonovým rozdělením Po (λ = np)

Vztah platí i opačně – Poissonovo rozdělení můžeme aproximovat Binomickým: - zvolíme dostatečně velké n (řádově 100 – 1000 x větší než λ) a p vypočteme jako p = λ/n

Poissonovo rozdělení )(Po

Př. Sledujeme počet infekcí horních dýchacích cest dětí během prvních tří let jejich věku ve velmi rozsáhlé populaci a z těchto sledování stanovíme pravděpodobnost tohoto onemocnění a označíme ji λ.

Pravděpodobnost, že ve výběru bude x nemocných, vypočteme pomocí Poissonova rozdělení

za předpokladů: všechny děti mají stejnou pravděpodobnost onemocnění výskyt onemocnění je u jednotlivých osob nezávislý

Poissonovo rozdělení

ex

xXPx

!)(

Německý statistik Borkiewicz sledoval po dobu 10 let ve 20-ti německých armádních sborech zabití vojenských osob úderem koňského kopyta

Očekávaná hodnota λ (lambda) byla podle propočtů počet mrtvých / počet sledování 122 / 200 = 0,61

Skutečnost Propočet0 mrtvých 109 109

1 mrtvý 65 662 mrtví 22 203 mrtví 3 44 mrtví 1 0,6

ex

xXPx

!)(Poissonovo rozdělení

Poissonovo rozložení - smrt po úderu koňským kopytem

Počet úmrtí Vypočtený počet

vojenských sborů

Porovnání se skutečným sledováním

0 0,543 108,7 109

1 0,331 66,3 65

2 0,101 20,2 22

3 0,0205 4,1 3

4 0,0031 0,6 1

5 0,00038 0,1 0

6 0,000038 0,0 0

ex

xXPx

!)(

Bortkiewicz počet úmrtí po úrazu kopnutí koněm u vojenských jednotek

MODŘE - skutečnostŠEDĚ – propočet

Poissonovo rozložení - smrt po úderu koňským kopytem

ex

xXPx

!)(

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

1 3 5 7 9 11 13 15 17 19 21 23

λ=0,5

λ=1

λ=2

λ=4

λ=10

Frekvenční funkce Poissonova rozložení v závislosti na λ

ex

xXPx

!)(

Bortkiewicz počet úmrtí po úrazu kopnutí koněm u vojenských jednotek

Příklad: Do podnikové telefonní ústředny přichází v průměru 120 hovorů za hodinu. Vypočtěte, jaká je pravděpodobnost:

a) že za půl minuty nepřijde hovorb) že přijdou méně než tři hovory

Řešení: 120 hovorů za hodinu znamená 1 hovor za půl minuty: λ = 1 Jedná se o řídký náhodný jev, proto ho můžeme modelovat Poissonovým rozdělením.Pro hledaný časový interval půl minuty, tj, λ=1 se vzorec zjednoduší na

Pro X=0 je

Pro X=1 je

Pro X=2 je

a) P(X=0) = 0,368 b) P(X<3) = 0,368+0,368+0,184 = 0,92

ex

xXPx

!)(Poissonovo rozdělení - příklad

exe

xxXP

x

!

1

!

1)( 1

368,01

!0

1)0(

eeXP

368,01

!1

1)1(

eeXP

184,02

1

!2

1)1(

eeXP

Multinomické rozdělení

Příklad:

sledujeme nominální veličinu rodinný stav matkysvobodná, vdaná, rozvedená, vdova

Pravděpodobnost, že z n – matek bude právěk1 svobodných, k2 vdaných, k3 rozvedených a k4 vdov vyjadřuje vzorec:

P(X1=k1, X2=k2, X3=k3, X4=k4) =

43214321

4321 !!!!

! kkkk ppppkkkk

n

Hypergeometrické rozdělení H(M,N,n)

Mějme: N předmětů, z tohoM předmětů jednoho druhuN - M předmětů druhého druhu

Vylosujeme n předmětů bez vracení, kde je x - předmětů prvního druhu, např. x = 0 znamená, že 1. druh nebyl tažen.Sledujeme počet úspěchů x v n - závislých pokusech

Ne všechny situace jsou možné, musíme stanovit podmínky.

Příklad 1: Z osudí, ve kterém je N kuliček, z toho M bílých, vybíráme náhodně n jednotek a ptáme se, kolik je mezi nimi bílých kuliček. (Losovat můžeme postupně, ale důležité je, že kuličky zpět nevracíme).

Příklad 2: Losování sportkyPředměty prvního druhu jsou označeny veřejným losováním ve hře sportka. Výběrem čísel na tiketu jsme losovali právě tyto předměty prvního druhu.

Hypergeometrické rozdělení H(M,N,n)

Diskrétní náhodná veličina X má hypergeometrické rozdělenís parametry M, N, n, kde M, N, n jsou přirozená čísla a n Є (0, M), nabývá-li hodnoty x = 0, 1, 2, .., n s pravděpodobností

Základní charakteristiky:

Střední hodnota:

Rozptyl:

n

N

xn

MN

x

M

xXP )(

N

nMXE )(

N

M

N

Mn

N

nNX 1

1)(var

Hypergeometrické rozdělení H(M,N,n)

Je-li rozsah výběru n oproti počtu jednotek v osudí N malý(provedeme-li třeba jen 10%-ní výběr), pak se hodnota výrazu

ze vzorce pro rozptyl blíží 1. označíme jako p

a hypergeometrické rozdělení lze aproximovat Binomickým

rozdělením s rozptylem

1

N

nN

N

MnBi ,

N

M

N

Mn

N

nNX 1

1)(var

N

M

)1()(var ppnX