katedra fyziky p??f ujep - náhodné (statistické)...

44
Náhodné (statistické) chyby přímých měření - nemají žádnou pravidelnost - nelze zjistit přesnou příčinu odchylek, původ chyb je v náhodě - k určení chyb používáme počtu pravděpodobnosti a statistických metod (tj. zjišťujeme, která z možných naměřených hodnot je více a která je méně pravděpodobná) Dva základní problémy: 1) Jakým způsobem ze souboru naměřených hodnot zjistit výsledek měření, který se nejvíce blíží správné (tj. skutečné) hodnotě měřené veličiny? 2) Jakým způsobem charakterizovat odchylku výsledku měření od správné hodnoty, tj. jak určit velikost náhodné chyby?

Upload: others

Post on 07-Mar-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Náhodné (statistické) chyby přímých měření

- nemají žádnou pravidelnost

- nelze zjistit přesnou příčinu odchylek, původ chyb je v náhodě

- k určení chyb používáme počtu pravděpodobnosti a statistických metod

(tj. zjišťujeme, která z možných naměřených hodnot je více a která je méně

pravděpodobná)

Dva základní problémy:

1) Jakým způsobem ze souboru naměřených hodnot zjistit výsledek měření, který

se nejvíce blíží správné (tj. skutečné) hodnotě měřené veličiny?

2) Jakým způsobem charakterizovat odchylku výsledku měření od správné

hodnoty, tj. jak určit velikost náhodné chyby?

Náhodná veličina (n. v.)

Na soubory naměřených hodnot pohlížíme jako na soubory náhodných

veličin, které se řídí statistickými zákony a výsledcích lze vyslovit pouze

pravděpodobnostní výroky.

N. v. může být buď spojitá nebo nespojitá.

Příklad

Měření délky: 13,3 cm; 13,2 cm; 13,1 cm; 13,2 cm; 13,0 cm.

Jednotlivé naměřené délky považuje za náhodné (spojité) veličiny (délka může

nabývat libovolné hodnoty).

0 100 200 300 400 500 600 700 800 900 10000,000

0,001

0,002

0,003

0,004

hu

sto

ta p

ravdě

po

do

bn

osti

hodnota

Náhodnou veličinu lze charakterizovat

pravděpodobností, s jakou nabývá svých

hodnot.

Opakování počtu pravděpodobnosti

Počet případů příznivýchPravděpodobnost

Počet případů možných

Jakých hodnot může pravděpodobnost daného jevu nabývat?

Klasická definice pravděpodobnosti

Příklad

Jaká je pravděpodobnost, že při hodu hrací kostkou padne číslo 6?

Statistická definice pravděpodobnosti

n krát opakujeme daný experiment

m krát zaznamenáme „úspěch“ (příznivý případ).

Pravděpodobnost limn

m

n

Příklad

Hodíme desetkrát hrací kostkou. Padnou tato čísla:

5, 4, 1, 6, 5, 4, 2, 6, 3, 4

Odhadněte pravděpodobnost toho, že padne číslo 6.

Spojité a nespojité náhodné veličiny

pravděpodobnost

hodnota 0 100 200 300 400 500 600 700 800 900 1000

0,000

0,001

0,002

0,003

0,004

hu

sto

ta p

ravd

ěp

od

ob

no

sti

hodnota

Nespojitá náhodná veličina

Může nabývat jen konečně mnoha nebo spočetně mnoha

hodnot.

Jedná se často o hodnoty celočíselné (např. počet impulzů,

počet částic,…) získaných čítáním.

Předem zadané hodnoty x nabývá s pravděpodobností P(x).

Měříme opakovaně n krát za shodných podmínek stejnou veličinu.

Danou hodnotu x naměříme m krát.

Číslu m říkáme „četnost“ měřené hodnoty x.

Tento graf nazýváme histogram

Při měření intenzity pozadí ionizujícího záření byly naměřeny následující hodnoty:

číslo

měření

intenzita

(imp/10s)

1 3

2 4

3 2

4 3

5 4

6 2

7 4

8 2

9 3

10 2

Nakreslete histogram: graf četnosti intenzity

jako funkce měřené hodnoty

četnost

intenzita (imp/10s)

1 2 3 4 5 0

1

2

3

4

5

takto kreslíme četnost hodnoty 2

Relativní četnost je definována jako m

n

limn

m

n

Za jakých podmínek bude relativní četnost rovna pravděpodobnosti

naměření dané hodnoty?

Pravděpodobnost je definována jako

pravděpodobnost

hodnota

Graf závislosti pravděpodobnosti na naměřené hodnotě nazýváme

rozdělení diskrétní náhodné proměnné.

Pravděpodobnost naměření hodnoty xi budeme značit

ixP

všechna ix

i

PJaká je hodnota výrazu:

Doposud jsme se věnovali diskrétní náhodné proměnné. To je taková

proměnná, která nabývá jen určitých hodnot.

(Př.: výsledek hodu kostkou, posloupnost čísel při tahu sportky apod.)

Fyzikální veličiny však obvykle mohou nabývat libovolné hodnoty.

Náhodná proměnná spojená s takovou fyzikální veličinou bude tzv.

spojitá (spojitá n. v.).

Spojitá náhodná veličina může nabývat hodnot, které se od sebe

libovolně málo liší, ale žádné dvě nejsou stejné.

Toto je však pouze teorie. Ve skutečnosti je každá měřená hodnota

diskrétní – diskretizaci provádí měřící přístroj.

Tento digitální voltmetr naměří hodnoty 1,295,

1,296 nebo 1,297 ale nic mezi tím.

Formalismus popisu spojitých a diskrétních náhodných proměnných

(veličin) je ale odlišný.

Jaká je pravděpodobnost, že naměříme hodnotu frekvence

elektromagnetického záření 2,128574443445098853567899653GHz?

Přesně!

Přestože se ve skutečnosti se spojitými náhodnými proměnnými

(veličinami) při měření v praxi nesetkáme, používají se spojitá

rozdělení častěji – lépe se s nimi počítá s využitím aparátu

matematické analýzy.

pravděpodobnost

hodnota 0 100 200 300 400 500 600 700 800 900 1000

0,000

0,001

0,002

0,003

0,004

hu

sto

ta p

ravd

ěp

od

ob

no

sti

hodnota

Pravděpodobnost naměření určité konkrétní hodnoty

spojité náhodné proměnné nemá smysl, je vždy rovna nule.

Smysl má pouze pravděpodobnost naměření hodnoty

v určitém intervalu.

Definujeme tzv. hustotu pravděpodobnosti

( )dP

p xdx

Analogie – hustota (hmotnosti) a hustota pravděpodobnosti

hustota (hmotnosti) m

V

průměrná hustota nehomogenního „kusu“ látky o hmotnosti m a

objemu V

Pokud se hustota tělesa mění místo od místa (těleso není

homogenní), má smysl definovat „lokální“ hustotu:

dm

dV

Hustota v bodě = hmotnost nekonečně malého kousku děleno objemem

tohoto kousku.

( )dP

p xdx

analogicky definujeme hustotu pravděpodobnosti

Známe-li střední hustotu, můžeme hmotnost tělesa spočítat takto:

m V

Známe-li lokální hustotu, hmotnost tělesa se spočítá takto:

V

m dV

Pravděpodobnosti naměření hodnoty x z intervalu (x1, x2) se spočítá jako:

2

1

1 2( , ) ( )

x

x

P x x p x dx 0 100 200 300 400 500 600 700 800 900 1000

0,000

0,001

0,002

0,003

0,004

hu

sto

ta p

ravd

ěp

od

ob

no

sti

hodnota

Čemu je roven výraz:

( ) ?p x dx

0 100 200 300 400 500 600 700 800 900 10000,000

0,001

0,002

0,003

0,004

hu

sto

ta p

ravd

ěp

od

ob

no

sti

hodnota

0 50 100 150 200 250 300 350 400

p(x)

x

Úkol:

Seřaďte podle velikosti od nejmenšího po největší

1) pravděpodobnost naměření hodnoty v intervalu (50,100)

2) pravděpodobnost naměření hodnoty v intervalu (100,150)

3) pravděpodobnost naměření hodnoty v intervalu (250,300)

2

1

1 2( , ) ( )

x

x

P x x p x dx

Základními parametry rozdělení jsou:

střední hodnota

1i

n

x i

i

P x

( )D

x p x dx

n – počet všech možností D – definiční obor

diskrétní rozdělení spojité rozdělení

rozptyl (disperze) 2

1

( )i

n

x i

i

D P x

2( ) ( )

D

D x p x dx

Úkol:

Které rozdělení má větší střední hodnotu (černé nebo červené)?

0 200 400 600 800 1000

0,000

0,001

0,002

0,003

0,004

0,005

0,006

hu

sto

ta p

ravd

ěp

od

ob

no

sti

hodnota

( )D

x p x dx

Úkol:

Které rozdělení má větší disperzi (černé nebo červené)?

0 200 400 600 800 1000

0,000

0,001

0,002

0,003

0,004

0,005

0,006

hu

sto

ta p

ravd

ěp

od

ob

no

sti

hodnota

2( ) ( )D

D x p x dx

Proč je červené rozdělení nižší než černé?

Střední hodnota určuje polohu rozdělení na ose x a disperze jeho šířku.

Disperze však nemá vhodnou jednotku.

D

2

1

( )i

n

x i

i

D P x

2( ) ( )D

D x p x dx

Proto definujeme tzv. směrodatnou odchylku σ vztahem:

0 200 400 600 800 1000

0,000

0,001

0,002

0,003

0,004

0,005

0,006

hu

sto

ta p

ravd

ěp

od

ob

no

sti

hodnota

Hledáme velikost intervalu pro zvolenou hodnotu

pravděpodobnosti, přičemž předpokládáme, že máme

naměřeno nekonečně mnoho hodnot.

Interval, jemuž přísluší pravděpodobnost P, nazýváme

P-procentní interval spolehlivosti (také konfidenční

interval).

(μ – kσ, μ – kσ) , kde k ˃ 0.

Intervaly spolehlivosti

Normální (Gaussovo) rozdělení

2

2

( )

21

( )2

x

p x e

střední hodnota: µ

disperze: D=σ2

σ je směrodatná odchylka

Je nejčastější používaný model rozdělení náhodné veličiny.

Používá se pro náhodné jevy, které vznikly složením vlivů, které

jsou nezávislé, je jich velký počet a každý z těchto vlivů

ovlivňuje skutečnou hodnotu n. v. jen malým příspěvkem.

Přímo měřené fyzikální veličiny zpravidla těmto předpokladům

vyhovují (u přesných měření je třeba nejdříve vyšetřit, jakým

rozdělením pravděpodobnosti lze n. v. popsat).

2

1

1 2( , ) ( )

x

x

P x x p x dx 0 100 200 300 400 500 600 700 800 900 1000

0,000

0,001

0,002

0,003

0,004

hu

sto

ta p

ravdě

po

do

bn

osti

hodnota

µ = 500 σ = 100

0 100 200 300 400 500 600 700 800 900 10000,000

0,001

0,002

0,003

0,004

hu

sto

ta p

ravdě

po

do

bn

osti

hodnota

0 100 200 300 400 500 600 700 800 900 10000,000

0,001

0,002

0,003

0,004

hu

sto

ta p

ravdě

po

do

bn

osti

hodnota

µ = 300 σ = 100

0 100 200 300 400 500 600 700 800 900 10000,0000

0,0005

0,0010

0,0015

0,0020

0,0025

hu

sto

ta p

ravd

ěp

od

ob

no

sti

hodnota

µ = 500 σ = 200

Jak souvisí µ a σ s tvarem a plohou křivky?

0 100 200 300 400 500 600 700 800 900 10000,000

0,001

0,002

0,003

0,004

hu

sto

ta p

ravd

ěp

od

ob

no

sti

hodnota

µ - σ µ + σ µ

inflexní bod

Inflexní bod je bod na křivce, ve kterém křivka mění křivost z konkávní (kladná

křivost) na konvexní (záporná křivost) nebo obráceně.

0 100 200 300 400 500 600 700 800 900 10000,000

0,001

0,002

0,003

0,004h

usto

ta p

ravd

ěp

od

ob

no

sti

hodnota

µ - σ µ + σ µ

inflexní bod

µ = 500 σ = 100

2

2

( )

21

( ) 0,682

x

p x dx e dx

Měříme-li veličinu, která se řídí normálním rozdělením se střední hodnotou µ a

směrodatnou odchylkou σ, je pravděpodobnost toho, že při dalším měření

naměříme hodnotu z intervalu (µ - σ, µ + σ) rovna 68%.

0 100 200 300 400 500 600 700 800 900 10000,000

0,001

0,002

0,003

0,004

hu

sto

ta p

ravd

ěp

od

ob

no

sti

hodnota

µ - σ µ + σ µ

inflexní bod

Úkol:

Odhadněte, jaká je pravděpodobnost naměření hodnoty z intervalu

(µ - 3σ, µ + 3σ).

Pravděpodobnost naměření hodnoty v intervalu (µ - 3σ, µ + 3σ)

(tzv. 3σ – interval)

je rovna 99,7 %.

Tuto chybu definujeme jako krajní (mezní) chybu.

Jedná se o interval spolehlivosti (μ – kσ, μ – kσ), kde k = 3.σ .

Dále definujeme tzv. pravděpodobnou chybu pro P = 0,5 (= 50 %)

k = 2/3 a interval spolehlivosti je (µ - 2/3 σ, µ + 2/3 σ).

Pravděpodobnost naměření hodnoty v intervalu (µ - 2/3σ, µ + 2/3σ) je

rovna 50 % (tento interval vymezuje právě polovinu obsahu plochy pod

normální křivkou).

Při běžných měřeních často stačí pracovat s tímto intervalem.

Vlastnosti spojité n. v., která se řídí normálním rozdělením

(hodnota chyba) jednotkyx

Měříme náhodnou veličinu x a chceme určit odhad její střední hodnoty a

chyby, tedy výraz:

Opakujeme n – krát měření za stejných podmínek, odhad střední hodnoty

získáme jako:

1

1 n

i

i

x xn

aritmetický průměr

a odhad směrodatné odchylky (chyby)

jednoho měření 2

1

( )

1

n

i

ix

x x

sn

( )xx x s

Odhady střední hodnoty a směrodatné odchylky pro

konečný počet měření

Při měření intenzity pozadí ionizujícího záření byly naměřeny následující hodnoty:

číslo

měření

Intenzita

1 3,0

2 4,0

3 3,0

4 3,0

5 4,0

Vypočtěte odhad střední hodnoty a směrodatné

odchylky.

Příklad

2

1

( )

1

n

i

ix

x x

sn

Při měření intenzity pozadí ionizujícího záření byly naměřeny následující hodnoty:

číslo

měření

intenzita

(imp/10s)

1 3

2 4

3 3

4 3

5 4

Vypočtěte odhad střední hodnoty a směrodatné

odchylky.

Příklad

Řešení

Vlastnosti aritmetického průměru

Při malém počtu měření se spojitá n. v. neřídí normálním rozdělením, ale tzv.

Studentovým neboli t-rozdělením

Směrodatná odchylka při malém počtu měření

Křivka je plošší (tím více, čím

nižší je N) → pro dosažení stejné

psti P výskytu naměřené hodnoty

v nějakém intervalu symetrickém

kolem μ je třeba u t-rozdělení

zvolit interval (μ – kσ, μ + kσ)

širší.

Hodnoty čísla k pro pravděpodobnost P při různém počtu měření N

Kritéria pro vyloučení hrubých chyb měření

Připomeňme si:

Pravděpodobnost naměření hodnoty v intervalu (µ - 3σ, µ + 3σ) je

rovna (tzv. 3σ – interval) je 99,7 % (= jistota) → krajní (mezní) chyba

Směrodatná odchylka jednoho měření však není pro celý soubor N

měření dostačující. Pokud bychom znovu provedli N měření, dospěli

bychom k jiné hodnotě arit. průměru (i když je střední hodnota μ stejná).

1

1 n

i

i

x xn

2

1

( )

( 1)

n

i

ix

x x

sn n

( )xx x s

Shrnutí – postup při zpracování hodnot získaných přímým měřením

Posuvným měřidlem byly naměřeny tyto

hodnoty délky: 3,12 cm; 3,00 cm; 3,06

cm. Předpokládejte, že měřené hodnoty

jsou zatíženy jen náhodnými chybami.

Vypočtěte odhad střední hodnoty a

směrodatnou odchylku jednoho

měření a aritmetického průměru.

Určete interval spolehlivosti pro

P= 0,995 a P = 0,5. Vypočtěte relativní

chyby.

Cvičení 1. Určení střední hodnoty a chyby při malém počtu měření

V tabulce jsou zaznamenány

naměřené hodnoty hmotnosti.

Předpokládejte, že měřené hodnoty

jsou zatíženy jen náhodnými chybami.

Vypočtěte odhad střední hodnoty a

směrodatnou odchylku jednoho

měření a aritmetického průměru.

Určete interval spolehlivosti pro

P = 0,999, P = 0,995 a P = 0,5.

Vypočtěte relativní chyby.

Cvičení 2. Určení střední hodnoty a chyby při malém počtu měření

Cvičení 3. Určení střední hodnoty a chyby při malém počtu měření

- použití přísnějšího kritéria pro vyloučení hrubých chyb

V tabulce jsou zaznamenány naměřené hodnoty hmotnosti. Předpokládejte, že

měřené hodnoty jsou zatíženy jen náhodnými chybami.

Vypočtěte odhad střední hodnoty a směrodatnou odchylku jednoho měření a

aritmetického průměru. Pro vyloučení hrubých chyb užijte t-kritérium.

Cvičení 3. Určení střední hodnoty a chyby při malém počtu měření

- použití přísnějšího kritéria pro vyloučení hrubých chyb

V tabulce jsou zaznamenány naměřené

hodnoty průměru drátu (průměr drátu byl

měřen na deseti různých místech, vždy ve

dvou navzájem kolmých směrech).

Předpokládejte, že měřené hodnoty jsou

zatíženy jen náhodnými chybami), měření bylo

provedeno mikrometrem.

Vypočtěte odhad střední hodnoty a

směrodatnou odchylku jednoho měření a

aritmetického průměru.

Určete interval spolehlivosti pro P = 0,997 a

P = 0,5. Vypočtěte relativní chyby.

Cvičení 4. Určení střední hodnoty a chyby při dostatečném počtu měření