rozkład normalny parametry rozkładu zmiennej losowej zmienne...

42
Statystyka i opracowanie danych – W4 Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne losowe wielowymiarowe Dr Anna ADRIAN Paw B5, pok 407 [email protected]

Upload: others

Post on 25-Feb-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Statystyka i opracowanie danych – W4

Rozkład normalny

Parametry rozkładu zmiennej losowej

Zmienne losowe wielowymiarowe

Dr Anna ADRIAN

Paw B5, pok 407

[email protected]

Page 2: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Parametry rozkładu N(µ,σ),

µ - Wartość oczekiwanaσ2 - Wariancja

µ

σ

f(x)

Rozkład normalny – wykres funkcji gęstości i interpretacja

x

Page 3: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Funkcja gęstości w rozkładzie normalnym:

• jest symetryczna względem prostej x = µ

• w punkcie x = µ osiąga wartośćmaksymalną

• ramiona funkcji mają punkty przegięcia dla x = µ - σoraz x = µ + σ

Kształt funkcji gęstości zależy od wartości parametrów:µ, σ :

- parametr µ decyduje o przesunięciu krzywej,

- parametr σ decyduje o „smukłości” krzywej.

Cechy charakterystyczne funkcji gęstości

rozkładu normalnego

Page 4: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Jeżeli zmienna losowa ma rozkład normalny N(µ,σ) to:

- 68,3 % populacji mieści się w przedziale (µµµµ - σ; µµµµ + σ)

- 95,5 % populacji mieści się w przedziale (µµµµ - 2σ; µµµµ + 2σ)

- 99,7 % populacji mieści się w przedziale (µµµµ - 3σ; µµµµ + 3σ)

Rozkład normalnyReguła 3 sigma

Page 5: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Dla uproszczenia obliczeń prawdopodobieństwa P(a<X≤ b) dla

zmiennej losowej o rozkładzie normalnym, z wartością

oczekiwaną µ i odchyleniemstandardowym σ, dokonuje się

standaryzacji zmiennej losowej.

Prawdopodobieństwo w rozkładzie normalnym ( podobnie jak

w każdym innym rozkładzie ciągłym) wyznaczane jest dla

wartości zmiennej losowej z określonego przedziału, P(a<X≤ b)

Prawdopodobieństwo w rozkładzie normalnym

P(a<X≤ b) = F(b)- F(a),

Page 6: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Zmienną X zastępuje się zmienną standaryzowaną U

σµ−= x

u

Standaryzacja polega na sprowadzeniu dowolnego rozkładu normalnego N(µ, σ),

o danych parametrach µ i σ do rozkładu standaryzowanego(modelowego)

o wartości oczekiwanej µ = 0 i odchyleniu standardowym σ = 1.

która marozkład N(0,1)

Rozkład normalny - standaryzacja

Wtedy otrzymujemy następujące zależności : f(x)→ϕ(u), F(x) →Φ(u), czyli:

)()()(σ

µ−Φ==≤ xxFxXP

Page 7: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Własności dystrybuanty

standaryzowanego rozkładu normalnego:

)()(

)(1)(1)(

)(1)()(

)()()()(

uuUP

uuUPuUP

uuuUP

uuUPxXPxF

Φ=−>Φ−=≤−=>

Φ−=−Φ=−≤Φ=≤=≤=

Page 8: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

gdzie Φ(u) oznacza wartości dystrybuanty standaryzowanego rozkładu

normalnego N(0,1) Wartości te znajdziemy w tablicach statystycznych

−Φ−

−Φ=−=≤<

−Φ−

−Φ=

−≤<−=

=

−≤−<−=≤<

σµ

σµ

σµ

σµ

σµ

σµ

σµ

σµ

σµ

abaFbFbXaP

abbU

aP

bXaPbXaP

)()()(

)(

Obliczanie prawdopodobieństwa w rozkładzie normalnym

Obliczanie prawdopodobieństwa, że zmienna losowa X,

o rozkładzie N (µ, σ), przyjmie wartości z przedziału (a, b)

Page 9: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Zadanie:

Wzrost kobiet w pewnej populacji ma rozkład normalny N(165,15). Oznacza to, iż zmienna losowa jaką jest wzrost kobiet ma rozkład normalny ze średnią równą 165 cm odchyleniem standardowym równym 15 cm. Jaki jest udział w populacji kobiet o wzroście:

a) do 160 cm,

b) w przedziale 165-170 cm,

c) powyżej 175 cm

d) dokładnie 150 cm

Page 10: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Rozwiązanie:

a) do 160 cm

3707,06293,01)33,0(1)33,0(

)33,0(15

165160

15

165)160(

=−=Φ−=−Φ=

=−≤=

−≤−=≤ UPX

PXP

a) innym sposobem

3707,06293,01)33,0(1)33,0(

15

165160)160()160(

=−=Φ−=−Φ=

=

−Φ==≤ FXP

Page 11: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

b) w przedziale 165-170 cm

c) powyżej 175 cm.

1293,05,06293,0)0()33,0()33,00(

15

165170

15

165

15

165165)170165(

=−=Φ−Φ=≤<=

=

−≤−<−=≤<

UP

XPXP

251429,0748571,01)67,0(1)67,0(1

)67,0(15

165175

15

165)175(

=−=Φ−=≤−=

=>=

−>−=>

UP

UPX

PXP

d) dokładnie 150 cm.

0)150()150()150150()150( =−=≤≤== FFXPXP

Rozwiązanie:

Page 12: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny
Page 13: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Parametry pozycyjne rozkładu zmiennej losowejModa –Dominanta. Mediana.

• Modą Mo ( Dominantą Do) zmiennej losowej X nazywamy tę wartość zmiennej losowej, której odpowiada:

– Największe prawdopodobieństwo – w przypadku zmiennej dyskretnej

– Maksimum lokalne funkcji gęstości w przypadku zmiennej losowej ciągłej.

• Medianą Me zmiennej losowej X nazywamy wartość x, spełniającą nierówności

P(X≤x)≥0,5 i P (X ≥ x) ≥ 0,5

natomiast dla dystrybuanty mamy

0,5 ≤ F(x) ≤ 0,5+P(X=x) dla zmiennej dyskretnej

F(x)=0,5 dla zmiennej ciągłej

Page 14: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Symetria rozkładu zmiennej losowej

Zmienna losowa ma rozkład symetryczny jeśli istnieje taka wartość a, że:

– W przypadku zmiennej dyskretnej każdemu punktowi skokowemu xi ≤ a odpowiada punkt xj ≥ a, taki, że

P(X= xi )= P(X= xj) oraz a- xi = xj-a

– W przypadku zmiennej losowej ciągłej o funkcji gęstości f(x) : f(a-x)=f(a+x) dla każdego x w punktach ciągłości f(x). Punkt a nosi nazwę środka symetrii, a prosta x=a jest osiąsymetrii rozkładu zmiennej losowej .

– Jeśli rozkład jest symetryczny, to środkiem symetrii jest wartość oczekiwana

– W rozkładzie symetrycznym wszystkie momenty centralne nieparzystego rzędu równe są zero

Page 15: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Asymetria rozkładu zmiennej losowej

• Zmienna losowa ma rozkład asymetryczny jeśli nie istnieje taka wartość a (taki punkt a), który spełnia warunki rozkładu symetrycznego.

• Ze względu na to, że w rozkładzie asymetrycznym momenty centralne rzędu nieparzystego są różne od zera, do określenia współczynnika asymetrii (skośności) rozkładu wykorzystuje siętrzeci moment centralny µ3, mianowicie

• Jeśli γ>0, asymetria rozkładu jest dodatnia prawostronna (wydłużenie w kierunku dużych wartości)

• Jeśli γ<0, asymetria rozkładu jest ujemna - lewostronna (wydłużenie w kierunku małych wartości)

)(33

XD

µγ =

Page 16: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Wyznaczyć wskaźniki położenia zmiennej X: wartość oczekiwaną, modę, medianę, kwantyl rzędu 0,75,

Dla zmiennej losowej, której funkcja gęstości dana jest wzorem

<<+=

mprzypadkuwprzeciwny

xxxf0

103

2)( 2

E(X) = 7/12

Mo = 1

Me obliczę z równania F(Me) = 1/2; Me = 9/24

Q3 ← F(Q3 ) = 3/4 stąd Q3 =41/64

Page 17: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Zmienna losowa wielowymiarowa

• Dana jest przestrzeń probabilistyczna (Ω, S, P) i w tej przestrzeni n zmiennych losowych X1,X2,...,Xn

Definicja

Uporządkowany układ n zmiennych losowych, oznaczony

X= (X1,X2,...,Xn) nazywamy wektorem losowym lub n -wymiarową zmienną losową, co oznacza, że każdemu zdarzeniu ω ∈ Ω przyporządkowano punkt przestrzeni euklidesowej Rn

Funkcję PX(A) = P(ω: X(ω) ∈A) nazywamy rozkładem prawdopodobieństwa wektora losowego X, a jego dystrybuanta jest określona wzorem

FX(x) = P(X1<x1,X2<x2,...,Xn<xn )

Page 18: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Przykłady

• Badamy trzy cechy człowieka :

– wiek , ω1 ∈ [18,100] [lat]

– wzrost, ω2 ∈ [140, 210][cm]

– waga, ω3 ∈ [40,150][kg]

ω = (ω1, ω2 , ω3 )∈ ΩZmienne losowe definiuję następująco:

X1( ω)= ω1

X2 ( ω)= ω2

...

Xn ( ω)= ωn

Page 19: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Tablicowa reprezentacja dwuwymiarowego rozkładu zmiennej losowej skokowej

Y=y1 Y= y2Y= y3 Y= y4 Y= y5 Y= y6

Rozkładbrzegowy

zmiennej X

X= x1 p11 p12 p13 p1.

X= x2p2.

X= x1 p3.

Rozkładbrzegowy

zmiennej Yp.1 1

p21

p31

p22 p23 p24 p25 p26

p14 p15 p16

p.3p.2 p.4p.5 p.6

... ... ... ......

Page 20: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Dwuwymiarowa zmienna losowa (para zmiennych) typu skokowego

• Def. Dwuwymiarowa zmienna losowajest typu skokowegojeśli przyjmuje skończoną lub co najwyżej przeliczaną liczbę wartości (x1,yj), (i,j=1,2,…. ) odpowiednio z prawdopodobieństwami pi,j

• Zachodzi przy tym warunek:(*)

∑ ∑ =i j

i jp 1

( )( ),...2,1,, ==== jiyYxXPp jiji

gdzie

Uwaga, w celu właściwej interpretacji wartości p i,j , należy pamiętać, że zapis (X=xi,Y=yj) oznacza iloczyn zdarzeń X=xi i Y=y j

Page 21: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Niezależność zmiennych losowychtypu skokowego

Para (X, Y) jest dwuwymiarową

zmienną losową typu skokowego,

Zmienne X i Y nazywamy niezależnymi,

jeśli dla każdej pary wartości (xi, yj)

spełniony jest warunek:

P(X=xi,Y=yj)= P(X=xi) *P(Y=y j)

czyli

pij= pi. * p.j

Oznacza to, że zmienne losowe X i Y są

niezależne jeśli prawdopodobieństwa

w łącznym rozkładzie tych zmiennych są

równe iloczynowi odpowiednich

prawdopodobieństw ich rozkładów

brzegowych.

)()|( ..

iij

ijji xXPp

p

pyYxXP ======

)()|( ..

jji

ijij yYPp

p

pxXyYP ======

Dla zmiennych niezależnych musi być spełniony warunek:

oraz

Page 22: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Dystrybuantą dwuwymiarowej zmiennej losowej nazywamy funkcję

rzeczywistą określoną wzorem:

• dla zmiennej losowej typu skokowego

Dystrybuanta dwuwymiarowej zmiennej losowej

( ) jiyyxxpyxF

ji ≤≤∑∑=,

( ) ( ) ( )F x y P X x Y y f u v dudvx y

, , ,= ≤ ≤ = ∫ ∫−∞ −∞

• dla zmiennej losowej typu ciągłego

Page 23: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

• Funkcją gęstości dwuwymiarowej zmiennej losowej (X,Y) typu ciągłego nazywamy funkcję rzeczywistą określoną wzorem:

Rozkład dwuwymiarowej zmiennej losowej typu ciągłego

( ) ( )f x y

P x X x x y Y y y

x yxy

, lim,

=< < + < < +

→→

∆∆

∆ ∆∆ ∆0

0

o następujących własnościach:

,

( )f x y, ≥ 0 Ryx ∈,dla

,

( )∫ ∫ =− ∞

+ ∞

− ∞

+ ∞f x y d x d y, 1

( ) ( )∫ ∫ = < ≤ < ≤x

x

y

y

f x y dxdy P x X x y Y y1

2

1

2

1 2 1 2, ,

Page 24: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny
Page 25: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Dwuwymiarowy rozkład normalny

Funkcja gęstości dwuwymiarowego rozkładu normalnego N(µ1,µ2,σ1,σ2,ρ)

Page 26: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

( ) ( )f x f x y dy1 = ∫−∞

+∞, ;

( ) ( )f y f x y dx2 = ∫−∞

+∞,

Brzegowe funkcje gęstości

Page 27: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Warunkowe funkcje gęstości:

( ) ( )( )f x y

f x y

f y/

,;=

2

( ) ( )( )f y x

f x y

f x/

,=

1

Page 28: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Niezależność dwuwymiarowych zmiennych losowych ciągłych

Zmienne losowe X i Y typu ciągłego są niezależne, jeśli dla dowolnej pary liczb rzeczywistych (x,y) zachodzi równość:

( ) ( ) ( )yfxfyxf 21, =

Page 29: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Momenty zwykłe

dwuwymiarowej zmiennej losowej

( ) ( ) ( ) 011011 mmYEXEXYEm ===

Momentem zwykłym rzędu kl, dwuwymiarowej zmiennej losowej (X, Y) nazywamy wyrażenie

( )

∑∑

==∫ ∫∞

∞−

∞−

dxdyyxfyx

pyx

YXEmlk

jil

jk

iji

lkkl

),(

Na przykład

Page 30: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Parametry rozkładu dwuwymiarowej

zmiennej losowej typu skokowego

Wartością oczekiwaną dwuwymiarowej zmiennej losowej typu skokowego nazywamy wyrażenie:

Wariancją dwuwymiarowej zmiennej losowej

typu skokowego nazywamy wyrażenie:

( ) ( ) ( ) jijiji

pyxYEXEYXE ∑∑==,

( ) ( )[ ] ( )[ ] =−−= 222 , YEYXEXEYXD

( )[ ] ( )[ ] jijiji

pYEyXEx 22 −−∑∑=

Page 31: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Momenty centralnedwuwymiarowej zmiennej losowej

Momentem centralnym rzędu k+l (k,l= 0,1,2,... )

dwuwymiarowego rozkładu zmiennej losowej (X,Y)

nazywamy wyrażenie

( )

∫ ∫∞

∞−

∞−

−−

−−∑∑

=−−=

dxdyyxfmymx

pmymx

mYmXE

lk

jil

jk

iji

lkkl

),()()(

)()(

)()(

0110

0110

0110µ

Wzór dla zmiennej skokowej

Wzór dla zmiennej ciągłej

Page 32: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

( ) ( )[ ] ( )[ ]

( ) xyxyYX

YEYXEXEYX

σµ ===

−−=

11cov,cov

)(,cov

Parametry dwuwymiarowych zmiennych losowych Kowariancja

Def. Kowariancją zmiennej losowej dwuwymiarowej (X,Y)nazywamy wyrażenie:

Page 33: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Wzory na obliczanie kowariancji

dla zmiennej losowej ciągłej

( )[ ] ( )[ ] jijiji

pYEyXExYX −−∑∑=),cov(

( )( ) dydxxfmymx yxxy ∫ ∫+∞

∞−

+∞

∞−

−−= )(σ

( )( )yyxxn

Si

n

iixy

−∑ −== 1

1

Jeśli zmienne X i Y są niezależne to cov(X,Y)=0,Twierdzenie odwrotne w ogólności nie jest prawdziwe

dla danych empirycznych

dla zmiennej losowej skokowej

Page 34: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Parametry dwuwymiarowych zmiennych losowychParametry dwuwymiarowych zmiennych losowych

WspWspóółłczynnik korelacji liniowej czynnik korelacji liniowej

2002

11

µµµρ =

)()(

),cov(

YDXD

YX=ρ

Page 35: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Współczynnik korelacji liniowej

• Współczynnik korelacji opisuje siłę liniowego związku pomiędzy dwiema zmiennymi.

• Przyjmuje on wartości z przedziału domkniętego <-1; 1>.

• Wartość -1 oznacza występowanie doskonałej korelacji ujemnej (to znaczy sytuację, w której punkty leżądokładnie na prostej, skierowanej w dół), a wartość 1 oznacza doskonałą korelację dodatnią (punkty leżądokładnie na prostej, skierowanej w górę).

• Wartość 0 oznacza brak korelacji liniowej

Page 36: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Przykłady układów punktów przy różnych wartościach współczynnika korelacji liniowej

Page 37: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Analiza rozkładu łącznego –zmiennej dwuwymiarowej (X,Y)

Y= pęknięcie

Y= zgorzelina

Y= mat.pow

Y= wżery

Y= skaza

Y= inne

Rozkładzmiennej

X

X= duże 0.05 0.01 0.02 0.01 0.11 0.06 0.26

X= średnie

0.1 0.03 0.06 0.02 0.09 0.03 0.33

X= małe 0.1 0.06 0.01 0.03 0.20 0.01 0.41

Rozkładzmiennej

Y

0.25 0.1 0.09 0.06 0.40 0.10 1

Rozkłady brzegowe zmiennych losowych Y i X

Page 38: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Analiza rozkładu łącznego – (JPD)zmiennej dwuwymiarowej (X,Y)

• Na podstawie tablicy JPD można obliczać prawdopodobieństwa dowolnych zdarzeń losowych (każde zdarzenie jest sumą zdarzeńelementarnych/atomowych)

• W wierszuj oraz kolumnie i tabeli JPD, znajduje sięprawdopodobieństwo zdarzenia atomowego polegającego na jednoczesnym przyjęciu wartości yi przez zmienną Y oraz wartości xj przez zmienną X, np. P(X= średnia,Y= skaza) = 0.09.

• W ostatnim wierszu tabeli nr 1 zamieszczono rozkład zmiennej Y, który uzyskuje się w wyniku sumowania wartości pól w kolumnach,

• W ostatniej kolumnie zamieszczono rozkład zmiennej X, uzyskany w wyniku sumowania wartości pól w wierszach, są to rozkłady brzegowe zmiennej (X,Y).

• Suma prawdopodobieństw wszystkich zdarzeń atomowych wynosi 1(jest to warunek konieczny, wynikający z definicji rozkładu prawdopodobieństw)

Page 39: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Zastosowania tablicowej reprezentacji JPD

• Prawdopodobieństwo zdarzenia polegającego na tym, że wylosowano wyrób ze skazą lub jakąkolwiek małą wadą(Y = skaza lub X = mała) można obliczyć z tabeli JPD dodając wszystkie wartości w kolumnie Y = skazai wierszu X = mała, licząc zawartość pola na przecięciu kolumny „skaza” i wiersza „mała’ tylko jeden raz.

0.1 + 0.06 + 0.01 + 0.03 + 0.2 +0.01+ 0.09 + 0.11 = 0.61

• Wynik ten jest taki sam jak dla prawdopodobieństwa sumy zdarzeń (X ∪ Y), bo:

P (X ∪ Y) = P(X) + P(Y) – P(X ,Y)

= 0.41 + 0.4 - 0.2 = 0.61

Page 40: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Prawdopodobieństwo warunkowePrawdopodobieństwo łączne

Prawdopodobieństwa warunkowe można obliczyćkorzystając z tablicy JPD, np.

• P(pęknięcie/małe) = P(pęknięcie,małe) : P(małe)

= 0,1 : 0,41= 0,244

• P(małe /pęknięcie) = P(pęknięcie,małe) :P(pęknięcie)

= 0,1: 0,25 = 0,4

• Prawdopodobieństwo łączne:

P(A,B) = P(A ∩ B)= P(A/B) * P(B)

Page 41: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Zadanie

• Dany jest rozkład zmiennej losowej (X,Y)

YX

1 2 3

3 0,2 0,2 0

4 0,1 0,2 0,3

1. Znaleźć rozkłady brzegowe i obliczyć E(X) i D(X).2. Wyznaczyć rozkład warunkowy P(X/Y=1) i obliczyć wartość

oczekiwaną w tym rozkładzie. 3. O czym świadczy porównanie wyników E(X) i E(X/Y=1) ?

Page 42: Rozkład normalny Parametry rozkładu zmiennej losowej Zmienne …home.agh.edu.pl/~adan/wyklady/siod4-2014.pdf · 2014-03-28 · Statystyka i opracowanie danych – W4 Rozkład normalny

Zadanie 2

Dwuwymiarowa zmienna losowa (XY) posiada następujący rozkład:

xi

y j

0 1

1 0,1 0,1

4 0,1 0,2

7 0,0 0,5

Wyznaczyć momenty zwykłe rzędu pierwszego zmiennej losowej X oraz (X/Y=0). Jaki wniosek wynika z porównania obliczonych wartości?Wyznaczyć wartość oczekiwaną zmiennej losowej (XY)Wiedząc, że E(Y)=0,8 obliczyć kowariancję w tym rozkładzie. Czy jej wynik potwierdza wniosek z punktu a)?