biẾn ngẪu nhiÊn khái niệm là biếnngẫu mỘt chiỀu–x biếnđộng, dao động,...

11
2/14/2019 1 CHƯƠNG 2 BIẾN NGẪU NHIÊN MỘT CHIỀU 1 2.1 Khái niệm và phân loại Khái niệm. Biến số gọi là biến ngẫu nhiên (random variable) nếu trong kết quả của phép thử nó sẽ nhận một và chỉ một giá trị có thể có của nó tùy thuộc vào sự tác động của các nhân tố ngẫu nhiên. Ký hiệu: X, Y, Z … hay X1,X2,… Giá trị có thể có của bnn: chữ thường x, y, z, … {X≤x} {Y=y} là các biến cố ngẫu nhiên. 2 Ví dụ 1 X: Lượng khách vào một cửa hàng trong ngày Y: Tuổi thọ của một chiếc điện thoại Trả ngẫu nhiên 3 mũ bảo hiểm cho 3 người. Gọi Z: số mũ bảo hiểm được trả đúng người T: Số sản phẩm hỏng trong 100 sản phẩm mới nhập về U: Chiều cao của một sinh viên gọi ngẫu nhiên trong lớp này 3 Phân loại bnn 4 Phân loại 5 Rời rạc - Hữu hạn giá trị - Vô hạn đếm được giá trị - Xác suất tập trung tại các điểm giá trị Biến ngẫu nhiên Liên tục - Giá trị lấp đầy một hay vài khoảng hữu hạn hoặc vô hạn - Xác suất tại từng khoảng giá trị - Xác suất không tập trung tại các điểm P(X=a)=0 với mọi a Ví dụ 2 Hộp có 6 viên bi gồm 4 trắng và 2 vàng. Lấy ngẫu nhiên 2 viên bi từ hộp. Đặt Y là số viên bi vàng có trong 2 viên lấy ra. Khi đó Y cũng là biến ngẫu nhiên. Ta có: “Y=0”, “Y=1”, “Y<2” là các biến cố nào??? 6 012 ;; Y

Upload: others

Post on 07-Jan-2020

23 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: BIẾN NGẪU NHIÊN Khái niệm là biếnngẫu MỘT CHIỀU–X biếnđộng, dao động, phân tán hơnY –Y ổnđịnh, đồngđềuhơnX •Trong kỹthuậtphươngsai

2/14/2019

1

CHƯƠNG 2

BIẾN NGẪU NHIÊNMỘT CHIỀU

1

2.1 Khái niệm và phân loại

• Khái niệm. Biến số gọi là biến ngẫu nhiên (randomvariable) nếu trong kết quả của phép thử nó sẽnhận một và chỉ một giá trị có thể có của nó tùythuộc vào sự tác động của các nhân tố ngẫunhiên.

• Ký hiệu: X, Y, Z … hay X1,X2,…

• Giá trị có thể có của bnn: chữ thường x, y, z, …

• {X≤x} {Y=y} là các biến cố ngẫu nhiên.

2

Ví dụ 1

• X: Lượng khách vào một cửa hàng trong ngày

• Y: Tuổi thọ của một chiếc điện thoại

• Trả ngẫu nhiên 3 mũ bảo hiểm cho 3 người. Gọi Z:số mũ bảo hiểm được trả đúng người

• T: Số sản phẩm hỏng trong 100 sản phẩm mớinhập về

• U: Chiều cao của một sinh viên gọi ngẫu nhiêntrong lớp này

3

Phân loại bnn

4

Phân loại

5

Rời rạc- Hữu hạn giá trị- Vô hạn đếm được giátrị- Xác suất tập trung tạicác điểm giá trị

Biến ngẫu nhiên

Liên tục- Giá trị lấp đầy một hay vàikhoảng hữu hạn hoặc vô hạn- Xác suất tại từng khoảng giátrị- Xác suất không tập trung tạicác điểmP(X=a)=0 với mọi a

Ví dụ 2

• Hộp có 6 viên bi gồm 4 trắng và 2 vàng. Lấy ngẫunhiên 2 viên bi từ hộp. Đặt Y là số viên bi vàng cótrong 2 viên lấy ra.

• Khi đó Y cũng là biến ngẫu nhiên.

• Ta có:

• “Y=0”, “Y=1”, “Y<2” là các biến cố nào???

6

0 1 2; ;Y

Page 2: BIẾN NGẪU NHIÊN Khái niệm là biếnngẫu MỘT CHIỀU–X biếnđộng, dao động, phân tán hơnY –Y ổnđịnh, đồngđềuhơnX •Trong kỹthuậtphươngsai

2/14/2019

2

Hai biến ngẫu nhiên độc lập

• Hai biến ngẫu nhiên X, Y độc lập nếu hai biến cố:

• Độc lập nhau với mọi giá trị của x, y.

• Nói cách khác mọi biến cố liên quan đến hai biếnngẫu nhiên X, Y luôn độc lập nhau.

7

X x Y y

2.2 Quy luật phân phối xác suất

8

• Biểu diễn quan hệ giữa các giá trị của biến ngẫunhiên và xác suất tương ứng.

Luật phân phối xác suất

Hàm phân bố xácsuất (CDF)

Rời rạc+ Liêntục

Xác suất bên tráiTỷ lệ bên trái

F(x)

Hàm khối xác suất(PMF)

Rời rạc Xác suất tại điểm p(x)f(x)

Hàm mật độ xácsuất (PDF)

Liên tục Mật độ xác suất f(x)

9

• Biểu diễn quan hệ giữa các giá trị của biến ngẫunhiên và xác suất tương ứng.

• Thường gặp 3 dạng:

Hàm phân phối xác suất

• Hàm phân phối xác suất (Cumulative DistributionFunction), viết tắt CDF của biến ngẫu nhiên X làhàm xác định:

• {X≤x} : biến cố “bnn X nhận giá trị nhỏ hơn haybằng x”

• Đôi khi ta còn gọi là hàm phân bố xác suất hayhàm tích lũy xác suất.

10

( ) ;X xF x P X x

Tính chất

11

i) 0 1,XF x x R

ii) XF x là hàm không giảm, liên tục bên phải. Nếu

X là biến ngẫu nhiên liên tục thì F x là hàm liên tục

trên R.

iii) lim 0X Xx

F F x

lim 1X Xx

F F x

iv) X XP a X b F b F a .

Hàm phân phối xác suất

12

Page 3: BIẾN NGẪU NHIÊN Khái niệm là biếnngẫu MỘT CHIỀU–X biếnđộng, dao động, phân tán hơnY –Y ổnđịnh, đồngđềuhơnX •Trong kỹthuậtphươngsai

2/14/2019

3

Hàm khối xác suất

• Probability Mass Function (PMF)

• Tính chất:

13

Xp x P X x

) 0

) 1

)

X

X

x

X

x A

i p x

ii p x

iii P A p x

• Dạng bảng

• Dạng đồ thị

Bnn Rời rạc - Bảng ppxs

• Bảng phân phối xác suất của X.

• xi : giá trị có thể có của bnn X

• pi : xác suất tương ứng;

14

X x1 …. x2 …. xn

P p1 …. p2 …. pn

1

)) ( ) (

) 1

i X

n

i

i

i ii p p x

i

x

p

P X

i

PMF và CDF

15

PMF và CDF

• Hàm phân phối xác suất được xác định như sau:

16

1

1 1 2

1 2 2 3

1 1 1

0 ,

,

,

............................................

... ,

X

k k k

x x

p x x x

F x p p x x x

p p x x x

k

X X k

x x

F x P X x p x

Ví dụ 3

Xét phép thử tung hai đồng xu phân biệt.

Không gian mẫu là: Ω = {𝑆𝑆; 𝑆𝑁;𝑁𝑆;𝑁𝑁}

Gọi X là số lần mặt sấp xuất hiện, X là bnn rời rạc.

Hàm khối xác suất:

17

1/ 4 ; 0 2

1/ 2 ; 1

0 ; 0; 1; 2

X

x hay x

p x x

x

Ví dụ 3

• Hàm phân phối xác suất:

18

X 0 1 2

P 1/4 1/2 1/4

0 , 0

1/ 4 ,0 1

3 / 4 ,1 2

1 ,2

X

x

xF x

x

x

Page 4: BIẾN NGẪU NHIÊN Khái niệm là biếnngẫu MỘT CHIỀU–X biếnđộng, dao động, phân tán hơnY –Y ổnđịnh, đồngđềuhơnX •Trong kỹthuậtphươngsai

2/14/2019

4

Ví dụ 4

• Một hộp có 10 sản phẩm trong đó có 6 sản phẩmđạt loại A. Lấy ngẫu nhiên 2 sản phẩm.

• Lập bảng phân phối xác suất của số sản phẩmloại A lấy ra?

• Xác định PMF, CDF?

19

Ví dụ 5

Có 2 kiện hàng. Kiện 1 có 4 sản phẩm tốt, 3 sảnphẩm xấu. Kiện 2 có 6 sản phẩm tốt, 4 sản phẩmxấu. Lấy ngẫu nhiên từ kiện 1 ra 2 sản phẩm và từkiện 2 ra 1 sản phẩm.

a) Lập bảng phân phối xác suất của số sản phẩm tốttrong 3 sản phẩm lấy ra?

b) Xác định PMF, CDF

20

Ví dụ 6

• Luật Benford phát biểu rằng trong một lượng rấtlớn các số thực ngoài đời, chữ số đầu tiên tuântheo luật phân phối với 30% là số 1, 18% là số 2 vànói chung:

• Với D là chữ số đầu tiên của một phần tử chọnngẫu nhiên.

• Luật phân phối trên có hợp lý không?

21

10

1log , {1,2,3...,9}

jP D j j

j

Chú ý về BNN liên tục

• Nếu X là bnn liên tục thì:

22

) 0,)

)

(

X a a

ii P a X b P a

i

X

P

b

Hàm mật độ xác suất

23

• Probability Density Function

• Viết tắt: PDF

24

) 0

) 1

i f x x R

ii f x dx

Hàm mật độ xác suất

Page 5: BIẾN NGẪU NHIÊN Khái niệm là biếnngẫu MỘT CHIỀU–X biếnđộng, dao động, phân tán hơnY –Y ổnđịnh, đồngđềuhơnX •Trong kỹthuậtphươngsai

2/14/2019

5

PDF và CDF

25

f x

x

F x

x

F x f t dt

f x F x

Ví dụ 7

• Cho biến ngẫu nhiên X có CDF dạng:

• A) Xác định hệ số k

• B) Tìm PDF

26

2

0 , 0

,0 1

1 ,1

x

F x kx x

x

Ví dụ 8

• Cho biến ngẫu nhiên X có PDF dạng:

• A) Xác định hệ số k

• B) Tìm hàm CDF

• C) Tính P(2<X<3)

• D) Thực hiện 4 lần phép thử độc lập với bnn X.Tính xác suất bnn X không nhận giá trị trongkhoảng (2;3)

27

21

kf x x

x

2.3 Các tham số của biến ngẫu nhiên

• Kỳ vọng (Expected Value) E(X)

• Phương sai (Variance) V(X), Var(X)

• Độ lệch chuẩn (Standard Deviation)

• Mốt (Mode) m0

• Trung vị (Median) me

• Hệ số biến thiên (Coefficient of Variation) CV

• Hệ số bất đối xứng (Skewness)

• Hệ số nhọn (Kurtosis)

• Giá trị tới hạn

28

Kỳ vọng (Expected Value)

• Kỳ vọng toán học của bnn X được ký hiệu là E(X)hay và tính theo công thức sau:

• E(X) là trung bình theo xác suất của X

• E(X) là số xác định và có cùng đơn vị với X

29

Tính chất

30

Page 6: BIẾN NGẪU NHIÊN Khái niệm là biếnngẫu MỘT CHIỀU–X biếnđộng, dao động, phân tán hơnY –Y ổnđịnh, đồngđềuhơnX •Trong kỹthuậtphươngsai

2/14/2019

6

Ví dụ 9

• Tung một cục xúc sắc nhiều lần. Gọi X là số chấmmặt ngửa của cục xúc sắc.

• Tính kỳ vọng của X

• Về lâu dài (in a long run) giá trị trung bình củanhững lần tung là bao nhiêu?

Ý nghĩa kỳ vọng

• Là giá trị trung bình của bnn (trong một quá trìnhlâu dài); phản ánh giá trị trung tâm của ppxs củabnn

• Trong thực tế sản xuất hay kinh doanh, nếu cầnchọn phương án cho năng suất cao ta chọnphương án cho năng suất kì vọng cao

32

Ví dụ 10

• Một nhân viên bán hàng có 2 cuộc hẹn trong 1ngày. Với cuộc hẹn thứ nhất, khả năng thành công(ký được hợp đồng) là 0,7 và lợi nhuận dự kiến là1000$. Với cuộc hẹn thứ 2, khả năng thành cônglà 0,4 và lợi nhuận là 1500$. Giả sử kết quả cáccuộc hẹn độc lập nhau. Lợi nhuận kỳ vọng củanhân viên bán hàng là bao nhiêu?

33

Ví dụ 11

• X là tuổi thọ của một loại thiết bị điện tử

• Tìm tuổi thọ trung bình của loại thiết bị này.

34

3

20.000100f x x

x

Ví dụ 12

• Nhu cầu hàng ngày của một loại thực phẩm tươi sống ở1 khu vực là bnn rời rạc có ppxs:

• Giả sử khu vực này chỉ có 1 cửa hàng và cửa hàng nàynhập mỗi ngày 100kg thực phẩm.

• Giá nhập là 40 ngàn/kg; bán ra là 60 ngàn/kg. Nếu thựcphẩm không bán được trong ngày thì phải bán với giá20/kg ngàn mới hết hàng.

• Muốn có lãi trung bình cao hơn thì cửa hàng có nênnhập thêm 20kg mỗi ngày hay không

35

X 80 100 120 150

P 0,2 0,4 0,3 0,1

Ví dụ 13

• Cho bnn X có hàm mật độ:

• A) Kiểm tra lại tính hợp lý của PDF trên

• B) Tính E(X)

• Biến ngẫu nhiên X như trên gọi là có phân phối mũvới tham số λ. Ký hiệu: X~E(λ)

36

0xf x e x

Page 7: BIẾN NGẪU NHIÊN Khái niệm là biếnngẫu MỘT CHIỀU–X biếnđộng, dao động, phân tán hơnY –Y ổnđịnh, đồngđềuhơnX •Trong kỹthuậtphươngsai

2/14/2019

7

Ví dụ 14

• Tính kỳ vọng của bnn X rời rạc có hàm mật độ:

37

21 2 3

CP X k p k k

k , , , ,...

Kỳ vọng của hàm của bnn

• Cho bnn X và hàm (x). Đặt Y=(X) là bnn

• Kỳ vọng toán học của Y:

38

𝐸 𝜑 𝑋 =

𝑖

𝜑 𝑥𝑖 𝑝 𝑥𝑖 , nếu X rời rạ𝑐

−∞

+∞

𝜑 𝑥 𝑓 𝑥 𝑑𝑥 , nếu X liên tục

Ví dụ 15

• Xét hai bnn sau:

• So sánh E(X) và E(Y)

• Vẽ đồ thị và nhận xét về mức độ biến thiên của X,Y

39

X 3 4 5

P 0,3 0,4 0,3

Y 1 2 6 8

P 0,4 0,1 0,3 0,2

Phương sai

• Định nghĩa. Phương sai (variance) của bnn X, kýhiệu là V(X) được tính theo công thức:

• Rút gọn:

40

2

V X E X E X

22V X E X E X

Ý nghĩa của phương sai

• Phương sai đo độ dao động của các giá trị của Xxung quanh kỳ vọng toán E(X)

• Phương sai có đơn vị là bình phương đơn vị của X

• Nếu X, Y cùng đơn vị, cùng ý nghĩa, V(X)>V(Y) thì:

– X biến động, dao động, phân tán hơn Y

– Y ổn định, đồng đều hơn X

• Trong kỹ thuật phương sai đặc trưng cho sai sốcủa thiết bị. Trong kinh tế, phương sai đo độ rủi rocủa các quyết định.

41

Tính chất của phương sai

42

Page 8: BIẾN NGẪU NHIÊN Khái niệm là biếnngẫu MỘT CHIỀU–X biếnđộng, dao động, phân tán hơnY –Y ổnđịnh, đồngđềuhơnX •Trong kỹthuậtphươngsai

2/14/2019

8

Ví dụ 16

• Tiền lãi khi đầu tư 1 tỷ đồng vào các ngành A, B làcác bnn độc lập X, Y:

• Muốn lãi trung bình cao hơn thì đầu tư vào ngànhnào?

• Muốn rủi ro thấp hơn thì đầu tư vào ngành nào?

• Muốn rủi ro thấp nhất thì chia vốn đầu tư theo tỷlệ nào?

43

X 0 15 30

P 0,3 0,5 0,2

Y -2 15 35

P 0,2 0,45 0,35

Ví dụ 17

• Đầu tư a tỷ vào ngành A và b tỷ vào ngành B trong 1tháng. Tìm trung bình và phương sai của tổng tiền lãitrong 1 tháng?

• Đầu tư 2 tỷ vào ngành A trong một tháng. Tìm trungbình và phương sai của tiền lãi thu được.

• Mỗi tháng đầu tư vào ngành A 1 tỷ, độc lập nhau. Tìmtrung bình và phương sai của tổng tiền lãi trong 2tháng. Tính xác suất tổng tiền lãi không dưới 50 triệu.

• Tìm xác suất đầu tư vào A được lãi cao hơn B?

44

X 0 15 30

P 0,3 0,5 0,2

Y -2 15 35

P 0,2 0,45 0,35

Độ lệch chuẩn

• Định nghĩa. Độ lệch chuẩn (standard deviation)của bnn X, ký hiệu (X) hay X, là căn bậc hai củaphương sai.

• Độ lệch chuẩn cũng đo mức độ phân tán, daođộng của bnn X và có ý nghĩa tương tự phươngsai.

• Độ lệch chuẩn có cùng đơn vị với bnn X.

45

X V X

Ví dụ 18

46

Ví dụ 19

47

Chuẩn hóa biến ngẫu nhiên

• Cho X là bnn có kỳ vọng và độ lệch chuẩn >0.

• Đặt:

• Ta có:

• Biến Z gọi là bnn chuẩn hóa của bnn X.

48

XZ

0 1E Z V Z

Page 9: BIẾN NGẪU NHIÊN Khái niệm là biếnngẫu MỘT CHIỀU–X biếnđộng, dao động, phân tán hơnY –Y ổnđịnh, đồngđềuhơnX •Trong kỹthuậtphươngsai

2/14/2019

9

Tuổi thọ của một loại côn trùng M là biến ngẫu nhiênX (đơn vị: tháng) với PDF như sau:

• Tìm hằng số k?

• Xác định CDF?

• Tính tuổi thọ trung bình của loại côn trùng trên.

49

2 4 , 0 4f x kx x x

Ví dụ 20 Hệ số biến thiên

• Định nghĩa. Hệ số biến thiên (coefficient of variation)của X ký hiệu là CV(X) được tính theo công thức:

• Kí hiệu: CV(X).

• Hệ số biến thiên có đơn vị là %.

• Hệ số biến thiên đo độ phân tán tương đối.

• Có thể so sánh hệ số biến thiên của nhiều bnn khácnhau, không cần cùng đơn vị, ý nghĩa, không có cùngkỳ vọng.

50

.100% 0XCV X E XE X

Median (Trung vị)

• Định nghĩa. Trung vị của bnn X, ký hiệu MedX, me

là giá trị nằm ở chính giữa phân phối xác suất

• Nếu X rời rạc:

• Nếu X liên tục:

51

0,5

0,5

e

e

P X m

P X m

0,5em

f x dx

Mode X

• Định nghĩa. Mốt (mode) của bnn X, ký hiệu mo làgiá trị ứng với xác suất lớn nhất (X rời rạc) hoặchàm mật độ f(x) lớn nhất (X liên tục).

• BNN X có thể có 1 mod, nhiều mod hoặc khôngcó mod

• Nếu X rời rạc:

• Nếu X liên tục:

52

0x R

f m max f x

0 ii

P X m max P x x

Ví dụ 21

Cho bnn X

Ta có:

Vậy

53

X 1 2 3 4 5

P 0,1 0,2 0,15 0,3 0,25

X 1 2 3 4 5

F(X) 0,1 0,3 0,45 0,75 1

4Med X Mod X

Ví dụ 22

• Cho bnn X có hàm mật độ xác suất

• Tìm MedX và ModX?

54

32 ,0 2

4

0 , 0,2

x x xf x

x

Page 10: BIẾN NGẪU NHIÊN Khái niệm là biếnngẫu MỘT CHIỀU–X biếnđộng, dao động, phân tán hơnY –Y ổnđịnh, đồngđềuhơnX •Trong kỹthuậtphươngsai

2/14/2019

10

Phân vị mức (1-𝛼)

• Định nghĩa. Với bnn X liên tục, phân vị (percentile)mức 1 − 𝛼 ký hiệu là 𝑥1−𝛼 là số thực thỏa mãn:

55

1 1 P X x

Giá trị tới hạn

• Định nghĩa. Với bnn X liên tục, giá trị tới hạn(critical value) mức 𝛼 (0 ≤ 𝛼 ≤ 1) ký hiệu là 𝑥𝛼 làsố thực thỏa mãn:

56

P X x

x

𝛼

Ví dụ 23

Tuổi thọ một loại côn trùng là X (tháng) có hàm mậtđộ

a) Tìm hằng số k

b) Tìm Mod(X)

c) Tìm xác suất côn trùng chết trước khi nó được 1tháng tuổi

57

2 4 , 0;4

0 , 0;4

kx x xf x

x

Ví dụ 24

Cho bnn X có hàm mật độ

và E(X)=0,6; V(X)=0,06

a) Tìm a,b,c?

b) Đặt Y=X3. Tính E(Y)

58

2 , 0;1

0 , 0;1

ax bx c xf x

x

Ví dụ 25

• Giả sử một cửa hàng sách định nhập về một sốcuốn truyện trinh thám. Nhu cầu hàng năm về loạisách này như sau:

• Cửa hàng mua sách với giá 7USD một cuốn, bán ravới giá 10USD một cuốn nhưng đến cuối năm phảihạ giá với giá 5USD một cuốn.

59

Nhu cầu (cuốn) 30 31 32 33

P 0,3 0,15 0,3 0,25

Ví dụ 25

• Nếu nhập về 32 cuốn thì lợi nhuận bán đượctrung bình là bao nhiêu?

• Xác định số lượng nhập sao cho lợi nhuận kì vọnglà lớn nhất.

60

Nhu cầu (cuốn) 30 31 32 33

P 0,3 0,15 0,3 0,25

Page 11: BIẾN NGẪU NHIÊN Khái niệm là biếnngẫu MỘT CHIỀU–X biếnđộng, dao động, phân tán hơnY –Y ổnđịnh, đồngđềuhơnX •Trong kỹthuậtphươngsai

2/14/2019

11

Bài tập chương 2

• 2.1; 2.2; 2.6; 2.7; 2.9;

• 2.10; 2.11; 2.14; 2.15; 2.17;

• 2.18; 2.10; 2.23; 2.24; 2.25

• 2.26; 2.27; 2.30; 2.31; 2.32

• 2.33; 2.34; 2.37

• Tất cả 23 bài.

61

Anscombe's quartet

62

Anscombe's quartet

I II III IV

x y x y x y x y

10.0 8.04 10.0 9.14 10.0 7.46 8.0 6.58

8.0 6.95 8.0 8.14 8.0 6.77 8.0 5.76

13.0 7.58 13.0 8.74 13.0 12.74 8.0 7.71

9.0 8.81 9.0 8.77 9.0 7.11 8.0 8.84

11.0 8.33 11.0 9.26 11.0 7.81 8.0 8.47

14.0 9.96 14.0 8.10 14.0 8.84 8.0 7.04

6.0 7.24 6.0 6.13 6.0 6.08 8.0 5.25

4.0 4.26 4.0 3.10 4.0 5.39 19.0 12.50

12.0 10.84 12.0 9.13 12.0 8.15 8.0 5.56

7.0 4.82 7.0 7.26 7.0 6.42 8.0 7.91

5.0 5.68 5.0 4.74 5.0 5.73 8.0 6.89

Anscombe's quartet

63

Anscombe's quartet

64

Property Value Accuracy

Mean of x 9 exact

Sample variance of x 11 exact

Mean of y 7.50 to 2 decimal places

Sample variance of y 4.125 ±0.003

Correlation between x and y 0.816 to 3 decimal places

Linear regression line y = 3.00 + 0.500x to 2 and 3 decimal places, respectively

Coefficient of determination of the linear regression

0.67 to 2 decimal places