tÀi liỆu hỌc tẬp - elearning.tdmu.edu.vn

65
1 TÀI LIỆU HỌC TẬP MÔN XÁC SUẤT THỐNG KÊ

Upload: others

Post on 02-Oct-2021

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

1

TÀI LIỆU HỌC TẬP

MÔN XÁC SUẤT THỐNG KÊ

Page 2: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

2

CHƢƠNG 0 Giải Tích Tổ Hợp

I. Bài Toán

Cho một tập hợp có n phần tử

Lấy ra k phần tử từ tập n phần tử được gọi là một mẫu cỡ k từ n phần tử đã cho.

Tính số mẫu được tạo thành với một số điều kiện nào đó.

II. Nguyên tắc nhân

Chia công việc ra nhiều giai đoạn

Giai đoạn 1 có thể thực hiện bằng 1

n cách

Giai đoạn 2 có thể thực hiện bằng 2

n cách

……………………………………………

Giai đoạn k có thể thực hiện bằng k

n cách

Vậy công việc sẽ được thực hiện bằng 1 2 k

n n ... n cách.

Ví dụ

Đi từ A B có 3 con đường

Đi từ B C có 2 con đường

Hỏi đi từ A B C có bao nhiêu cách ?

Từ A B có 3 cách

Từ B C có 2 cách

Vậy A B C có 3 2 6 cách.

III. Nguyên tắc cộng

Chia công việc thành nhiều trường hợp.

Trường hợp 1 có 1

n cách thực hiện

Trường hợp 2 có 2

n cách thực hiện

..........................................................

Trường hợp k có k

n cách thực hiện

Vậy số cách thực hiện công việc là ...1 2 k

n n n .

Ví dụ

Đi từ A C có hai trường hợp:

Trường hợp 1: A B C có 6 cách

Trường hợp 2: A D C có 2 cách

Vậy đi từ A C có 6 + 2 = 8 cách.

Page 3: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

3

IV. Một số công thức

1. Tổ hợp

Tổ hợp chập k từ n phần tử là mẫu không có thứ tự cỡ k từ n phần tử đã cho.

Số tổ hợp !

!( )!

k

n

nC

k n k

2. Hoán vị

Hoán vị của n phần tử là mẫu có thứ tự gồm n phần tử đã cho.

Số hoán vị: !n

P n

3. Chỉnh hợp

Chỉnh hợp chập k từ n phần tử là mẫu có thứ tự cỡ k từ n phần tử đã cho.

Số chỉnh hợp !

( )!

k

n

nA

n k

Page 4: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

4

PHẦN I XÁC SUẤT

CHƢƠNG 1 KHÁI NIỆM VỀ XÁC SUẤT

BÀI 1 PHÉP THỬ VÀ BIẾN CỐ

I. Đối tƣợng nghiên cứu của lý thuyết xác suất – thống kê

- Đối tượng nghiên cứu của lý thuyết xác suất thống kê là các hiện tượng ngẫu nhiên.

- Mục đích: tìm ra các qui luật của các hiện tượng ngẫu nhiên.

- Lý thuyết xác suất: tìm ra các mô hình xác suất cho các hiện tượng ngẫu nhiên.

- Lý thuyết thống kê: dựa vào dữ liệu thống kê (lấy từ thực tế) để chính xác hóa mô hình xác

suất, đưa ra các quyết định hoặc dự báo.

II. Biến cố

+ Phép thử là thực hiện một hành động hay một thí nghiệm nào đó mà ta không biết trước

được kết quả xảy ra Kí hiệu: T.

+ Biến cố là kết quả có thể có của phép thử. Kí hiệu: A, B, C, …

+ Biến cố chắc chắn: là biến cố nhất định xảy ra khi thực hiện phép thử. Kí hiệu:

+ Biến cố không thể: là biến cố nhất định không xảy ra khi thực hiện phép thử. Kí hiệu:

Ví dụ 1

Phép thử: tung một con xúc xắc.

1A = biến cố con xúc xắc xuất hiện mặt 1

2A = biến cố con xúc xắc xuất hiện mặt 2

…………………………………………

6A = biến cố con xúc xắc xuất hiện mặt 6

1 2 6{ , ,..., }A A A

= biến cố con xúc xắc xuất hiện mặt lớn hơn 6

*Các quan hệ trên biến cố

1. Biến cố tổng: C=A+B

Biến cố C được gọi là biến cố tổng của hai biến cố A và B nếu C xảy ra khi và chỉ khi A xảy ra

hoặc B xảy ra hoặc cả A và B cùng xảy ra (ít nhất một biến cố xảy ra).

2. Biến cố tích: C=A.B

Biến cố C được gọi là biến cố tích của hai biến cố A và B nếu C xảy ra khi và chỉ khi đồng thời

cả hai biến cố A và B cùng xảy ra.

Page 5: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

5

3. Biến cố xung khắc: A.B=

Hai biến cố A và B được gọi là xung khắc nếu chúng không thể xảy ra đồng thời.

4. Biến cố đối lập: A

A+A

A.A

Sự khác nhau giữa biến cố xung khắc và biến cố đối lập?

5. Biến cố kéo theo: biến cố A kéo theo biến cố B, hay biến cố A thuận lợi cho biến cố B, ký hiệu

AB. 6. Quan hệ bằng nhau: biến cố A = biến cố B khi AB và BA.

7. Hệ đầy đủ: các biến cố , ,...,1 2 n

A A A đƣợc gọi là một hệ đầy đủ nếu

Khi thực hiện phép thử thì một trong chúng xảy ra: ...1 2 n

A +A A

Chúng xung khắc với nhau từng đôi một: , 1,i j

A .A i j n

8. Không gian các biến cố sơ cấp: các biến cố , ,...,

1 2 nA A A được gọi là không gian các biến cố

sơ cấp nếu chúng là một hệ đầy đủ không thể tách nhỏ hơn.

III. Các tính chất phép toán biến cố

Page 6: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

6

Các phép toán biến cố , ,A B A.B A tương ứng với các phép toán tập hợp nên có tính chất

tương tự.

1. Giao hoán: A+B=B+A; AB=BA

2. Kết hợp: A+(B+C)=(A+B)+C=A+B+C

A(BC)=(AB)C=ABC

3. Phân phối: A(B+C)=AB+AC

4. Lũy đẳng: A+A=A, A.A=A

5. ; . ; ; .A A A A A A

6. Nếu B A thì A=B hay A=A

7. Luật đối ngẫu De Morgan: A+B = A.B ; A.B = A+B

Ví dụ 2

Hai người cùng bắn, mỗi người bắn một viên vào bia. Gọi

iA =biến cố người thứ i bắn trúng bia, 1,2i

Hãy viết các biến cố sau theo 1 2,A A :

a. Chỉ có người thứ nhất bắn trúng bia: 1 2.A A

b. Có đúng một người bắn trúng: 1 2 1 2. .A A A A

c. Có ít nhất một người bắn trúng: 1 2A A

d. Cả hai đều bắn trúng: 1 2.A A

e. Không ai bắn trúng: 1 2.A A

f. Có không quá một người bắn trúng: 1 2 1 2.A A A A

IV. Xác suất

Ví dụ 3

Một hộp có 6 bi trắng và 4 bi đỏ. Lấy ngẫu nhiên ra 1 bi.

Gọi A=biến cố lấy được bi trắng, B=biến cố lấy được bi đỏ.

Hỏi khả năng xảy ra biến cố nào lớn hơn?

Định nghĩa:

Xác suất của biến cố A chính là khả năng để xảy ra biến cố A.

Kí hiệu: P(A)

Xác suất phải thỏa các tiên đề sau:

1. ( ) 0AP

2. ( ) 1P

3. P(A+B)=P(A)+P(B) với A và B là hai biến cố xung khắc

Tính chất của xác suất:

1. ( ) ( ) 1A AP P

2. ( ) 0P

3. ( ) 1P A

4. Nếu A B thì ( ) ( )A BP P

V. Định nghĩa xác suất

Cho phép thử có là hữu hạn và đồng khả năng. Khi đó

[ ]( )

[ ]

AAP

với [A]: số phần tử của biến cố A

[ ] : số phần tử của

Page 7: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

7

* Đối với phép thử là tung đồng xu và tung con xúc xắc ta có thể hiểu

[A]: số biến cố có tính chất A

[ ] : số biến cố sơ cấp có trong .

Ví dụ 4

Tung một con xúc xắc. Tính xác suất biến cố con xúc xắc xuất hiện mặt lẻ.

Giải

1 2 6{ , ,..., }A A A với , 1,6bieán coá con xuùc xaéc xuaát hieän maët iiA i

[ ] 6

Đặt A=biến cố con xúc xắc xuất hiện mặt lẻ

Suy ra { }1 3 5

A A ,A ,A

[ ] 3A

Vậy [ ] 3

( )[ ] 6

AAP

.

* Đối với phép thử là chọn viên bi từ một hộp chứa viên bi hoặc chọn sản phẩm từ lô hàng thì ta

có thể hiểu

[A]: số phép thử thuận lợi cho biến cố A xảy ra.

[ ] : số phép thử đồng khả năng xảy ra.

Ví dụ 5

Một hộp có 6 bi trắng và 4 bi đỏ. Lấy ngẫu nhiên ra 1 bi.

a. Tính xác suất lấy được viên bi trắng.

b. Tính xác suất lấy được viên bi đỏ.

Giải

a. Đặt A=biến cố lấy được bi trắng

B=biến cố lấy được bi đỏ

+ { }A,B 1

10[ ] 10C ( mỗi cách chọn 1 viên bi từ 10 viên bi trong hộp là một phép thử đồng khả

năng xảy ra nên số phần tử của chính là số cách chọn 1 viên bi từ 10 viên bi trong hộp)

+1

6[ ] 6A C (mỗi cách chọn 1 viên bi từ 6 viên bi trắng trong hộp là một phép thử thuận lợi

cho biến cố A xảy ra nên số phần tử của biến cố A chính là số cách chọn 1 viên bi từ 6 viên bi

trắng trong hộp)

Vậy [ ] 6

( )[ ] 10

AAP

b. Tương tự ta có

1

4

1

10

[ ] 4( )

[ ] 10

BB

CP

C

Page 8: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

8

BÀI 2 MỘT SỐ CÔNG THỨC TÍNH XÁC SUẤT

1. Công thức cộng xác suất

* Cho hai biến cố A và B ta có

( ) ( ) ( ) ( )A+B A B ABP P P P

Ví dụ 1

Một lớp có 45 học viên. Số học viên giỏi môn Xác suất thống kê, giỏi Toán cao cấp, giỏi cả

môn Xác suất thống kê và Toán cao cấp của lớp cho trong bảng sau. Chọn ngẫu nhiên một bạn

trong lớp. Tìm xác suất để chọn được một bạn giỏi ít nhất một môn trong hai môn Xác suất

thống kê và Toán cao cấp.

Xác suất thống kê 25

Toán cao cấp 30

XSTK và Toán cao cấp 20

Giải

Gọi F = biến cố giỏi ít nhất một môn trong hai môn Xác suất thống kê và Toán cao cấp,

A = biến cố giỏi môn Xác suất thống kê , B = biến cố giỏi môn Toán cao cấp.

Ta có: F A B

Suy ra (F) (A) (B) (A.B)P P P P

mà 25

(A)45

P ; 30

(B)45

P ; 20

(A.B)45

P

Vậy 25 30 20 7

(F)45 45 45 9

P

* Chú ý nếu A, B xung khắc thì ( ) ( ) ( )A+B A BP P P

Ví dụ 2 Có 30 đề thi môn Toán cao cấp trong đó có 10 đề khó, 20 đề trung bình. Tìm xác suất để một

học viên bốc 2 đề, được ít nhất 1 đề khó.

Giải

Gọi F = biến cố được ít nhất 1 đề khó,

A = biến cố được 1 đề khó và 1 đề trung bình, B = biến cố được 2 đề khó.

Ta có: F A+B và AB

Suy ra ( ) ( ) ( )P F P A P B

1 1

10 20

2

30

( )AC C

PC

;

2

10

2

30

( )BC

PC

Vậy

1 1 2

10 20 10

2

30

( ) ( ) ( )F A BC C C

P P PC

2. Công thức nhân xác suất

a. Xác suất có điều kiện

Cho hai biến cố A và B. Xác suất của biến cố A với điều kiện biến cố B đã xảy ra được gọi là

Page 9: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

9

xác suất có điều kiện.

Kí hiệu: P(A/B)

Xác suất P(A/B) được tính theo công thức

( )( )

( )

ABA/B

B

PP

P

Tương tự ta có ( )

( )( )

ABB/A

A

PP

P

Ví dụ 3

Tung một con xúc xắc.

Gọi A=biến cố con xúc xắc xuất hiện mặt nhỏ hơn 4.

B=biến cố con xúc xắc xuất hiện mặt chẵn.

Tính P(A/B).

Giải

1 2 6{ , ,..., }A A A với iA =biến cố con xúc xắc xuất hiện mặt i, i=1,6 .

6

1 2 3{ , , }A A A A ,

2 4 6{ , , } 3B BA A A

2{ } 1A.B A.BA

1 3( ) , ( )

6 6

A.B BAB BP P

( ) 1( )

( ) 3

A.BA/B

B

PP

P

b. Công thức nhân xác suất

Từ công thức xác suất có điều kiện ta suy ra với hai biến cố A và B ta có

P(AB)=P(A).P(B/A)=P(B).P(A/B)

Ví dụ 4

Tìm hiểu về mã số mã vạch của hàng hoá

Để tạo thuận lợi và nâng cao năng suất, hiệu quả trong bán hàng và quản lý kho người ta thường

in trên hàng hoá một loại mã hiệu đặc biệt gọi là mã số mã vạch của hàng hoá. Mã số mã

vạch của hàng hoá bao gồm hai phần: mã số của hàng hoá và mã vạch là phần thể hiện mã số

bằng vạch để cho máy đọc.

Mã số của hàng hoá là một dãy con số dùng để phân định hàng hoá, áp dụng trong quá trình luân

chuyển hàng hoá từ người sản xuất, qua bán buôn, lưu kho, phân phối, bán lẻ tới người tiêu dùng.

Nếu thẻ căn cước giúp ta phân biệt người này với người khác thì mã số hàng hoá là “thẻ căn

cước” của hàng hoá, giúp ta phân biệt được nhanh chóng và chính xác các loại hàng hoá khác

nhau.

Mã số của hàng hoá có các tính chất sau:

- Nó là con số duy nhất đặc trưng cho hàng hoá. Mỗi loại hàng hoá được nhận diện bởi một dãy số

và mỗi dãy số chỉ tương ứng với một loại hàng hoá.

- Bản thân mã số chỉ là một dãy số đại diện cho hàng hoá, không liên quan đến đặc điểm của hàng

Page 10: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

10

hoá. Nó không phải là số phân loại hay chất lượng của hàng hoá, trên mã số cũng không có giá cả

của hàng hoá.

Hiện nay, trong thương mại trên toàn thế giới chủ yếu áp dụng hai hệ thống mã số hàng hoá sau:

- Hệ thống UPC (Universal Product Code) là hệ thống thuộc quyền quản lý của Hội đồng mã

thống nhất Mỹ UCC (Uniform Code Council, Inc.), được sử dụng từ năm 1970 và hiện vẫn đang

sử dụng ở Mỹ và Canada.

- Hệ thống EAN (European Article Number) được thiết lập bởi các sáng lập viên là 12 nước

châu Âu với tên gọi ban đầu là Hội EAN (European Article Numbering Association), được sử

dụng từ năm 1974 ở châu Âu và sau đó phát triển nhanh chóng, được áp dụng ở hầu hết các nước

trên thế giới. Chính vì lý do này nên từ năm 1977, EAN trở thành một tổ chức quốc tế với tên gọi

EAN quốc tế (EAN International)

Trong hệ thống mã số EAN cho sản phẩm bán lẻ có hai loại, một loại sử dụng 13 con số (EAN-

13) và loại kia sử dụng 8 con số (EAN-8)

Mã số EAN-13 gồm 13 con số có cấu tạo như sau: từ trái sang phải

+Mã quốc gia: hai hoặc ba con số đầu

+Mã doanh nghiệp: có thể gồm từ bốn, năm hoặc sáu con số

+Mã mặt hàng: có thể là năm, bốn, hoặc ba con số tùy thuộc vào mã doanh nghiệp

+ Số cuối cùng là số kiểm tra

Bài toán

Cho một hộp có 10 mã số hàng hoá trong đó có 2 mã số EAN-13. Lấy ngẫu nhiên lần lượt từ

trong hộp ra 2 mã số. Tính xác suất để 2 mã số này là mã số EAN-13.

Giải

Gọi A= biến cố mã số lấy lần thứ nhất là mã số EAN-13.

B= biến cố mã số lấy lần thứ hai là mã số EAN-13.

2 1 1( ) ( ) ( )

10 9 45AB A B/AP P P

* Với 3 biến cố A, B và C ta có

( ) ( ) ( ) ( )ABC A B/A C/ABP P P P

Ví dụ 5

Cho một hộp có 10 mã số hàng hoá trong đó có 3 mã số EAN-13. Lấy ngẫu nhiên lần lượt từ

trong hộp ra 3 mã số. Tính xác suất để 3 mã số này là mã số EAN-13.

Giải

Gọi A= biến cố mã số lấy lần thứ nhất là mã số EAN-13.

B= biến cố mã số lấy lần thứ hai là mã số EAN-13.

C= biến cố mã số lấy lần thứ ba là mã số EAN-13.

3 2 1 1( ) ( ) ( ) ( )

10 9 8 120ABC A B/A C/ABP P P P

* Định nghĩa: hai biến cố A và B đƣợc gọi là độc lập nếu

P(AB)=P(A)P(B)

Ta có thể hiểu A và B độc lập nghĩa là kết quả xảy ra của biến cố A không ảnh hưởng đến

kết quả xảy ra của biến cố B và ngược lại.

Ví dụ 6

Cho một hộp có 10 mã số hàng hoá trong đó có 2 mã số EAN-13. Lấy ngẫu nhiên lần lượt có

hoàn lại từ trong hộp ra 2 mã số. Tính xác suất để 2 mã số này là mã số EAN-13.

Giải

Gọi A= biến cố mã số lấy lần thứ nhất là mã số EAN-13.

B= biến cố mã số lấy lần thứ hai là mã số EAN-13.

Page 11: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

11

Ta có A và B độc lập

2 2 4( ) ( ) ( )

10 10 100AB A BP P P

* Định nghĩa: Các biến cố 1 2

{ , ,..., }n

A A A , n>2 được gọi là độc lập toàn phần nếu mỗi biến cố

độc lập với tích của k biến cố còn lại (1 1k n ).

Ví dụ 7

Ba biến cố A, B và C được gọi là độc lập toàn phần nếu:

A độc lập với B,C, BC

B độc lập với C,AC

C độc lập với AB

( ) ( ) ( ) ( )ABC A B CP P P P

Ví dụ 8

Cho một hộp có 10 mã số hàng hoá trong đó có 3 mã số EAN-13. Lấy ngẫu nhiên lần lượt có

hoàn lại từ trong hộp ra 3 mã số. Tính xác suất để 3 mã số này là mã số EAN-13.

Giải

Gọi A= biến cố mã số lấy lần thứ nhất là mã số EAN-13.

B= biến cố mã số lấy lần thứ hai là mã số EAN-13.

C= biến cố mã số lấy lần thứ ba là mã số EAN-13.

Ta có A, B và C độc lập toàn phần.

3 3 3 27( ) ( ) ( ) ( )

10 10 10 1000ABC A B CP P P P

3. Công thức xác suất toàn phần

Cho biến cố A và hệ đầy đủ 1 2, ,..., nA A A như sau:

Khi đó ta có công thức xác suất toàn phần

1 1 2 2( ) ( ) ( / ) ( ) ( / ) ... ( ) ( / )A n nP P A P A A P A P A A P A P A A

Chứng minh

Ta có

1 2 1 2

1 2

( ... ) ( , ,..., )

...

A A A do laø heä ñaày ñuûn n

n

A A A A A A

A A A A A A

Suy ra

1 2 1 2

1 2 1 2

1 1 2 2

( ) ( ... ) ( , ,...,

( ) ( ) ... ( ) , ,...,

( ) ( / ) ( ) ( / ) ... ( ) ( / )

A do xung khaéc töøng ñoâi moät

neân cuõng xung khaéc töøng ñoâi moät)

n n

n n

n n

P P A A A A A A A A A

P A A P A A P A A A A A A A A

P A P A A P A P A A P A P A A

Ví dụ 9

Một nhà máy có 3 máy cùng sản xuất một loại sản phẩm. Máy thứ nhất sản xuất 40% tổng sản

Page 12: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

12

lượng của nhà máy, máy thứ hai sản xuất 35% tổng sản lượng của nhà máy, máy thứ ba sản

xuất 25% tổng sản lượng của nhà máy. Tỉ lệ phế phẩm của 3 máy lần lượt là 0.04, 0.03, 0.02.

Lấy ngẫu nhiên một sản phẩm từ trong kho của nhà máy.

a. Tính xác suất sản phẩm lấy ra là phế phẩm.

Giải

Đặt A biến cố sản phẩm lấy ra là phế phẩm.

1A biến cố sản phẩm lấy được là của máy thứ nhất.

2A biến cố sản phẩm lấy được là của máy thứ hai.

3A biến cố sản phẩm lấy được là của máy thứ ba.

Khi đó 1 2 3, ,A A A là hệ đầy đủ.

Theo công thức xác suất toàn phần

1 1 2 2 3 3( ) ( ) ( / ) ( ) ( / ) ( ) ( / )

0.4 0.04 0.35 0.03 0.25 0.02 0.0315

P A P A P A A P A P A A P A P A A

4. Công thức Bayes

Cho biến cố A và hệ đầy đủ 1 2, ,..., nA A A

Khi đó ta có công thức Bayes

( ) ( / )( )

( )i

A /Ai iP A P A A

PP A

Chứng minh

Ta có:

( ) ( ) ( / )( )

( ) ( )i

A /Ai i iP A A P A P A A

PP A P A

*Ý nghĩa

Công thức Bayes dùng để đánh giá lại xác suất xảy ra của giả thiết iA trong điều kiện biến cố

A đã xảy ra. Nó được xem như lượng thông tin mà A đã mang lại liên quan đến giả thiết iA .

Ví dụ 10 (Tiếp theo ví dụ 9)

b. Giả sử sản phẩm lấy ra là phế phẩm, tính xác suất để sản phẩm đó là của máy thứ nhất.

Giải

Ta có 1 1( ) ( / ) 0.4 0.04( ) 0.51

( ) 0.03151

A /AP A P A A

PP A

Ví dụ 11

Tỷ lệ người dân nghiện thuốc lá là 30%, biết rằng tỷ lệ người bị viêm họng trong số người

nghiện thuốc lá là 60%, còn người bị viêm họng trong số người không hút thuốc là 20%.

a. Chọn ngẫu nhiên một người, biết rằng người đó viêm họng. Tính xác suất người đó nghiện

thuốc lá.

b. Nếu người đó không viêm họng, tính xác suất để người đó nghiện thuốc lá.

Page 13: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

13

CHƢƠNG 2 BIẾN NGẪU NHIÊN VÀ HÀM PHÂN PHỐI

BÀI 1 BIẾN NGẪU NHIÊN

Trong chương 1 ta nói đến các biến cố ngẫu nhiên. Chương 2 ta sẽ xét các đại lượng ngẫu

nhiên nhận giá trị thực phụ thuộc vào các biến cố ngẫu nhiên để thấy rõ hơn về mô hình xác

suất.

Sơ đồ hình thành biến ngẫu nhiên

Phép Thử

Biến cố nn A P(A)

Biến nn X P(X=xi)

Ví dụ 1: Tung 1 con xúc xắc

1 2 3 4 5 6{ , , , , , }A A A A A A

A1=biến cố con xúc xắc xuất hiện mặt 1

A2=biến cố con xúc xắc xuất hiện mặt 2

…………………………………………

A6=biến cố con xúc xắc xuất hiện mặt 6

Đặt X là ....?

X=1,2,3,4,5,6

Ví dụ 2: Tung 1 đồng xu (sấp, ngửa)

1 2{ , }A A

A1=biến cố đồng xu xuất hiện một mặt ngửa

A2=biến cố đồng xu xuất hiện một mặt sấp

Đặt X là .…..?

X=0,1

Page 14: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

14

I. Định nghĩa

Hàm số ( )X xác định trên không gian các biến cố sơ cấp { } được gọi là biến ngẫu

nhiên.

:

( )

X

X

Định nghĩa trên có thể hiểu một cách cụ thể nhƣ sau

Biến ngẫu nhiên X là biến nhận giá trị số từ thông qua cách đặt X là định lượng của biến cố

sơ cấp.

Xác suất biến ngẫu nhiên X nhận giá trị số: P(X=xi)=?

1( ) ( ) ... ( )i nP X x P A P A với

1

...................

i

n i

A X x

A X x

Ta thường sử dụng các chữ cái in hoa X, Y, Z… để ký hiệu biến ngẫu nhiên.

Sử dụng các chữ cái thường x, y, z…để ký hiệu giá trị của biến ngẫu nhiên.

Ví dụ 3: Tung một đồng xu (sấp, ngửa) 2 lần độc lập.

Bƣớc 1: ?

( ) ( ) ( ) ( ) ?P NN P NS P SN P SS

Gọi X là số mặt sấp

0NN X

1NS X

1SN X

2SS X

SS SN NS NN

X( ) 2 1 1 0

Bƣớc 2: ( 0) ( ) 1/ 4P X P NN

( 1) ( ) ( ) 2/ 4P X P NS P SN

( 2) ( ) 1/ 4P X P SS

II. Phân loại biến ngẫu nhiên - Biến ngẫu nhiên rời rạc: là biến nhận giá trị hữu hạn hoặc vô hạn đếm được.

Ví dụ 4: số học sinh vắng mặt, số sản phẩm tốt,…

- Biến ngẫu nhiên liên tục: là biến nhận giá trị trên một khoảng số thực (a,b).

Ví dụ 5: Chiều cao của học sinh, tuổi thọ của bóng đèn…

III. Bảng Phân Phối Xác Suất Biến Ngẫu Nhiên Rời Rạc

Bảng ppxs là một bảng gồm hai dòng: dòng 1 là các giá trị của biến ngẫu nhiên, dòng 2 là các

xác suất tương ứng để X nhận giá trị đó.

1 1 … 1

X( ) x1 x2 … xn

P(X( )) p1 p2 … pn

Page 15: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

15

với p1 + p2 +…+ pn=1

Trở lại ví dụ: Tung một đồng xu (sấp, ngửa) 2 lần độc lập. Gọi X là số lần được mặt sấp. Lập

bảng phân phối xác suất của X.

X 0 1 2

P 1/4 2/4 1/4

Ví dụ 6: Một hộp có 6 mã số EAN-13, 4 mã số EAN-8. Lấy ngẫu nhiên 3 mã số. Gọi X là số mã số

EAN-13 trong 3 mã số. Tìm bảng phân phối xác suất của X.

Giải

{biến cố 3 EAN-13 , biến cố 2 EAN-13 và 1 EAN-8, biến cố 1 EAN-13 và 2 EAN-8, biến

cố 3 EAN-8 }

X là số mã số EAN-13 trong 3 mã số lấy ra.

Biến cố 3 EAN-13 X=3

Biến cố 2 EAN-13 và 1 EAN-8 X=2

Biến cố 1 EAN-13 và 2 EAN-8 X=1

Biến cố 3 EAN-8 X=0

Vậy X=0,1,2,3. 3

6

3

10

20( 3) ( )

1203 EAN-13

CP X P

C

2 1

6 4

3

10

60( 2) (2 )

120 EAN-13 vaø 1 EAN-8

C CP X P

C

1 2

6 4

3

10

36( 1) (1 )

120 EAN-13 vaø 2 EAN-8

C CP X P

C

3

4

3

10

4( 0) ( )

1203 EAN-8

CP X P

C

Bảng phân phối xác suất của X

X 0 1 2 3

P 4

120

36

120

60

120

20

120

IV. Hàm phân phối xác suất

1. Định nghĩa:

Hàm phân phối xác suất của biến ngẫu nhiên X được xác định như sau

: 0,1]

( ) ( )

F

x F x P X x

[

nghĩa là với mỗi x thì F(x) là xác suất để X nhận giá trị trong khoảng ( , )x .

2. Tính chất:

a. 0 ( ) 1F x

b. F(x) là hàm không giảm nghĩa là nếu 2 1x x thì 2 1( ) ( )F x F x .

c. ( ) ( ) ( )P a X b F b F a

d. ( ) 1; ( ) 0F F

Page 16: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

16

Ví dụ 7: Cho biến ngẫu nhiên có bảng phân phối

X -1 1 2

P 1/2 1/4 1/4

Tìm hàm phân phối của X.

Giải

* 1 x thì ( ) ( ) ( 1) 0 F x P X x P X

* 1 1 x thì ( ) ( ) ( 1) ( 1) 1/ 2 F x P X x P X P X

* 1 2 x thì ( ) ( ) ( 2) ( 1) ( 1) 1/2 1/4 3/4 F x P X x P X P X P X

* 2x thì ( ) ( ) ( ) ( 1) ( 1) ( 2) F x P X x P X P X P X P X

1/2 1/4 1/4 1

Vậy

0 1

1/ 2 1 1( )

3/ 4 1 2

1 2

x

xF x

x

x

V. Hàm mật độ phân phối xác suất

1. Định nghĩa

Biến ngẫu nhiên X được gọi là biến ngẫu nhiên liên tục nếu tồn tại hàm không âm ( ) 0f x

định nghĩa trên sao cho

Page 17: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

17

( ) ( )

x

X XF x f t dt

x

Xf được gọi là hàm mật độ của X

2. Tính chất

1. ( ) 0f x

2. ( ) ( )

x

F x f t dt

3. ( ) ( )

b

a

P a X b f x dx , ( ) 0P X c .

4. Nếu Xf liên tục thì ( ) ( ) ' ( )

x

X X X

df x f t dt F x

dx

5. Mọi hàm f(x) không âm và thỏa ( ) 1f x dx

đều là hàm mật độ của một biến ngẫu nhiên

nào đó.

Ví dụ 8: Cho biến ngẫu nhiên X có hàm mật độ

2

, [0,3]( ) 9

0, [0,3]

xx

f x

x

a. Kiểm tra ( )f x là hàm mật độ.

b. Tính (0 2)P X .

c. Tìm hàm phân phối ( )F x .

Giải

a. Kiểm tra hàm mật độ:

+ ( ) 0 [0,3]f x x

+

3 3 2

0 0

( ) ( ) 19

xf x dx f x dx dx

b. Ta có 2 2 2

0 0

(0 2) ( ) 8/ 279

xP X f x dx dx

c. Ta có ( ) ( )

x

F x f t dt

* 0x thì ( ) 0F x

* 0 3 x thì

0 2 3

0 0

( ) ( ) ( ) ( )9 27

x x xt x

F x f t dt f t dt f t dt dt

* 3x thì

0 3 3 2

0 3 0

( ) ( ) ( ) ( ) ( ) 19

x xt

F x f t dt f t dt f t dt f t dt dt

Page 18: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

18

Vậy

3

0 0

( ) 0 327

1 3

x

xF x x

x

BÀI 2 CÁC ĐẶC TRƢNG CỦA ĐẠI LƢỢNG NGẪU NHIÊN

I. Kỳ vọng của ĐLNN

1.Định nghĩa

Kỳ vọng của ĐLNN X ,kí hiệu EX, được xác định như sau:

+ Nếu biến ngẫu nhiên X rời rạc với bảng phân phối xác suất

X x1 x2 … xn

P p1 p2 … pn

thì 1 1 2 2. . ... .n nEX x p x p x p

Ví dụ 1:

X 0 1 2

P 1/6 3/6 2/6

( ) 0 1/6 1 3/6 2 2/6 7/6E X

2. Tính chất kỳ vọng

a. (X C C là hằng số) EC C

b. Y CX ( ) ( )E CX CE X

c. Z X Y ( )E X Y EX EY

d. ,X Y độc lập ( ) .E XY EX EY .

3. Ý nghĩa

Kỳ vọng là giá trị trung bình theo xác suất của ĐLNN X (giá trị trung tâm của ĐLNN X).

Ta biết trung bình cộng sẽ tốt trong trường hợp các trị số đang xét có cùng khả năng,

nhưng trung bình cộng phản ánh không tốt trong trường hợp các trị số được nhận không

cùng khả năng, khi đó dùng trung bình theo nghĩa xác suất sẽ tốt hơn. Chẳng hạn như:

Page 19: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

19

Khi đó 1 3 1

1. 1.4 4 2

EX , trong khi trung bình cộng là 1 1

02

.

II. Phƣơng sai

1. Định nghĩa:

Phương sai của ĐLNN X, kí hiệu DX hoặc VarX, được xác định như sau: 2[ ]DX E X EX

Vậy phương sai là trung bình bình phương độ lệch giữa các giá trị của ĐLNN X với trung bình

của nó.

2. Công thức tính

a. Dựa vào định nghĩa

+ Với X rời rạc có bảng phân phối xác suất ta có 2

1

( )n

i i

i

DX x EX p

b. Trong thực tế ngƣời ta thƣờng dùng công thức 2 2( )DX EX EX

+ Với X rời rạc có bảng phân phối xác suất ta có 2 2

1

( )n

i i

i

DX x p EX

Ví dụ 2

X 0 1 2

P 1/6 3/6 2/6

( ) 0 1/6 1 3/6 2 2/6 7/6E X 2 2 2( ) (0 7/6) 1/6 (1 7/6) 3/6 (2 7/6) 2/6 17/36D X

Cách khác: 2 2 2 2( ) 0 1/6 1 3/6 2 2/6 11/6E X

2 2 2( ) ( ) ( ( )) 11/6 (7/6) 17/36D X E X E X

3. Tính chất

a. (X C C là hằng số) 0DC

b. Y CX 2( ) ( )D CX C D X

c. ,X Y độc lập ( )D X Y DX DY

4. Ý nghĩa: Phương sai là số không âm dùng để đo mức độ phân tán của các giá trị ĐLNN so với trung

bình của nó. ĐLNN có phương sai càng lớn thì các giá trị càng phân tán và ngược lại.

+ EX Tâm của phân phối

+ X EX : Khoảng cách từ giá trị X đến tâm

X 1 1

P 1 3

4 4

Page 20: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

20

+2( )X EX : Bình phương khoảng cách trên

+2( )E X EX : Trung bình của bình phương khoảng cách trên.

Ví dụ 3:

Giả sử X là trọng lượng các gói bột giặt phân xưởng 1; Y là trọng lượng các gói bột giặt phân

xưởng 2, trong đó 500EX EY g và DX DY . Khi đó, các gói bột giặt phân xưởng 2 có

trọng lượng tập trung hơn xung quanh giá trị trung bình 500g. Nói cách khác, hệ thống đóng

gói của phân xưởng 2 hoạt động ổn định hơn phân xưởng 1.

III. Độ lệch tiêu chuẩn

Độ lệch tiêu chuẩn của biến ngẫu nhiên X là X DX .

Khái niệm độ lệch tiêu chuẩn giải quyết vấn đề đơn vị đo. Kỳ vọng EX có đơn vị đo bằng đơn

vị đo của X, còn phương sai DX có đơn vị đo bằng bình phương đơn vị đo của X. Suy ra độ

lệch chuẩn X có đơn vị đo bằng đơn vị đo của X.

Ví dụ 4

Tiếp ví dụ 3 ta có 17/36 0,68X DX

IV. Một số đặc trƣng khác (cho ĐLNN rời rạc)

1. Mode

Định nghĩa: mode là giá trị của ĐLNN X ứng với xác suất lớn nhất.

* Chú ý: ĐLNN X có nhiều mode. Kí hiệu ModX.

Ví dụ 5

Cho ĐLNN X có bảng phân phối xác suất

X 0 1 2 3

P 1/8 3/8 3/8 1/8

ModX={1,2} vì P(X=1)=P(X=2)=3/8 lớn nhất.

2. Median (trung vị)

Định nghĩa: median là giá trị của ĐLNN X, kí hiệu MedX, thỏa:

P(X<MedX) và P(X>MedX) 1

2

Ví dụ 6 (tiếp ví dụ 5)

Ta có MedX={1,2} vì

+Giả sử Med(X)=1 ta có

( 1) ( 0) 1/8 1/ 2P X P X

( 1) ( 2) ( 3) 3/8 1/8 1/ 2P X P X P X

Vậy nhận Med(X)=1.

+ Giả sử Med(X)=2 ta có

( 2) ( 0) ( 1) 1/8 3/8 1/ 2P X P X P X

( 2) ( 3) 1/8 1/ 2P X P X

Vậy nhận Med(X)=2.

Page 21: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

21

BÀI 3 CÁC LUẬT PHÂN PHỐI XÁC SUẤT THƢỜNG GẶP

Trong chương 1 ta đã biết xác suất biến cố A xảy ra : ( ) [ ] [ ]A AP trong một phép thử,

nhưng khi gặp bài toán tính xác suất biến cố A xuất hiện k lần trong n phép thử thì không có

công thức tổng quát để tính mà phải dựa vào các luật phân phối xác suất có biến cố A xảy ra thì

khi đó sẽ có cách tính cụ thể xác suất biến cố A xuất hiện k lần.

I. Quy luật siêu bội

1. Định nghĩa

Gọi X là số phần tử T trong n phần tử lấy ra. Khi đó X có phân phối siêu bội.

Ký hiệu: ~ ( , , )X H N M n

Ta có

( )k n k

M N M

n

N

C CP X k

C

2. Khi ~ ( , , )X H N M n ta có

Trung bình: EX np với M

pN

Phương sai: 1

N nDX npq

N

với 1q p

Bài toán

Trong kho siêu thị có 10 loại hàng hoá trong đó có 6 loại hàng hoá xuất xứ từ Nhật. Chọn ngẫu

nhiên 4 loại hàng hoá. Tính xác suất có 3 loại hàng hoá xuất xứ từ Nhật.

Giải

Gọi X là số loại hàng hoá xuất xứ từ Nhật trong 4 loại hàng hoá lấy ra. Khi đó ~ (10,6,4)X H

3 1

6 4

4

10

80( 3) 0,381

210

C CP X

C

Ví dụ 2

Trong kho siêu thị có 20 loại hàng hoá trong đó có 17 loại hàng hoá xuất xứ từ Nhật, 3 loại

hàng hoá xuất xứ từ Thái Lan. Chọn ngẫu nhiên đồng thời 3 loại hàng hoá.

Gọi X là số loại hàng hoá xuất xứ từ Thái Lan trong 3 loại hàng hoá lấy ra. Tìm bảng phân phối

xác suất của X.

Giải

Ta có ~ (20,3,3)X H

3

3 17

3

20

( )k kC C

P X kC

với 0,1,2,3k

Ta có bảng phân phối xác suất

X 0 1 2 3

P 0,596 0,358 0,045 0,001

Page 22: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

22

* Khi N rất lớn so với n (n<<N) việc tính toán liên quan đến tổ hợp ,n n k

N N MC C

rất khó khăn

nên ta sẽ triệt tiêu N bằng cách đặt M

pN

.

Vì N khá lớn so với n nên việc lấy ra n phần tử không hoàn lại thì cũng được xem là lấy n

phần tử có hoàn lại nghĩa là ta được n phép thử độc lập (độc lập nghĩa là kết quả của phép thử

này không ảnh hưởng đến kết quả của phép thử kia). Đây chính là mô hình của phân phối nhị

thức.

II. Phân phối Bernoulli

Phân phối Bernoulli là phân phối suất rời rạc của biến ngẫu nhiên chỉ nhận 2 giá trị 0 hoặc 1.

Trong đó giá trị 1 đạt với xác suất p (xác suất thành công) và giá trị 0 đạt được với xác suất 1-p =q

(xác suất thất bại).

Vd: tung đồng xu thu kết quả

Mặt ngửa tương ứng giá trị 1

Mặt sấp tương ứng giá trị 0

P(X=1) = p và P(X=0) = 1-p = q.

Hàm phân phối xác suất: 1( ) ( ) (1 )k k

pf k P X k p p , 0,1}k{

E(X) = p

Var(X) = p(1-p)

III. Luật phân phối nhị thức:

1. Định nghĩa

Xét một phép thử Bernoulli: ( )AP p , ( ) 1AP p q .

Lặp lại phép thử Bernoulli n lần độc lập.

Gọi biến ngẫu nhiên X là số lần xuất hiện biến cố A trong n phép thử.

Khi đó X là biến ngẫu nhiên có luật phân phối nhị thức.

Kí hiệu: ( , )X B n p .

Ta có:

( ) , 0,1,...,k k n k

nP X k C p q k n

Giải thích:

Xét một phép thử có P(A)=p, ( ) 1AP p q .

Lặp lại phép thử này 5 lần độc lập.

Tính 3 3 2

5P(bieán coá A xuaát hieän 3 laàn)=P(X=3)=C p q

* Trường hợp 1:

1 2 3 4 5

A A A A A

Xác suất biến cố A xuất hiện 3 lần: 3 2p p p q q p q

* Trường hợp 2:

1 2 3 4 5

Page 23: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

23

A A A A A

Xác suất biến cố A xuất hiện 3 lần: 3 2p p q q p p q

……………….

Sẽ có 3

5C trường hợp như thế ( vì từ 5 phép thử ta chọn ra 3 phép thử có biến cố A xảy ra).

Vậy 3 3 2

5P(bieán coá A xuaát hieän 3 laàn)=C p q .

2. Khi ~ ( ; )X B n p ta có

Trung bình: EX np

Phương sai: DX npq

ModX: np q ModX np p

Ví dụ 3

Một trò chơi máy tính thú vị được phát hành. Mười tám phần trăm trong số người chơi sẽ mua

một phiên bản nâng cao của trò chơi. Trong lớp có 15 bạn chơi, trung bình số bạn sẽ mua phiên

bản nâng cao là bao nhiêu? Xác suất có ít nhất hai bạn sẽ mua phiên bản nâng cao là bao nhiêu.

Giải

Gọi X là số bạn sẽ mua phiên bản nâng cao trong 15 bạn. ~ (15;0,18)X B .

Khi đó trung bình số bạn sẽ mua phiên bản nâng cao là 15 0,18 2,7 bạn.

Xác suất có ít nhất hai bạn sẽ mua phiên bản nâng cao là

0 0 15 1 1 14

15 15

( 2) 1 ( 2) 1 ( 0) ( 1)

1 0,18 0,82 0,18 0,82 0,7813

P X P X P X P X

C C

Ví dụ 4

Một người tham gia đấu thầu 6 dự án nhỏ với xác suất thắng thầu mỗi dự án là 0,4. Nếu thắng

thầu mỗi dự án người đó thu được 200 triệu. Chi phí để chuẩn bị dự thầu mỗi dự án là 50 triệu.

a. Tìm số dự án trung bình mà người đó sẽ hy vọng thắng thầu.

b. Lợi nhuận trung bình mà người đó hy vọng thu về được là bao nhiêu.

Gợi ý

a. Gọi X là số dự án mà người đó sẽ hy vọng thắng thầu. Tính EX.

b. Gọi p là lợi nhuận mà người đó thu được. p=200.X-300

Ví dụ 5

Trong một lô hàng có 100 lọ thuốc trong đó có 10 lọ thuốc hỏng. Lấy ngẫu nhiên 3 lọ thuốc để

kiểm tra. Gọi X là số lọ thuốc hỏng trong 3 lọ lấy ra để kiểm tra. Lập bảng phân phối xác suất

cho X.

Giải

Vì N=100 rất lớn nên đặt p=10/100=0,1 là xác suất nhận được lọ hỏng.

Vì N lớn nên việc lấy 3 lọ thuốc không hoàn lại được xem là lấy 3 lọ thuốc có hoàn lại.

Phép thử: lấy 1 lọ thuốc để kiểm tra là phép thử Bernoulli.

Có hai biến cố xảy ra: A=biến cố lấy được lọ thuốc hỏng và A =biến cố lấy được lọ thuốc

không hỏng .

1 0,1 0,9P A =0,1; P A .

Số phép thử:n=3 lần.

Gọi X là số lọ thuốc hỏng trong 3 lọ lấy ra để kiểm tra. Khi đó Suy ra (3;0,1)X B .

Page 24: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

24

3

3( ) (0,1) (0,9)k k kP X k C với 0,1,2,3k

Ta có bảng phân phối xác suất

X 0 1 2 3

P 0,729 0,243 0,027 0,001

* Khi n rất lớn, p rất nhỏ (<0,1) thì việc tính toán liên quan đến tổ hợp k

nC và ,k n kp q rất khó

khăn nên ta sẽ triệt tiêu n và p bằng cách đặt .n p .

Đây là mô hình của phân phối Poisson.

Phân bố Binomial(35,0.1) xấp xỉ Poisson(3.5)

IV. Luật phân phối Poisson

1. Định nghĩa

Biến ngẫu nhiên X được gọi là có luật phân phối Poisson nếu

( ) , 0,1,...,!

keP X k k n

k

Kí hiệu: ( )X P

2. Khi ~ ( )X P ta có

Trung bình: EX

Phương sai: DX

Mod X: 1 ModX

Ví dụ 6

Kiểm tra 1000 linh kiện của một thiết bị có rất nhiều linh kiện biết xác suất hỏng của mỗi linh

kiện là 0,001. Tính xác suất để thiết bị đó có 3 linh kiện bị hỏng.

Giải

Phép thử: kiểm tra 1 linh kiện là phép thử Bernoulli.

Có hai biến cố xảy ra: A=biến cố linh kiện hỏng và A =biến cố linh kiện tốt.

0,001P A = ; 0,999P A .

Số phép thử: n=1000.

Gọi X là số linh kiện bị hỏng trong 1000 linh kiện.

Suy ra (1000; 0,001)X B .

Page 25: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

25

Ta thấy n lớn và p < 0,1 nên (1)X P ( 1000 0,001 1np ).

Vậy P( biến cố linh kiện hỏng xuất hiện 3 lần) =

1 31( 3) 0,061

! 3!

ke eP X

k

Ví dụ 7

Mô hình hoá nhờ biến Poisson là số hàng cấm đem lên máy bay phát hiện bởi một máy soi

hành lý xách tay tán xạ ngược Mini Z - AS&E (Xuất xứ Hoa Kỳ) trong một thời gian nhất định.

Nếu trung bình phát hiện 1 hàng cấm mỗi giờ thì số lượng hàng cấm được phát hiện trong một

giờ tuân theo một phân phối Poisson với trung bình 1 . Số lượng hàng cấm được phát hiện

trong 5 giờ tuân theo một phân phối Poisson với trung bình 5 . Tính xác suất có 2 hàng cấm

được phát hiện trong 5 giờ.

Giải

Xác suất sẽ là 5 25

( 2) 0,0842!

eP X

Ví dụ 8

Tại sân bay cứ 15 phút lại có một chuyến xe loại 6 chỗ chở khách vào trung tâm thành phố.

Biết rằng số khách chờ đi xe có mật độ trung bình 8 người/giờ. Giả sử vừa có một chuyến xe

rời bến. Tìm xác suất để trong chuyến xe tiếp theo :

a. Không có khách nào chờ xe.

b. Xe sẽ chật khách (từ đầy khách trở lên).

V. Luật phân phối chuẩn

1.Định nghĩa

Biến ngẫu nhiên X liên tục được gọi là có luật phân phối chuẩn nếu X có hàm mật độ f(x)

dạng: 2

1

21( )

2

x

f x e

Kí hiệu: 2( , )X N

Đồ thị hàm mật độ ( )f x có dạng hình chuông, đối xứng qua đường x và đạt cực đại tại

điểm 1

,2

.

Page 26: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

26

Hàm mật độ của phân phối chuẩn (normal distribution)

Đồ thị của hàm mật độ của phân bố normal có hình cái chuông, và bởi vậy phân bố normal còn

được gọi một cách giản dị là phân bố hình cái chuông. Trung điểm của cái chuông này chính

là điểm x = µ, và độ cao của chuông chính bằng . Nếu σ càng nhỏ thì chuông càng cao và

càng “hẹp”, và ngược lại σ càng lớn thì chuông càng thấp và càng bè ra.

Hình vẽ minh họa cho thấy hầu hết xác suất của một phân bố normal nằm trong đoạn

[µ − 3σ,µ + 3σ]. Chỉ có không đến 0,3% nằm ngoài đoạn đó. Nói cách khác, nếu X là một

biến ngẫu nhiên có phân bố xác suất normal với các tham số µ,σ, thì với xác suất 99,7% ta có

thể tin rằng giá trị của X nằm trong đoạn [µ − 3σ,µ + 3σ]: P(µ − 3σ < X < µ + 3σ) = 99,7%.

Định lý

Nếu 2( , )X N thì (0,1)X

Z N

.

Khi đó ta có biến ngẫu nhiên Z có luật phân phối chuẩn tắc (0,1)N với 0, 1 .

Kí hiệu: (0,1)Z N

Page 27: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

27

+ Hàm mật độ xác suất:

2

21

2(z)

z

f e

là hàm Gauss.

Hàm f(z) là hàm chẵn f(-z)=f(z) tra bảng Phụ lục 1.

+ Thực tế thường dùng

2

21

( )2

z t

z e dt

là hàm phân phối tích lũy của phân phối chuẩn

tắc.

Hàm ( )z là hàm lẻ ( ) 1 ( )z z tra bảng Phụ lục 2.

2. Một số công thức của luật phân phối chuẩn tắc:

Cho 2( , )X N

1. ( )a

P X a

2. ( )- -b a

P a X b

3. - -a a

P X a

4. ( ) 1 ( ) 1a

P X a P X a

* Chú ý: ( ) 1 ( )x x

3. Khi 2~ ( ; )X N ta có

Trung bình: EX

Page 28: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

28

Phương sai: 2DX và độ lệch chuẩn:

2DX

ModX Med

Ví dụ 9

Cho (3;4)X N .

Tính a. (1 6)P X b. 2 4P X c. ( 3,5)P X d. ( 2)P X

Giải

a. 6 3 1 3

(1 6) (1,5) ( 1) (1,5) 1 (1) 0,77452 2

P X

b. 2 2 3 2 34 2 ( 2 2)

2 2P X P X P X

( 0,5) ( 2,5) 1 (0,5) 1 (2,5) 0,3023 [ ]

c. 3,5 3

( 3,5) 1 1 (0,25) 0,40132

P X

d. 2 3

( 2) ( 0,5) 1 (0,5) 0,30852

P X

Ví dụ 10

Gọi biến X đại diện cho trọng lượng 1 loại sản phẩm, được lựa chọn ngẫu nhiên. Giả sử chúng

ta biết rằng X có phân phối chuẩn với trung bình 60,02 (g) và độ lệch chuẩn 0,048 g .

a. Tính xác suất mà trọng lượng 1 loại sản phẩm, được lựa chọn ngẫu nhiên nhỏ hơn 60,1 g.

b. Một sản phẩm được xem là “chấp nhận được” nếu trọng lượng của nó ở giữa 59,9 và 60,1 g,

vậy tỉ lệ sản phẩm sẽ bị từ chối (không chấp nhận) là bao nhiêu?

Giải

a.

60,1 60,02 0 60,02( 60,1) (0 60,1)

0,048 0,048

(1,66) ( 1250,41) 0,95154

P X P X

b. Trước tiên ta tính xác suất sản phẩm được chấp nhận.

60,1 60,02 59,9 60,02(59,9 60,1)

0,048 0,048

(1,66) ( 2,5) (1,66) 1 (2,5) 0,94533

P X

Vậy ta kỳ vọng 94,533% các sản phẩm được chấp nhận, nên 5,467% các sản phẩm sẽ bị từ

chối.

*Phân phối chuẩn chiếm vị trí quan trọng trong lý thuyết xác suất, là vị trí trung tâm trong

các kết luận sau này. Phân phối chuẩn có ý nghĩa rất lớn trong thực tế. Rất nhiều ĐLNN có

luật phân phối chuẩn hoặc gần chuẩn. Những ĐLNN có liên quan đến số lượng lớn, chịu

ảnh hưởng của các yếu tố cân bằng nhau thường có luật phân phối chuẩn.

Chẳng hạn:

+ Các chỉ số sinh học (cân nặng, chiều cao, mức độ thông minh,…) của người cùng giới

tính và cùng độ tuổi.

+ Các chỉ số sinh học của các loài cây, loài vật cùng độ tuổi.

Page 29: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

29

+ Khối lượng, kích thước các sản phẩm do một hệ thống máy sản xuất ra.

+ Điểm thi của các thí sinh.

+ Lực chịu đựng của một thanh sắt; các sai số trong đo đạc; sai số quan sát; độ bền dẻo

của máy móc; trung bình cộng của một số lớn các ĐLNN độc lập…

Trong thương mại, kinh tế và khoa học xã hội nhiều phân phối không giống phân phối chuẩn,

nhưng phân phối của trung bình cộng đối với mỗi trường hợp lại có thể xem như phân phối

chuẩn miễn là n đủ lớn.

Ngoài ra, phân phối chuẩn còn là tiệm cận của phân phối nhị thức.

Khi n tiến tới vô cùng và p cố định, thì dáng điệu của phân bố nhị thức với các tham số n,p cũng

ngày càng gần giống phân bố normal. Ví dụ, lấy p = 0,9. Khi n nhỏ thì phân bố nhị thức với các

tham số n và p = 0,9 có dáng điệu khác xa phân bố normal, nhưng khi n = 100, thì dáng điệu của

phân bố nhị thức trông đã rất gần giống phân bố normal.

Ví dụ sau minh họa một ĐLNN trong thực tế có luật phân phối chuẩn .

Ví dụ 11

Hình: Phân bố nhị thức với n = 100, p = 0,9 xấp xỉ chuẩn

* Sự xấp xỉ phân phối nhị thức và phân phối chuẩn.

V. Luật số lớn và các định lý giới hạn

1. Hội tụ của dãy biến ngẫu nhiên

1.1.Hội tụ hầu chắc chắn: Dãy các biến ngẫu nhiên { }nX gọi là hội tụ hầu chắc chắn tới biến

X nếu [lim ] 0nn

P X X

ta kí hiệu . .h c c

nX X .

1.2. Hội tụ theo xác suất: Dãy các biến ngẫu nhiên { }nX gọi là hội tụ theo xác suất tới biến X

nếu 0,lim [| | ] 1nn

P X X

ta kí hiệu P

nX X .

1.3. Hội tụ theo quy luật: Dãy các biến ngẫu nhiên { }nX gọi là hội tụ theo quy luật tới biến X

nếu dãy hàm phân phối { ( )}nF x của dãy { }nX hội tụ tới hàm phân phối nF của X .

Người ta chứng minh được rằng nếu một dãy biến ngẫu nhiên hội tụ hầu chắc chắn tới biến

X thì nó cũng hội tụ theo xác suất tới biến X . Một dãy biến ngẫu nhiên hội tụ theo xác suất tới

biến X thì nó cũng hội tụ theo quy luật tới biến X .

Page 30: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

30

2. Luật số lớn và các định lý về luật số lớn

2.1.Khái niệm: Dãy các biến ngẫu nhiên { }nX tuân theo luật số lớn nếu

1 1

1 10 ; ;

n nP

i i

i i

X a X X a EXn n

Dãy các biến ngẫu nhiên { }nX tuân theo luật mạnh số lớn nếu

. .

1 1

1 10; ;

n nh c c

i i

i i

X a X X a EXn n

2.2.Bất đẳng thức Chebyshev:

Cho ngẫu nhiên X có 2;EX a DX b . Với 2

20, [| | ] 1

bP X a

Ta chứng minh cho trường hợp X có hàm mật độ xác suất f(x)

[| | ] 1 [| | ]P X a P X a (1)

2 2

2 2

| | ( )

22 2

2 2 2

( )

[| | ] ( ) ( )

1 1( ) ( ) ( ) ( )

x a x a

x a

P X a f x dx f x dx

bx a f x dx x a f x dx

(2)

Từ (1) và (2) suy ra 2

2[| | ] 1

bP X a

2.3. Định lý Chebyshev

Nếu *{ }n n NX

là dãy các đại lượng ngẫu nhiên độc lập từng đôi một có phương sai hữu hạn và

bị chặn bởi cùng hằng số ( )nD X C , với mọi k thì với mọi cho trước, ta luôn có:

1 1

1 1lim 1

n n

i in

i i

P X EXn n

Hệ quả

Nếu { }nX là họ biến ngẫu nhiên độc lập, cùng phân phối, có kỳ vọng chung hữu hạn là ,

phương sai chung là 2 thì khi ( )n ta có:

1

1 nP

k

k

Xn

Ta có thể hiểu hệ quả định lý Chebyshev trong trường hợp cụ thể như sau

Dãy các biến ngẫu nhiên độc lập { }nX có 2;n nEX DX tuân theo luật số lớn.

Đặt 1

1 n

i

i

X Xn

ta có 2

( ) ; ( )E X D Xn

Áp dụng bất đẳng thức Chebyshev cho X ta có 2

21 [| | ] 1P X

n

Do 2

2lim 1 1n n

nên [| | ] 1P X .

3. Các định lý giới hạn

Page 31: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

31

Các định lý về luật số lớn liên quan tới sự hội tụ theo xác suất của dãy các đại lượng ngẫu

nhiên.

3.1. Định lý giới hạn địa phƣơng Moivre-Laplace

Cho ( , )X B n p . Nếu số phép thử n khá lớn và xác suất p không quá gần 0, không quá

gần 1 (0,1 0,9)p thì X xấp xỉ phân phối chuẩn 2( , )N trong đó 2,np npq 2

1

21( )

2

k

P X k e

Hệ quả:

Cho ( , )X B n p với n khá lớn, (0,1 0,9)p , ta có

1( ) f

kP X k

trong đó ( )f u là hàm Gauss ( Phụ lục 1 ).

Ví dụ 12

Xác suất bắn trúng bia của một xạ thủ là 0,6. Tính các xác suất sau:

a. Xạ thủ bắn 10 viên, trúng 6 viên.

b. Xạ thủ bắn 100 viên, trúng 60 viên.

Giải

Gọi X là số viên đạn bắn trúng bia.

a. (10;0,6)X B . Vậy 6 6 410( 6) (0,6) (0,4) 0,251P X C

b. (100;0,6), 100X B n khá lớn, 0,1 0,6 0,9p

X xấp xỉ phân phối chuẩn 2( ; )N với . 100 0,6 60n p , 2 npq

100 0,6 0,4 24

1 60 60 1 1( 60) (0) 0,3989 0,08

24 24 24 24f fP X

3.2. Định lý giới hạn tích phân Moivre-Laplace

Cho ( , )X B n p với n khá lớn và (0,1 0,9)p , ta có

2 11 2 )(

k kP k X k

trong đó ( )z là hàm Laplace ( Phụ lục 2 ).

Ví dụ 13 Xác suất bắn trúng bia của một xạ thủ là 0,6. Xạ thủ bắn 100 viên. Tính các xác suất sau:

a. Xạ thủ bắn trúng bia từ 55 viên đến 70 viên.

b. Xạ thủ bắn trúng bia từ 65 viên đến 90 viên.

Giải

(100;0,6), 100X B n khá lớn, 0,1 0,6 0,9p

X xấp xỉ phân phối chuẩn 2( ; )N với . 100 0,6 60n p , 2 npq

100 0,6 0,4 24

a)

70 60 55 60(55 70) 2,04 1,02

24 24

2,04 1,02 0,4793 0,3461 0,8254 82,54%

P X

b)

Page 32: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

32

90 60 65 60

(65 90) 6,12 1,0224 24

0,5 0,3461 0,1539 15,39%

P X

4. Định lý giới hạn trung tâm

Hai định lý nêu ở mục 3 chỉ là trường hợp riêng của định lý giới hạn trung tâm. Ta biết rằng:

Nếu biến ngẫu nhiên X có kỳ vọng và phương sai 2 thì biến ngẫu nhiên X

Z

gọi là

biến ngẫu nhiên được chuẩn hoá. Những định lý đề cập đến dãy các biến ngẫu nhiên độc lập

sau khi được chuẩn hoá, hội tụ theo quy luật tới phân phối chuẩn tắc được gọi là định lý giới

hạn trung tâm.

VI. Luật phân phối khi bình phƣơng 2( )n

Cho các biến ngẫu nhiên 1 2, ,..., nX X X độc lập, có cùng luật phân phối chuẩn tắc (0,1)N .

Đặt 2 2 2

1 2 ... nX X X X

Khi đó ta nói biến ngẫu nhiên X có luật phân phối khi bình phương với n bậc tự do.

Kí hiệu: 2( )X n

Đồ thị hàm mật độ xác suất f(x) là đường cong không đối xứng. Khi bậc tự do 30n , đồ thị hàm

mật độ xác suất gần đối xứng (dạng hình chuông), khi đó phân phối khi bình phương 2( )n tiệm

cận phân phối chuẩn.

VII. Luật phân phối Student T(n)

Cho 2 biến ngẫu nhiên (0,1)Y N và 2( )Z n độc lập với nhau. Đặt Y

TZ

n

Page 33: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

33

Khi đó ta nói T có luật phân phối Student với n bậc tự do.

Đồ thị hàm mật độ xác suất f(x) là đường cong đối xứng qua trục tung. Khi bậc tự do 30n , đồ

thị hàm mật độ xác suất tiệm cận đồ thị hàm Laplace, khi đó phân phối Student T(n) tiệm cận

phân phối chuẩn tắc.

PHẦN II THỐNG KÊ

CHƢƠNG 3 MẨU NGẨU NHIÊN

BÀI 1 CÁC PHƢƠNG PHÁP CHỌN MẪU

I. TỔNG THỂ

Có hai loại dữ kiện thường được đề cập đến trong các phương pháp thống kê. Đó là các dữ

kiện của mẫu và dữ kiện của tổng thể.

Một tập hợp dữ kiện đầy đủ liên quan đến lĩnh vực nào đó mà chúng ta quan tâm tìm hiểu một

hoặc một số dấu hiệu thì được gọi là tổng thể.

Ví dụ

Một ông hiệu trưởng cần tìm hiểu phân bố tuổi của tất cả các học sinh của trường mình. Như

vậy, tuổi của tất cả các học sinh trong trường của ông tạo thành một tổng thể (tổng thể tuổi).

Nếu có 3240 học sinh trong trường ông thì đây là một tổng thể 3240 tuổi. Ta có thể gọi đây là

một tổng thể 3240 học sinh, nhưng mối quan tâm của hiệu trưởng trong trường hợp này là dấu

hiệu tuổi của học sinh.

Vì phần nhiều các tổng thể đều rất lớn cho nên đa số các nghiên cứu không thể đo lường được

từng phân tử trong tổng thể. Do đó, người ta phải lựa chọn một mẫu từ tổng thể ấy. Một mẫu là

một tập hợp phụ (subset) của tổng thể và có cỡ nhỏ hơn tổng thể ấy.

Nếu tổng thể là 10.000 người thì mẫu của nó có thể rất nhỏ (là 1) hoặc rất lớn (là 9.999). Thông

thường hơn cỡ của một mẫu nằm giữa hai con số này. Nó có thể là 30 hay 100 người, đó là cỡ

mẫu thông thường trong các nghiên cứu thực nghiệm. Nhưng dù nhỏ hay lớn điều quan trọng là

mẫu phải có tính cách đại diện cho tổng thể mà người ta muốn tìm hiểu. Vậy thế nào là mẫu đại

diện ?

II. CÁC PHƢƠNG PHÁP CHỌN MẪU

Từ tổng thể lấy ra n phần tử để nghiên cứu suy ra các đặc trưng của dấu hiệu tổng thể ta gọi

là một mẫu có kích thước n.

Để có thể làm công việc này, ta cần có những mẫu càng có tính cách đại diện cho tổng thể ta

muốn tìm hiểu càng tốt. Có nhiều yếu tố khiến ta chọn phải những mẫu không đại diện cho dân

số. Chẳng hạn, ta muốn tìm hiểu về khả năng học tập của học sinh lớp 10 trong thành phố Thủ

Dầu Một, nhưng mẫu của ta chỉ bao gồm những học sinh lớp 10 tại các trường điểm hay các

trường nổi tiếng, hoặc ngược lại, những trường đầu vào thấp nhất trong thành phố, như vậy

Page 34: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

34

mẫu của ta sẽ không đại diện cho tất cả các học sinh lớp 10 trong thành phố Thủ Dầu Một. Mẫu

không đại diện như vậy bị xem là mẫu thiên vị (biased). Ngoài ra, mẫu của ta có thể không đại

diện cho tổng thể vì sai số mẫu là do may rủi.

Một trong các phương pháp để làm tăng xác suất lựa chọn một mẫu đại diện là lựa chọn một

mẫu ngẫu nhiên từ tổng thể mà ta quan tâm. Một mẫu ngẫu nhiên là mẫu trong đó mỗi cá thể

trong tổng thể đều có may rủi đồng đều được lựa chọn làm phần tử trong mẫu. Chúng ta xem

qua các phương pháp lấy mẫu sẽ rõ hơn.

2.1. Các yêu cầu của chọn mẫu:

- Mang tính ngẫu nhiên: Đảm bảo tính khách quan, không phụ thuộc vào ý muốn chủ quan.

- Đảm bảo tính đại diện: Mẫu được chọn phải mang nhiều đặc tính với tổng thể.

- Mang tính đồng nhất: Mẫu được chọn phải cùng chủng loại, hoặc có đặc tính gần chủng

loại.

2.2. Các phƣơng pháp chọn mẫu:

* Có nhiều cách lấy mẫu như sau:

2.2.1. Lấy mẫu ngẫu nhiên: ta đánh số các phần tử từ 1 đến N. Để lấy mẫu n phần tử, ta dùng

bảng số ngẫu nhiên hoặc dùng cách bốc thăm lấy đủ n phần tử.

2.2.2. Chọn mẫu ngẫu nhiên phân tổ: Phân thành các tổ theo một đặc điểm nào đó.

Ví dụ: Phân các điểm số từ 0 đến 10 thành 5 tổ: 0 – 2; 3 – 4; 5 – 6; 7 – 8; 9 – 10.

Các tổ mà có giới hạn trên hoặc dưới không xác định gọi là tổ mở.

Ví dụ: Trên 30 tuổi; dưới 50kg, …

2.2.3. Chọn mẫu cả cụm: Điều tra theo từng nhóm, mỗi nhóm điều tra hết không bỏ sót.

Ví dụ: Nghiên cứu chiều cao toàn bộ sinh viên của một số lớp trong trường,…

* Việc lấy mẫu tiến hành chủ yếu theo hai phương thức:

- Lấy mẫu có hoàn lại

- Lấy mẫu không hoàn lại.

Theo định lý giới hạn của xác suất, người ta chứng minh được rằng: khi số phần tử của tổng

thể đủ lớn thì coi hai cách lấy mẫu theo phương thức trên là như nhau.

2.3.Ƣu, nhƣợc điểm của điều tra chọn mẫu:

2.3.1. Ƣu điểm:

- Tiết kiệm thời gian.

- Tiết kiệm chi phí.

- Mở rộng nội dung.

2.3.2. Nhƣợc điểm:

- Số liệu thống kê có sai lệch so với thực tế.

- Đôi khi bị nhiễu thông tin.

III. SAI SỐ CHỌN MẪU

3.1. Khái niệm:

Sai số chọn mẫu là sự chênh lệch về trị số giữa các chỉ tiêu tính ra được trong

điều tra chọn mẫu và các chỉ tiêu tương ứng của tổng thể.

Ví dụ: Độ chênh lệch về chiều cao trung bình tính được đối với mẫu gồm 500 sinh viên so với

chiều cao trung bình của sinh viên toàn trường.

3.2. Nguyên nhân sai số:

- Sai số do tính chất đại biểu, tức là:

+ Mẫu được chọn có kích thước quá nhỏ so với tổng thể nhưng kết quả lại suy rộng thành

kết quả của tổng thể.

+ Tổng thể có độ chênh lệch nhiều về dấu hiệu cần nghiên cứu.

+ Cách chọn mẫu không khách quan.

- Sai số do ghi chép gồm: hiểu chưa đúng, ghi nhầm, dụng cụ đo không phù hợp, …

* Sai số là điều không thể tránh khỏi dù mẫu được chọn có đúng quy cách đến bao nhiêu.

Page 35: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

35

3.3. Một số biện pháp làm giảm sai số:

- Khâu chuẩn bị phải tốt về: quy trình, thiết bị hỗ trợ phù hợp, lựa chọn người điều tra,

tuyên truyền mục đích, ý nghĩa của việc điều tra.

- Thiết kế các câu hỏi ngắn gọn, khoa học, dễ hiểu.

3.4. Một số yêu cầu, nguyên tắc chọn mẫu thống kê:

- Xác định kích cỡ mẫu đủ khả năng đại diện cho tổng thể.

- Quy định sai số cho phép, độ tin cậy.

- Ước tính độ lệch tiêu chuẩn.

- Suy rộng các kết quả điều tra.

- Chọn thời điểm điều tra phù hợp.

- Kiểm định mẫu, kiểm định số liệu nghi ngờ.

BÀI 2 TRÌNH BÀY MỘT MẪU SỐ LIỆU

1. Bảng phân bố thực nghiệm

Ví dụ 1

Để tìm hiểu về hiệu quả của phương pháp giảng dạy mới, người ta chọn ra 120 học sinh

kiểm tra trắc nghiệm 50 câu và ghi nhận kết quả. Biến X là số điểm của 1 học sinh.

Xem xét mẫu số liệu ta nhận thấy

Có 10 học sinh đạt 31 điểm

Có 20 học sinh đạt 34 điểm

Có 30 học sinh đạt 35 điểm

Có 15 học sinh đạt 36 điểm

Có 10 học sinh đạt 38 điểm

Có 10 học sinh đạt 40 điểm

Có 5 học sinh đạt 42 điểm

Có 20 học sinh đạt 44 điểm

Trong mẫu số liệu trên có các giá trị ix là 31,34 ,35 ,36 ,38 ,40 ,42 ,44.

Mỗi giá trị có thể lặp lại một số lần thì số lần lặp lại gọi là tần số in :10 ,20,30 ,15 ,10 ,10 ,5 ,20.

Trình bày dạng bảng phân bố tần số

X 31 34 35 36 38 40 42 44

Tần số 10 20 30 15 10 10 5 20

Bảng 1

Định nghĩa 1

Giả sử có một mẫu số liệu kích thước n. ( 1, )ix i k là các giá trị khác nhau của X đo được trên

các phần tử của mẫu. ( 1, )in i k là tần số của ix . Ta có bảng phân bố tần số:

X 1x 2x … ix … kx

Tần số 1n 2n … in … kn

Bảng 2

Để so sánh kết quả khi kích thước mẫu thay đổi ta nên xét tần suất các giá trị của mẫu.

Định nghĩa 2

Tần suất if của giá trị ix là tỉ số giữa tần số in và kích thước mẫu n.

ii

nf

n

Page 36: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

36

Bảng sau đây được gọi là bảng phân bố thực nghiệm của biến X:

Bảng 3

Ví dụ 2

Bảng phân bố thực nghiệm của biến X ( là số điểm môn Toán trong kỳ thi tú tài vừa qua ) của

400 thí sinh được cho trong bảng sau đây:

X( điểm thi) Tần số Tần suất

0

1

2

3

4

5

6

7

8

9

10

6

15

43

53

85

72

55

33

18

10

10

6/400=0,015

0,0375

0,1075

0,1325

0,2125

0,18

0,1375

0,0825

0,045

0,025

0,025

Tổng 400 1

Bảng 4

2. Bảng phân bố ghép lớp

Trong những trường hợp phải điều tra với mẫu kích thước lớn, hoặc khi biến lấy nhiều giá trị

khác nhau nhưng lại gần nhau, người ta thường xác định một số khoảng 1 2, ,..., mC C C sao cho

mỗi giá trị của biến thuộc vào một và chỉ một khoảng.

Ví dụ 3

Chiều cao của 400 cây được trình bày trong bảng phân bố ghép lớp sau đây dạng [ , )a b :

Khoảng Tần số Tần suất Độ rộng khoảng

4,5 - 9,5

9,5 - 11,5

11,5 - 13,5

13,5 - 16,5

16,5 - 19,5

19,5 - 22,5

22,5 - 26,5

26,5 - 36,5

18

58

62

72

57

42

36

10

0,045

0,145

0,155

0,18

0,1425

0,105

0,09

0,025

5

2

2

3

3

3

4

10

Tổng 400 1

X 1x 2x … ix … kx Tổng

Tần số 1n 2n … in … kn

in n

Tần suất 1f 2f … if … kf 1if

Page 37: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

37

BÀI 3 BIỂU DIỄN BẰNG BIỂU ĐỒ, TỔ CHỨC ĐỒ

Giả sử ta có một mẫu số liệu (ix ) được trình bày trong một bảng phân bố thực nghiệm bảng 3.

Xét tập hợp G gồm các điểm có toạ độ ( ix , in ). Nối điểm có toạ độ ( ix ,0) với điểm có toạ độ

(ix ,

in ) ta có được một biểu đồ tần số hình gậy.

Nếu ta nối điểm (ix ,

in ) với điểm (1ix ,

1in ) bằng các đoạn thẳng ta có được một biểu đồ đa

giác tần số.

Tương tự xét tập hợp gồm các điểm có toạ độ (ix ,

if ). Nối điểm có toạ độ (ix ,0) với điểm có

toạ độ (ix ,

if ) ta có được một biểu đồ tần suất hình gậy.

Nếu ta nối điểm ( ix , if ) với điểm ( 1ix , 1if ) bằng các đoạn thẳng ta có được một biểu đồ đa

giác tần suất.

Ví dụ 4

Vẽ biểu đồ tần số hình gậy và biểu đồ đa giác tần suất trong ví dụ 1.

Trước hết ta lập bảng phân bố thực nghiệm:

X 31 34 35 36 38 40 42 44

Tần số 10 20 30 15 10 10 5 20

Tần suất 1/12 2/12 3/12 1/8 1/12 1/12 1/24 1/6

Đối với bảng phân bố ghép lớp, người ta dùng tổ chức đồ (histogram) để biểu diễn. Ta xét hai

trường hợp:

1. Độ rộng các khoảng bằng nhau

Trên mỗi khoảng ta dựng một hình chữ nhật có chiều cao bằng tần số (hay tần suất) tương ứng

của lớp đó.

Page 38: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

38

Ví dụ 5

Số học sinh giỏi của 51 trường phổ thông trong tỉnh như sau:

120 197 121 129 114 95 88 109 147 118 148 128 71 93 67 62 57

103 135 97 166 83 114 66 156 88 64 49 101 79 120 75 113 155

48 104 112 79 87 88 141 55 123 152 60 83 144 84 95 90 27

a. Lập bảng phân bố ghép lớp, sử dụng 8 khoảng với độ rộng bằng 22.

b. Vẽ tổ chức đồ tần số, tần suất .

Giải

a. Số liệu nhỏ nhất là 27. Ta sẽ chia khoảng sao cho đầu mút của khoảng đầu tiên là 26,5. Độ

dài mỗi khoảng là 22. Ta có bảng phân bố ghép lớp sau đây:

b. Vẽ tổ chức đồ tần số

Khoảng Tần số Tần suất

26,5 - 48,5

48,5 - 70,5

70,5 - 92,5

92,5 - 114,5

114,5 - 136,5

136,5 - 158,5

158,5 - 180,5

180,5 - 202,5

2

8

12

12

8

7

1

1

2/51=0,04

0,16

0,24

0,24

0,16

0,14

0,02

0,02

Tổng 51 1

Page 39: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

39

*Vẽ tổ chức đồ tần suất

2. Độ rộng các khoảng không nhất thiết bằng nhau

Trên khoảng iC có độ rộng il ta dựng một hình chữ nhật có chiều cao là ii

i

ny

l

( đối với tổ

chức đồ tần số) hay ii

i

fy

l

( đối với tổ chức đồ tần suất) với là hằng số dương tuỳ chọn (

sao cho tổ chức đồ dễ nhìn).

Ví dụ 6

Xét bảng phân bố ghép lớp của ví dụ 3. Hãy vẽ tổ chức đồ tần số của 1 .

Giải

Từ công thức ii

i

ny

l ta tính được chiều cao iy của các hình chữ nhật trong tổ chức đồ sau:

Khoảng Tần số Độ rộng khoảng /i i iy n l

4,5 - 9,5

9,5 – 11,5

11,5-13,5

13,5-16,5

16,5-19,5

19,5-22,5

22,5-26,5

26,5-36,5

18

58

62

72

57

42

36

55

5

2

2

3

3

3

4

10

3,6

29

31

24

19

14

9

5,5

Tổng 400

Page 40: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

40

3. Đối với các dấu hiệu định tính thì ngƣời ta thƣờng mô tả số liệu mẫu bằng biểu đồ hình

bánh xe.

Biểu đồ hình bánh xe là hình tròn được chia thành các phần tương ứng với tỷ lệ các bộ phận

trong mẫu.

Ví dụ 7

Điều tra ngẫu nhiên 100 khách hàng của một doanh nghiệp sản xuất điện tử thì thấy khách hàng

được phân chia theo tỷ lệ về tầng lớp xã hội như sau:

Tầng lớp xã hội Số khách hàng Tỷ lệ

Công nhân

Nông dân

Thương nhân

Trí thức

35

40

15

10

0,35

0,40

0,15

0,10

Tổng số 100 1

Page 41: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

41

BÀI 4 CÁC ĐẶC TRƢNG MẪU

Có hai nhóm các đặc trưng:

- Các số đặc trưng cho chúng ta một hình ảnh về vị trí trung tâm của mẫu, tức là các số liệu

trong mẫu tập trung xung quanh con số nào đó. Đó là trung bình mẫu, trung vị (median) và

mode.

- Các số đặc trưng cho chúng ta một hình ảnh về mức độ phân tán của các số liệu, độ biến

động của các số liệu. Đó là biên độ, độ lệch mẫu, độ lệch mẫu hiệu chỉnh và phương sai mẫu

hiệu chỉnh.

Ngoài ra còn có đặc trưng mẫu về tỷ lệ phần tử có tính chất A trong mẫu quan sát.

1. Trung bình mẫu: 1 1

1 1k n

i i i

i i

x n x xn n

2. Phương sai mẫu: 2

2 222

1 1 1

1 1 1

k k n

i i i i i

i i i

s n x x n x x x xn n n

3. Phương sai mẫu hiệu chỉnh: 2 22

2

1 1

1 1

1 1 1

k n

i i i

i i

ns s n x x x x

n n n

4. Tỷ lệ mẫu: m

fn

, trong đó m là số phần tử có tính chất A, n là cỡ mẫu quan sát.

Ví dụ 1

Điều tra năng suất lao động của 100 công nhân trong một xí nghiệp sản xuất thiết bị điện, ta thu

được bảng số liệu

Năng suất

(sản phẩm /giờ) 41 44 45 46 48 52 54

Số công nhân 10 20 30 15 10 10 5

a. Tính năng suất trung bình mẫu và phương sai mẫu hiệu chỉnh của năng suất.

b. Những công nhân có năng suất từ 48 sản phẩm/giờ trở lên là những công nhân có năng suất

cao. Tính tỷ lệ công nhân có năng suất cao.

c. Tính trung bình mẫu và phương sai mẫu hiệu chỉnh năng suất của những công nhân có năng

suất cao.

Giải

a. Ta lập bảng tính như sau:

ix in .i in x 2.i in x

41 10 410 16810

44 20 880 38720

45 30 1350 60750

46 15 690 31740

48 10 480 23040

52 10 520 27040

54 5 270 14580

Tổng n=100 7

1

4600i i

i

n x

7

2

1

212680i i

i

n x

Năng suất trung bình: 7

1

1 14600 46

100i i

i

x n xn

sản phẩm/giờ

Page 42: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

42

Phương sai mẫu của năng suất: 272

2 2

1

1 1212680 (46) 10,8

100

i i

i

s n x xn

Phương sai mẫu hiệu chỉnh của năng suất: 2

2 10010,8 10,9

1 100 1

ns s

n

b. Tỷ lệ mẫu 10 10 5

0,25100

f

c. Ta lập bảng tính như sau:

ix

in .i in x 2.i in x

48 10 480 23040

52 10 520 27040

54 5 270 14580

Tổng n=25 3

1

1270i i

i

n x

3

2

1

64660i i

i

n x

Năng suất trung bình: 3

1

1 11270 50,8

25i i

i

x n xn

sản phẩm/giờ

Phương sai mẫu của năng suất: 232

2 2

1

1 164660 (50,8) 5,76

25

i i

i

s n x xn

Phương sai mẫu hiệu chỉnh của năng suất: 2

2 255,76 6

1 25 1

ns s

n

Ví dụ 2

Cho bảng số liệu bảng phân bố ghép lớp sau:

1i ix x in 1i ix x in

4-12 143 44-52 9

12-20 75 52-60 5

20-28 53 60-68 4

28-36 27 68-76 3

36-44 14 76-80 3

Tính trung bình mẫu và phương sai mẫu hiệu chỉnh ?

Giải

Ta lập bảng tính như sau:

1i ix x in 0ix 0.i in x 0 0. .i i in x x

4-12 143 8 1144 9152

12-20 75 16 1200 19200

20-28 53 24 1272 30528

28-36 27 32 864 27648

36-44 14 40 560 22400

44-52 9 48 432 20736

52-60 5 56 280 15680

60-68 4 64 256 16384

68-76 3 72 216 15552

76-80 3 78 234 18252

Page 43: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

43

Tổng n=336 10

0

1

6458i i

i

n x

10

2

0

1

195532i i

i

n x

Trung bình mẫu : 10

1

1 16458 19,22

336i i

i

x n xn

Phương sai mẫu : 2102

2 2

1

1 1195532 (19,22) 211,93

336

i i

i

s n x xn

Phương sai mẫu hiệu chỉnh: 2

2 336211,93 212,56

1 336 1

ns s

n

5. Trung vị (Median)

Trung vị của mẫu kí hiệu là m, là số có tính chất sau: Số các giá trị của mẫu nhỏ hơn hay bằng

m bằng số các giá trị của mẫu lớn hơn hay bằng m.

a.Trƣờng hợp các giá trị mẫu là phân biệt.

Giả sử các giá trị mẫu sắp theo thứ tự tăng dần 1 2 ... nx x x

Khi đó n lẻ thì 1

2

nm x ; n chẵn thì

1

2 2

2

n nx x

m

b.Trƣờng hợp các giá trị ix có tần số

in

Gọi k là chỉ số nhỏ nhất để 1 2 ....2

k

nn n n . Khi đó km x .

Ví dụ 3

Cho bảng số liệu sau:

X 0 1 2 3 4 5 6 7 8 9 10 11

in 6 15 43 53 85 72 55 33 18 10 7 3

Kích thước mẫu n=400 suy ra n/2=200

Ta thấy số giá trị của mẫu nhỏ hơn hay bằng 3 là 6+15+43+53=117<200 nên 3m

Số giá trị của mẫu nhỏ hơn hay bằng 4 là 6+15+43+53+85=202>200 nên 4m

6. Biên độ

Hiệu số của giá trị lớn nhất và giá trị nhỏ nhất gọi là biên độ mẫu.

Page 44: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

44

CHƢƠNG 4 LÝ THUYẾT ƢỚC LƢỢNG

Ƣớc lƣợng là phỏng đoán giá trị các đặc trưng chưa biết của tổng thể bằng cách quan sát

mẫu được lấy từ tổng thể. Thông thường các đặc trưng của tổng thể cần ước lượng như: trung

bình tổng thể, phương sai tổng thể, tỷ lệ tổng thể.

Có 2 dạng ước lượng:

- Ước lượng điểm: đặc trưng của tổng thể cần ước lượng là một số.

- Ước lượng khoảng: đặc trưng của tổng thể cần ước lượng là một khoảng.

BÀI 1 ƢỚC LƢỢNG ĐIỂM

Từ mẫu ta tính ra được một số nào đó dùng số này để ước lượng đặc trưng của tổng thể gọi là

phương pháp ước lượng điểm. Từ đó cho ta khái niệm số thống kê và tham số.

Khi các dữ liệu được lấy ra từ một mẫu, các số đo lường mà người ta đã tính toán để mô tả mẫu

thì được gọi là số thống kê (statistics). Trong tổng thể thì các số đo lường ấy được gọi là tham

số (parameters). Chúng ta xem bảng ký hiệu phân biệt số thống kê và tham số:

Số thống kê Tham số

Trung bình X

Phương sai hiệu chỉnh 2S 2

Tỷ lệ F p

Khi ta chỉ có các dữ kiện của mẫu, ta cần phải phỏng đoán các tham số của tổng thể từ mẫu.

Như vậy ta dùng trung bình của mẫu, X , để phỏng đoán trung bình của tổng thể, ; ta dùng

phương sai mẫu hiệu chỉnh 2S , để phỏng đoán độ lệch chuẩn của tổng thể,

2 ,ta dùng tỷ lệ

mẫu F , để phỏng đoán tỷ lệ tổng thể p .

I. Ƣớc lƣợng điểm cho trung bình tổng thể

Dùng trung bình mẫu X là ước lượng không chệch cho trung bình tổng thể .

E X

II. Ƣớc lƣợng điểm cho phƣơng sai tổng thể

Dùng phương sai mẫu có hiệu chỉnh 2S là ước lượng không chệch cho phương sai tổng thể.

2 2E S

III. Ƣớc lƣợng điểm cho tỷ lệ tổng thể

Dùng tỷ lệ mẫu là ước lượng không chệch cho tỷ lệ tổng thể.

Ví dụ 1

Quan sát thu nhập của một số công nhân ở 1 công ty sản xuất điện công nghiệp, ta có bảng số

liệu:

Thu nhập (ngàn đồng/tháng) Số người

500-550 5

550-600 9

600-650 12

650-700 35

700-750 66

750-800 47

800-850 24

Page 45: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

45

850-900 18

900-950 6

950-1000 3

a. Tìm ước lượng không chệch cho thu nhập trung bình trong 1 tháng của 1 người trong công

ty.

b. Những người có thu nhập trên 800.000 đồng/tháng là những người có thu nhập cao. Tìm ước

lượng không chệch của tỷ lệ những người có thu nhập cao trong công ty.

Giải

a. Ta lập bảng tính:

ix 1ix

in 0ix

0.i in x

500 550 5 525 2625

550 600 9 575 5175

600 650 12 625 7500

650 700 35 675 23625

700 750 66 725 47850

750 800 47 775 36425

800 850 24 825 19800

850 900 18 875 15750

900 950 6 925 5550

950 1000 3 975 2925

Tổng n=225

10

0

1

167225i i

i

n x

Ta có: 10

0

1

1 167225743,22

225i i

i

x n xn

Vậy ước lượng không chệch cho thu nhập trung bình trong 1 tháng của 1 người trong công ty

là 743,22 ngàn đồng/ tháng.

b. Tỷ lệ những người có thu nhập cao trong công ty trong mẫu là

24 18 6 3 510,226

225 225f

Vậy ước lượng không chệch của tỷ lệ những người có thu nhập cao trong công ty 22,6%.

Page 46: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

46

BÀI 2 ƢỚC LƢỢNG KHOẢNG

Gọi là tham số nào đó của các đặc trưng cho tổng thể cần ước lượng. Chọn thống kê T ước

lượng khoảng cho nghĩa là tìm khoảng (1 2, ) chứa với độ tin cậy 1 thoả

1 2( ) 1P gọi là phương pháp ước lượng khoảng.

I. Ƣớc lƣợng trung bình của tổng thể

+ Giả sử tổng thể X có trung bình chưa biết. Tìm khoảng 1 2( , ) chứa với độ tin cậy

1 thoả 1 2( ) 1P .

+ Khoảng ƣớc lƣợng cho :

x x

+ Độ chính xác

TH1: Trƣờng hợp kích thƣớc mẫu 30n (hoặc 30n nhƣng X có phân phối chuẩn);

phƣơng sai 2 đã biết

Xét đại lượng ngẫu nhiên

/

XZ

n

Vì 30n nên ta có thể áp dụng định lý Lindeberg-Levy . Nội dung định lý như sau:

Nếu các đại lượng ngẫu nhiên 1 2, ,..., nX X X độc lập, có cùng kỳ vọng và phương sai 2

hữu hạn thì đại lượng ngẫu nhiên:

/

XZ

n

có phân phối xấp xỉ với phân phối chuẩn tắc (0,1)N khi n khá lớn.

Trường hợp n < 30 thì do giả thiết X có phân phối chuẩn 2( , )N nên có định lý chứng minh

rằng Z có phân phối chuẩn tắc (0,1)N .

Với độ tin cậy 1 đã cho, số z thoả điều kiện { }P Z z gọi là phân vị mức

của phân bố chuẩn chuẩn tắc Z. Ta dễ dàng nhận thấy / 2z là phân vị mức / 2 của phân bố

chuẩn chuẩn tắc Z như hình sau

/2

/2 /2

/2

{ } / 2{| | } {| | } 1

{ } / 2

P Z zP Z z P Z z

P Z z

(1)

Thay biểu thức của Z vào (1) ta được:

/2/

XP z

n

/2 /2/

XP z z

n

Hay /2 /2P X z X zn n

Page 47: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

47

Với độ tin cậy , khoảng tin cậy của là

/ 2 / 2;X z X zn n

Chú ý: tìm / 2z là giá trị thoả mãn / 2( ) / 2z với

2

2

0

1( )

2

z t

z e dt

là hàm Laplace (tra

bảng phụ lục 3).

TH2: Trƣờng hợp 30n , 2 chƣa biết

Trường hợp này, vì kích thước mẫu lớn ( 30n ) nên ta có thể dùng ước lượng 2S để thay cho

2 chưa biết.

Với độ tin cậy , khoảng tin cậy của là

/ 2 / 2;s s

X z X zn n

TH3: Phƣơng sai 2 chƣa biết, n < 30, X có phân phối chuẩn.

Cơ sở cho việc xây dựng khoảng tin cậy cho trường hợp này là định lí sau đây:

Định lí:

Giả sử 2

1 2~ ( , ), , ,..., nX N X X X là các ĐLNN độc lập, có cùng phân phối với X. Khi đó

ĐLNN

( )X nT

S

sẽ có phân bố Student với n-1 bậc tự do.

Dựa trên định lí này ta xây dựng khoảng tin cậy như sau:

Đặt 1 . Từ bảng phân bố Student n-1 bậc tự do ta có thể tìm được số 1

/2

nt

thỏa mãn 1

/2(T ) / 2nP t

ở đó T là ĐLLN có phân bố Student với n-1 bậc tự do. Vì T có phân bố đối xứng nên 1

/2(T ) / 2nP t

Xem hình vẽ. Bảng phân bố Student được cho ở phụ lục bảng 4.

Page 48: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

48

Do đó 1 1

/2 /2( T ) 1n nP t t

Hay 1 1

/2 /2

( )( )n nX n

P t tS

1 1

/2 /2( )n nS SP X t X t

n n

Với độ tin cậy , khoảng tin cậy của là

1 1

/2 /2;n ns sX t X t

n n

Chú ý: tìm 1

/ 2

nt

là giá trị thoả mãn 1

/ 2(| | )nP T t với ~ ( 1)T T n (tra bảng phụ lục 4).

Tóm lại: Độ chính xác đƣợc tính nhƣ sau

TH1

+ 2 đã biết

+ 30n hoặc

30n và X có pp

chuẩn

Chọn thống kê ước lượng

( )(0,1)

X nT N

/2zn

/ 2z tra phụ lục 3

TH2 + 2 chưa biết

+ 30n

( )(0,1)

X nT N

S

/2

sz

n

/2z tra phụ lục 3

TH3 + 2 chưa biết

+ 30n và X có pp

chuẩn

( )( 1)

X nT T n

S

1

/2

n st

n

1

/2

nt tra phụ lục 4

Ví dụ 1

Tuổi thọ bóng đèn hình TV của một công ty sản xuất có luật phân phối chuẩn 2( , )N

2~ ( ,16 )N (đơn vị giờ). Chọn ngẫu nhiên 15 bóng, ta có kết quả sau:

355 350 400 375 380 390 402 380

360 382 370 360 375 400 380

Hãy ước lượng tuổi thọ trung bình bóng đèn hình TV của một công ty sản xuất với độ tin cậy

99%.

Giải

Page 49: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

49

Đây là bài toán ước lượng khoảng cho trung bình tổng thể.

Gọi X là tuổi thọ bóng đèn hình TV của một công ty sản xuất, là tuổi thọ trung bình bóng

đèn hình TV của một công ty sản xuất.

Ta ước lượng :

Trường hợp này 2 216 đã biết, do vậy khoảng tin cậy cụ thể của là:

x x với /2zn

Với độ tin cậy /299% 2,576z tra bảng phụ lục 3. Từ số liệu đã tính ở bảng sau:

Ta tính được 377,26x giờ và 16 . Từ đó ta có

/ 2

162,576 10,64

15z

n

Vậy với độ tin cậy 99% khoảng tin cậy của là:

(377,26 10,64 377,26 10,64)

hay (366,62 387,9) (đơn vị giờ).

Các kết quả thường dùng của phân vị chuẩn tra bảng phụ lục 3

Với độ tin cậy /295% 1,96z

Với độ tin cậy /295,5% 2z

Với độ tin cậy /299% 2,576z

Với độ tin cậy /299,73% 3z

Ví dụ 2 Ở một cửa hàng bán xăng dầu, theo dõi nhu cầu của mặt hàng xăng trong một số ngày, ta có kết

quả ở bảng sau:

Số bán ra (lít) Số ngày Số bán ra (lít) Số ngày

20-30 3 70-80 25

30-40 8 80-90 17

40-50 30 90-100 9

50-60 45 100-110 4

60-70 20

Hãy ước lượng xăng trung bình bán ra một ngày với độ tin cậy 99%.

Giải

Gọi X là lượng xăng bán ra trong ngày, là lượng xăng trung bình bán ra trong ngày.

Ta ước lượng :

Trường hợp 2 chưa biết, kích thước mẫu n=161, do vậy khoảng tin cậy cụ thể của là:

x x với /2

sz

n

Với độ tin cậy /299% 2,576z tra bảng phụ lục 3. Từ số liệu đã tính ở bảng sau:

ix 1ix in 0ix 0.i in x 2

0.i in x

20 30 3 25 75 1875

30 40 8 35 280 9800

40 50 30 45 1350 60750

Page 50: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

50

50 60 45 55 2475 136125

60 70 20 65 1300 84500

70 80 25 75 1875 140625

80 90 17 85 1445 122825

90 100 9 95 855 81225

100 110 4 105 420 44100

Tổng n=161 9

0

1

10075i i

i

n x

9

2

0

1

681825i i

i

n x

9

0

1

1 1007562,57

161i i

i

x n xn

9 22

2 2

0

1

1 681825(62,57) 319,93

161i i

i

s n x xn

2 2161319,93 321,92 17,94

160s s s

Ta tính được: 62,57x và 17,94s . Từ đó ta có:

/2

17,942,576 3,64

161

sz

n

Vậy với độ tin cậy 99% khoảng tin cậy của là:

(58,93 66,21) (lít)

Ví dụ 3

Đo đường kính (mm) của 20 trục máy do một máy tiện tự động sản xuất ra, ta được kết quả:

250 249 251 253 248 250 250 252 257 245

248 247 249 250 280 250 247 253 256 249

Giả sử đường kính của các trục máy là đại lượng ngẫu nhiên có phân phối chuẩn. Hãy ước

lượng đường kính trung bình của một trục máy do máy tiện ra với độ tin cậy 95%.

Giải

Đặt bảng tính

ix in .i in x 2.i in x

245 1 245 60025

247 2 494 122018

248 2 496 123008

249 3 747 186003

250 5 1250 312500

251 1 251 63001

252 1 252 63504

253 2 506 128018

256 1 256 65536

257 1 257 66049

280 1 280 78400

Tổng n=20

11

0

1

5034i i

i

n x

11

2

0

1

1268062i i

i

n x

Page 51: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

51

Ta tính được: 2

2 220251,7; 50,21 50,21 52,85 7,27

19x s s s s .

Gọi X là đường kính của một trục máy do máy tiện tự động sản xuất ra, là đường kính trung

bình của một trục máy.

Ta ước lượng :

Trường hợp này 2 chưa biết, cỡ mẫu 20 30n , do vậy khoảng tin cậy cụ thể của là

x x với 1

/2

n st

n

Với độ tin cậy 19

/295% 2,093t tra bảng phụ lục 4 .

1

/2

7,272,093 3,4

20

n st

n

Vậy với độ tin cậy 95% khoảng tin cậy của là

(248,3 255,1) (mm)

* Xác định các chỉ tiêu

Chỉ tiêu đã biết Chỉ tiêu

cần tìm

Công thức

TH1

TH2

TH3

n , độ tin cậy /2zn

/2

sz

n

1

/2

n st

n

n , độ tin

cậy / 2

nz

/2

nz

s

1

/ 2

n nt

s

độ tin cậy , n

2

2

/2 2n z

1n n nếu n là

số thập phân

2

2

/2 2

sn z

1n n nếu n là

số thập phân

2

2 21

/ 2

n

n s

t

Tra bảng phụ lục

4, tìm n thích hợp.

1n n nếu n là

số thập phân

Ví dụ 4

Quan sát năng suất của 100 công nhân trong một xí nghiệp, người ta tính được năng suất trung

bình của 1 công nhân ở mẫu này là 12x sản phẩm/ngày và 2 25s .

a. Ước lượng năng suất trung bình của 1 công nhân trong xí nghiệp với độ tin cậy 99,73%.

b. Muốn ước lượng năng suất trung bình của 1 công nhân trong xí nghiệp với độ tin cậy 95,5%

thì độ chính xác đạt được bao nhiêu ?

c. Muốn ước lượng năng suất trung bình của 1 công nhân trong xí nghiệp với độ chính xác

1,154 thì độ tin cậy là bao nhiêu ?

d. Muốn ước lượng năng suất trung bình của 1 công nhân trong xí nghiệp với độ tin cậy

99,73% và độ chính xác 1,2 thì cần quan sát năng suất của bao nhiêu công nhân nữa ?

Giải

a. Gọi X là năng suất của một công nhân trong xí nghiệp, là năng suất trung bình của một

Page 52: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

52

công nhân trong xí nghiệp.

Ta ước lượng :

Trường hợp này 2 chưa biết và kích thước mẫu n=100, do vậy khoảng tin cậy cụ thể của là

x x với /2

sz

n

Với độ tin cậy /299,73% 3z tra bảng phụ lục 3.

/2

53 1,5

100

sz

n

Vậy với độ tin cậy 99,73% khoảng tin cậy của là

( 10,5 < < 13,5 )

b. Với độ tin cậy /295,5% 2z tra bảng phụ lục 3.

/2

52 1

100

sz

n

c. Với độ chính xác 1,154

/ 2

1,154 1002,308 0,979 97,9%

5

n

sz

d. Với độ tin cậy /299,73% 3z tra bảng phụ lục 3.

2 2

2 2

/2 2 2

53 156,25 157

(1,2)

sn z n

Vậy cần quan sát thêm 157-100=57 công nhân.

II. Ƣớc lƣợng tỷ lệ p ( 30n )

Giả sử trong tổng thể, mỗi cá thể có thể mang hay không mang một đặc tính A nào đó. Gọi p là

tỷ lệ cá thể có đặc tính A trong toàn bộ tổng thể (p chưa biết). Nhà nghiên cứu muốn ước lượng

tham số p này căn cứ trên một mẫu điều tra. Giả sử trong một mẫu kích thước n có k cá thể

mang đặc tính A.

Chúng ta đã thấy tần suất mẫu ngẫu nhiên k

Fn

là một ước lượng không chệch và vững cho

p. Bài toán đặt ra ở đây là xây dựng khoảng tin cậy cho p, nghĩa là tìm khoảng 1 2( , )p p chứa p

với độ tin cậy 1 thoả 1 2( )P p p p . Cơ sở toán học cho việc xây dựng khoảng tin

cậy cho tỉ lệ p (chưa biết) là định lí sau đây.

Định lí

Tần suất mẫu k

Fn

là một hàm ĐLNN có phân bố xấp xỉ chuẩn với kỳ vọng EF p và

phương sai (1 )p p

DFn

với điều kiện 30n .

Vì ta không biết p (chúng ta đang cố gắng ước lượng nó) nên ta không biết được DF. Tuy nhiên

với 30n ta có thể xấp xỉ p bởi F, nghĩa là ta coi (1 )F F

DFn

.

Như vậy ĐLNN ( ) ( )

~ (0,1)(1 )

F p F p nN

DF F F

Từ đó

Page 53: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

53

/ 2 / 2

( )( )

(1 )

F p nP z z

F F

/ 2 / 2

(1 ) (1 )( )

F F F FP F z p F z

n n

Vậy ta đi đến kết luận:

Khoảng tin cậy cho tỉ lệ p với độ tin cậy là

/ 2 / 2

(1 ) (1 );

F F F FF z F z

n n

Hay khoảng ước lượng của p là

( )f p f với / 2

(1 )f fz

n

Với độ tin cậy /2z tra bảng phụ lục 3, f là tỷ lệ phần tử có tính chất A trong mẫu.

Ví dụ 5:

Ở một cửa hàng mua bán vải, kiểm tra một số mét vải thấy kết quả sau:

Số khuyết tật ở mỗi đơn vị 0 1 2 3 4 5 6

Số đơn vị kiểm tra (10 mét) 8 20 12 40 30 25 15

Nếu gọi vải loại I là loại ở mỗi đơn vị có không quá 2 khuyết tật, ước lượng tỷ lệ vải loại I của

cửa hàng mua bán vải với độ tin cậy 99%.

Giải

Gọi tỷ lệ vải loại I của cửa hàng mua bán vải là p. Khoảng ước lượng p là

( )f p f với /2

(1 )f fz

n

Từ bảng số liệu đã cho, ta có tỷ lệ vải loại I của mẫu là

8 20 120,27

150f

Với độ tin cậy /299% 2,576z tra bảng phụ lục 3.

Suy ra /2

(1 ) 0,27(1 0,27)2,576 0,09

150

f fz

n

Vậy khoảng tin cậy của p là ( 0,18 < p < 0,36 )

Ví dụ 6

Số liệu tiền gửi ngân hàng kỳ hạn 6 tháng của 100 khách hàng tiềm năng tại ngân hàng Bình

Dương, ta được kết quả cho ở bảng sau dạng [a,b):

Số tiền

(tỷ đồng) 98,2-98,8 98,8-99,2 99,2-99,8 99,8-100,2 100,2-100,8 100,8-101,2 101,2-101,8

Số khách

hàng 8 12 20 30 14 10 6

Page 54: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

54

Theo quy định, những khách hàng có tiền gửi từ 99,8 tỷ đồng trở lên là những khách hàng VIP

của ngân hàng .

a. Ước lượng trung bình số tiền gửi ngân hàng của một khách hàng VIP trong số khách hàng

tiềm năng của ngân hàng với độ tin cậy 95%.

b. Ước lượng tỷ lệ khách hàng VIP trong số khách hàng tiềm năng của ngân hàng với độ tin

cậy 95%.

c. Để độ chính xác khi ước lượng trung bình số tiền gửi ngân hàng của một khách hàng VIP

trong số khách hàng tiềm năng của ngân hàng là 0,1 với độ tin cậy 99% tỷ thì cần xem thêm ít

nhất bao nhiêu khách hàng VIP nữa.

d. Để độ chính xác khi ước lượng tỷ lệ khách hàng VIP trong số khách hàng tiềm năng của

ngân hàng là 9% với độ tin cậy 99% thì cần xem thêm ít nhất bao nhiêu khách hàng tiềm năng

nữa.

Giải

a. Gọi X là số tiền gửi ngân hàng của một khách hàng VIP trong số khách hàng tiềm năng của

ngân hàng, là trung bình số tiền gửi ngân hàng của một khách hàng VIP trong số khách hàng

tiềm năng của ngân hàng.

Số khách hàng VIP trong mẫu là 30+14+10+6=60.

Ta ước lượng :

Trường hợp này 2 chưa biết và kích thước mẫu n=60, do vậy khoảng tin cậy cụ thể của là

x x với /2

sz

n

Với độ tin cậy /295% 1,96z tra bảng phụ lục 3.

0ix in

100 30

100,5 14

101 10

101,5 6

Tổng n=60

Ta tính được: 100,433 và 0,516x s . Từ đó ta có:

/ 2

0,5161,96 0,13

60

sz

n

Vậy với độ tin cậy 95% khoảng tin cậy của là:

( 100,303 < < 100,949 )

b. Gọi p là tỷ lệ chi tiết đạt tiêu chuẩn. Khoảng ước lượng p là

( )f p f với /2

(1 )f fz

n

Từ bảng số liệu đã cho, ta có tỷ lệ chi tiết đạt tiêu chuẩn của mẫu là

Page 55: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

55

600,6

100f

Với độ tin cậy /295% 1,96z tra bảng phụ lục 3.

Suy ra / 2

(1 ) 0,6(1 0,6)1,96 0,096

100

f fz

n

Vậy khoảng tin cậy của p là ( 0,6-0,096 < p < 0,6+0,096 ) suy ra (0,504 < p < 0,696)

c. Đây là bài toán xác định kích thước mẫu trong trường hợp ước lượng trung bình.

Để đạt được độ chính xác là 0,1 với độ tin cậy 99% khi ước lượng trung bình ta cần mẫu có

kích thước 1n .

Với độ tin cậy /299% 2,576z tra bảng phụ lục 3.

2 2

2 2

1 / 2 2 2

(0,516)(2,576) 176,68

(0,1)

sn z

suy ra 1 177n .

Vậy ta cần quan sát thêm 177-60=117 khách hàng VIP nữa.

d. Đây là bài toán xác định kích thước mẫu trong trường hợp ước lượng tỷ lệ.

Để đạt được độ chính xác là 9% với độ tin cậy 99% khi ước lượng tỷ lệ ta cần mẫu có kích

thước 2n .

2 2

2 / 2 2 2

(1 ) 0,6 0,4(2,576) 196,615

(0,09)

f fn z

suy ra 2 197n .

Vậy ta cần quan sát thêm 197-100=97 khách hàng tiềm năng nữa.

Page 56: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

56

CHƢƠNG 5 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

BÀI 1 CÁC KHÁI NIỆM

I. Giả thuyết thống kê:

Trong lĩnh vực sản xuất, nghiên cứu, ta luôn luôn phải đưa ra những quyết định: quyết định

dùng phương pháp này hay một phương pháp kia, quyết định thay thế một biện pháp này bằng

một biện pháp khác tốt hơn hay giữ nguyên như cũ. Muốn vậy ta phải so sánh phương pháp cũ

với phương pháp mới, biện pháp này với biện pháp kia để xem những cái lợi và bất lợi của

từng loại. Các quyết định của ta hầu như luôn luôn phải dựa vào những hiểu biết có giới hạn

của ta nên không thể hoàn toàn chắc chắn. Luôn luôn có yếu tố rủi ro trong các quyết định của

ta. Ta có lúc đưa ra quyết định sai lầm. Các phương pháp suy diễn có thể giúp ta trong quá trình

quyết định ấy. Đó là một lĩnh vực thống kê suy diễn được gọi là kiểm nghiệm giả thiết hay

kiểm nghiệm ý nghĩa (test of significance). Dưới đây là một số ví dụ cho loại kiểm nghiệm này.

Giám đốc xí nghiệp cho rằng dường như chất lượng sản phẩm năm nay kém hơn năm trước.

Nếu thật sự là vậy, giám đốc xí nghiệp sẽ phải sửa đổi chương trình và phương pháp sản xuất.

Nhưng trước khi quyết định về vấn đề này hiệu trưởng phải làm một cuộc khảo sát về chất

lượng sản phẩm năm nay so với chất lượng sản phẩm năm trước. Căn cứ vào kết quả khảo sát

chất lượng sản phẩm các năm trước bằng một phương pháp tiêu chuẩn hóa mà giá trị đã được

xác nhận thì điểm chất lượng sản phẩm các năm trước là 100. Năm nay ông giám đốc xí

nghiệp quyết định chọn một mẫu ngẫu nhiên gồm các sản phẩm năm nay và cũng áp dụng

phương pháp tiêu chuẩn hóa này cho nhóm sản phẩm mới này. Nếu mẫu sản phẩm mới này cho

kết quả điểm trung bình chất lượng sản phẩm là xấp xỉ 100 cho tổng thể sản phẩm năm nay thì

hẳn ông giám đốc không phải băn khoăn gì nữa. Nhưng nếu điểm trung bình ấy dưới 100 thì

ông còn phải suy xét nhiều hơn nữa để rồi quyết định sửa đổi chương trình và phương pháp sản

xuất như thế nào.

Trên đây ta chỉ mới đưa ví dụ về kiểm nghiệm thống kê với một mẫu. Ngoài ra ta còn có

trường hợp kiểm nghiệm thống kê với nhiều mẫu. Ví dụ ta muốn biết công nhân nam và công

nhân nữ có khác biệt hay không về năng suất lao động. Ta ra một khảo sát phương pháp tiêu

chuẩn hóa cho một mẫu công nhân nam và một mẫu công nhân nữ. So sánh điểm trung bình

của hai mẫu, ta có thể đánh giá được sự khác biệt giữa hai trung bình tổng thể nam và nữ.

Trong ví dụ này, số thống kê hiệu số giữa hai trung bình mẫu được dùng để đánh giá tham số

hiệu số giữa hai trung bình tổng thể.

Tóm lại, việc kiểm nghiệm giả thuyết có thể dẫn đến một trong ba loại quyết định như sau:

1. Nếu giả thuyết H0 bị bác bỏ, chấp nhận đối thuyết H1.

2. Nếu giả thuyết H0 không bị bác bỏ, chấp nhận giả thuyết H0.

3. Nếu giả thuyết H0 không bị bác bỏ, không quyết định gì cả. Chờ một cuộc thử nghiệm khác

về sau.

Nhưng dù lựa chọn quyết định nào trên đây, ta cũng có thể phạm phải sai lầm. Có hai loại sai

lầm, được gọi là: sai lầm loại I và sai lầm loại II.

Nếu H0 thực sự đúng nhưng cuộc kiểm nghiệm dẫn đến việc bác bỏ nó nên ta chấp nhận đối

thiết H1, đó là sai lầm loại I.

Mặt khác, nếu H0 thực sự sai, nhưng cuộc kiểm nghiệm không dẫn đến việc bác bỏ nó nên ta

chấp nhận H0, đó là sai lầm loại II.

Do đó sai lầm loại I là sai lầm mà ta phạm phải khi ta bác bỏ một giả thiết kiểm nghiệm nếu giả

thiết ấy đúng. Sai lầm loại II là sai lầm chấp nhận giả thiết kiểm nghiệm nếu giả thiết ấy là sai.

*Các kiểm nghiệm có chiều hƣớng và không có chiều hƣớng

Như đã nói ở trên, các kiểm nghiệm giả thiết đòi hỏi phải đưa ra một đối thiết H1 nhất định, để

khi giả thuyết H0 bị bác bỏ thì ta chấp nhận đối thuyết H1 . Đối thiết này chỉ rõ chiều hướng

Page 57: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

57

thay đổi (nhỏ hơn hoặc lớn hơn), đó là kiểm nghiệm giả thiết có chiều hướng (directional

hypothesis test). Hoặc chỉ nêu lên rằng có sự khác biệt mà thôi, đó là kiểm nghiệm giả thiết

không có chiều hướng (nondirectional hypothesis test).

Với ví dụ của ông giám đốc xí nghiệp nói trên, nếu ông muốn biết rằng điểm trung bình chất

lượng sản phẩm của toàn thể sản phẩm năm nay có phải là 100 như các năm trước hay không,

các giả thiết ông đưa ra để kiểm nghiệm là:

Giả thuyết H0: 100

Đối thuyết H1: 100

Đó là một kiểm nghiệm giả thuyết không có chiều hướng. Nó cho biết không bằng 100,

nhưng không tiên đoán rằng nhỏ hơn hay lớn hơn 100. Trong trường hợp này, ông giám đốc

chỉ muốn biết rằng chất lượng sản phẩm năm nay có khác với các chất lượng sản phẩm các năm

trước hay không mà thôi.

Nhưng nếu ông giám đốc tiên đoán rằng chất lượng sản phẩm năm nay kém thua chất lượng

sản phẩm các năm trước. Trong trường hợp này, các giả thiết của ông sẽ là:

Giả thuyết H0: 100

Đối thuyết H1: 100

Nếu H0 bị bác bỏ, ông có thể chấp nhận H1, và như vậy ông sẽ phải sửa đổi chương trình và

phương pháp giảng dạy.

Tương tự

Nếu ông giám đốc tiên đoán rằng chất lượng sản phẩm năm nay vượt xa hơn chất lượng sản

phẩm các năm trước. Trong trường hợp này, các giả thiết của ông sẽ là:

Giả thuyết H0: 100

Đối thuyết H1: 100

Nếu H0 bị bác bỏ, ông có thể chấp nhận H1, và như vậy ông sẽ giữ chương trình và phương

pháp sản xuất hiện hành.

Kiểm nghiệm giả thiết không có chiều hướng nói trên thường được gọi là kiểm nghiệm hai đuôi

(two-tailed test), và kiểm nghiệm giả thiết có chiều hướng được gọi là kiểm nghiệm một đuôi

(one-tailed test).

Tóm lại:

- Giả thuyết thống kê là một giả sử hay một phát biểu có thể đúng hoặc sai liên quan đến các

tham số đặc trưng của một hay nhiều tổng thể.

- Kiểm định giả thuyết là tìm ra kết luận chấp nhận hay bác bỏ một giả thuyết.

- Giả sử tham số là các đặc trưng của tổng thể chưa biết và dựa vào cơ sở nào đó để nêu ra

giả thiết 0: H là giả thuyết cần kiểm định.

- Giả thuyết đối của H kí hiệu là H . Có 3 trường hợp

0 0

0 0

0 0

: ; :

: ; :

: ; :

H H

H H

H H

II. Mức ý nghĩa

Mỗi khi kiểm nghiệm giả thuyết, người nghiên cứu cần phải xác định xác suất sai lầm loại I

mà mình có thể phạm phải. Xác suất sai lầm loại I này được gọi là mức alpha (ký hiệu ) hay

cũng gọi là mức ý nghĩa (level of significance). Mức alpha này có thể là bất cứ trị số nào ta

muốn, nhưng thông thường, người ta đặt mức alpha này là 0,05. Nếu 0,05 , như vậy có

nghĩa là có 5% may rủi H0 là đúng và quyết định bác bỏ H0 là một sai lầm. Quyết định này dựa

vào dữ kiện của mẫu, chứ không phải căn cứ trên tổng thể, cho nên người ta không thể nào

hoàn toàn chắc chắn về kết quả kiểm nghiệm giả thiết được. Vì vậy ta cần phải đưa ra quyết

Page 58: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

58

định của ta với một xác suất sai lầm nào đó mà ta có thể phạm phải. Nếu ta bác bỏ giả thiết H0

với mức 0,05 , như vậy có nghĩa là, nếu lặp lại cuộc thử nghiệm 100 lần, với 100 mẫu

khác nhau, và cứ mỗi lần như vậy lại bác bỏ giả thiết H0 thì sẽ có khoảng 5 lần ta có thể phạm

phải sao lầm loại I (nói cách khác, ta có may rủi 5% phạm phải sai lầm loại I).

Xác suất phạm phải sai lầm loại II được biểu thị bằng ký hiệu bê-ta . Không giống như , ta

không thể kiểm soát trực tiếp được. Thế nhưng có điều quan trọng cần phải biết là có mối

liên hệ nghịch đảo giữa và . Nói cách khác, khi tăng lên thì giảm đi.Thế nhưng số

lượng thay đổi ở không trực tiếp tỷ lệ với số lượng thay đổi ở . Một yếu tố quan trọng

nhằm giảm thiểu cả hai loại sai lầm nói trên là cỡ mẫu. Khi cỡ mẫu tăng lên, các xác suất sai

lầm loại I và II sẽ giảm đi.

Tóm lại:

- Sai lầm loại 1: là sai lầm mắc phải khi ta bác bỏ H trong khi H đúng. Xác suất bác bỏ H

trong khi H đúng là .

- Sai lầm loại 2: là sai lầm mắc phải khi ta chấp nhận H trong khi H sai. Xác suất chấp nhận

H trong khi H sai là .

-Trong thống kê qui ước sai lầm loại 1 tác hại hơn sai lầm loại 2 nên cần tránh hơn. Số là

mức ý nghĩa, thường 10% .

III. Miền bác bỏ, miền chấp nhận

- Miền bác bỏ là miền chứa giá trị của các đại lượng thống kê làm cho H bị bác bỏ.

- Miền chấp nhận là miền chứa giá trị của các đại lượng thống kê làm cho H được chấp nhận.

Page 59: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

59

BÀI 2 KIỂM ĐỊNH GIẢ THIẾT CÓ THAM SỐ

I. Kiểm định giả thiết về trung bình tổng thể

1. Bài toán

Giả sử tổng thể có trung bình chưa biết. Ta cần kiểm định giả thiết 0:

0H

Hãy đưa ra quy tắc căn cứ vào mẫu gồm n quan sát độc lập (1,..., nx x ) mà chấp nhận hay bác

bỏ giả thiết trên với mức ý nghĩa .

2. Quy tắc thực hành

● Bảng kiểm định 2 phía (two tail): Giả thuyết 0:

0H và Đối thuyết

1 0:H

Bước TH1 TH2: 30n TH3: 30n 2 đã biết

2 chưa biết 2 chưa biết

1.Tính z hoặc t 0x

z n

0x

z ns

0x

t ns

2.Tra bảng /2z phụ lục 6

/2z phụ lục 6 1

/2

nt

phụ lục 8

3a. Chấp nhận

0H

/2| z | z /2| z | z 1

/2| | nt t

3a. Bác bỏ 0

H /2| z | z /2| z | z 1

/2| | nt t

Hình 6.11: Kiểm định Z hai phía mức / 2

Hình 6.12: Kiểm định t hai phía mức / 2

● Bảng kiểm định 1 phía (one tail): Giả thuyết 0:0

H và Đối thuyết 1 0:H

Bước TH1 TH2: 30n TH3: 30n 2 đã biết

2 chưa biết 2 chưa biết

Page 60: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

60

1.Tính z hoặc t 0x

z n

0x

z ns

0x

t ns

2.Tra bảng z phụ lục 7 z phụ lục 7 1nt

phụ lục 9

3a. Chấp nhận

0H

z z z z 1nt t

3a. Bác bỏ 0

H z z z z 1nt t

Hình 6.13: Kiểm định Z một phía-bên phải mức

● Bảng kiểm định 1 phía (one tail): Giả thuyết 0:0

H và Đối thuyết 1 0:H

Bước TH1 TH2: 30n TH3: 30n 2 đã biết

2 chưa biết 2 chưa biết

1.Tính z hoặc t 0x

z n

0x

z ns

0x

t ns

2.Tra bảng z phụ lục 7 z phụ lục 7 1nt

phụ lục 9

3a. Chấp nhận

0H

z z z z 1nt t

3a. Bác bỏ 0

H z z z z 1nt t

Ví dụ 1

Giám đốc xí nghiệp cho biết lương trung bình của 1 công nhân trong xí nghiệp là 3,8 triệu

đồng/tháng. Chọn ngẫu nhiên 36 công nhân thấy lương trung bình là 3,5 triệu đồng/tháng và độ

Page 61: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

61

lệch chuẩn 400 ngàn đồng. Lời tuyên bố của giám đốc có tin cậy không với mức ý nghĩa

5% .

Giải

Tiền lương trung bình của 1 công nhân theo lời giám đốc: 0 3,8 .

Tiền lương trung bình tực tế của 1 công nhân là chưa biết.

Đưa ra giả thiết : : 3,80

H Đối thiết : 3,81

H

Kiểm tra giả thiết :

0,4 đã biết , vậy kiểm tra giả thiết là trường hợp 1.

+ Tính kiểm định: 0 3,5 3,836 4,5

0,4

xz n

+Tìm/2z :

/25% 1,96z tra bảng phụ lục 6.

So sánh: |z|=4,5 > 1,96. Vậy ta bác bỏ giả thiết 0

H , xem 0 .

Ta kết luận lời tuyên bố của giám đốc không đúng.

Ví dụ 2 (tiếp VD1)

Có tài liệu báo cáo cho rằng tình hình lương trung bình của 1 công nhân trong xí nghiệp thấp

hơn lời tuyên bố của giám đốc. Hãy kiểm định lời báo cáo đó với mức ý nghĩa 5% .

Giải

Đưa giả thiết : 3,80

H

Đối thiết : 3,81

H

+ Tính kiểm định: 0 3,5 3,836 4,5

0,4

xz n

+Tìm z : 5% 1,645z tra bảng phụ lục 7.

So sánh: z=-4,5 <- 1,645. Vậy ta chấp nhận đối thiết : 3,81

H .

Ta kết luận lời báo cáo đúng.

Ví dụ 3

Trọng lượng trung bình của một loại sản phẩm theo quy định là 6 kg. Sau một thời gian sản

xuất, kiểm tra 121 sản phẩm ta có 5,9x kg và 2 5,76s . Giả thiết trọng lượng của các sản

phẩm có phân phối chuẩn. Cho kết luận về tình hình sản xuất có bình thường, đúng quy định

không với mức ý nghĩa 5% .

Giải

Trung bình quy định 0 6kg .

Trung bình thực tế sản xuất là chưa biết.

Đưa ra giả thiết : : 60

H Đối thiết : 61

H

Kiểm tra giả thiết : 2 chưa biết, n=121>30, vậy kiểm tra giả thiết là trường hợp 2.

+ Tính kiểm định: 0 5,9 6121 0,45

5,76

xz n

s

+Tìm / 2z : / 25% 1,96z tra bảng phụ lục 6.

So sánh: / 2| | 0,45 1,96z z . Vậy ta chấp nhận giả thiết : 60

H .

Ta kết luận tình hình sản xuất bình thường, đúng quy định.

Ví dụ 4 (tiếp Ví dụ 3)

Có báo cáo cho rằng tình hình sản xuất không bình thường, trọng lượng trung bình của sản

phẩm thấp hơn 6 kg theo quy định. Hãy kiểm định lời báo cáo đó với mức ý nghĩa 5% .

Page 62: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

62

Giải

Đưa ra giả thiết : : 60

H

Đối thiết : 61

H

+ Tính kiểm định: 0 5,9 6121 0,45

5,76

xz n

s

+Tìm z : 5% 1,645z tra bảng phụ lục 7.

So sánh: 0,45 1,645z z . Vậy ta chấp nhận giả thiết : 60

H .

Ta kết luận lời báo cáo đó chưa đủ cơ sở để kết luận trọng lượng trung bình của sản phẩm thấp

hơn 6 kg theo quy định.

Ví dụ 5

Trước đây máy móc của một công ty sản xuất ra các vòng đệm (thiết bị cơ khí nhỏ như camera

số, tablet,…) có bề dày trung bình là 0,05 cm. Để xác định liệu các máy này vẫn còn hoạt động

bình thường hay không, người ta chọn một mẫu gồm 10 vòng đệm và tính được bề dày trung

bình là 0.053 cm và độ lệch chuẩn mẫu 0,003 cm. Với mức ý nghĩa 5% , hãy kiểm định giả

thiết máy này có hoạt động bình thường không?

Giải

Gọi X là bề dày vòng đệm (bearing) do máy móc công ty sản xuất.

Trung bình quy định 0 0.05

Trung bình thực tế sản xuất là chưa biết.

Đưa giả thiết : 0,050

H

Đối thiết : 0,051

H

Ta thấy n=10<30, X có phân phối chuẩn, 2 chưa biết nên thuộc trường hợp 3.

Tính kiểm định 0 0,053 0,0510 3,1623

0,003

xt n

s

9

/ 25% 2,2622t tra bảng phụ lục 8.

So sánh: |t| = 3,1623 > 9

/ 2 2,2622t nên ta bác bỏ giả thiết : 0,050

H .

Kết luận tình hình hoạt động của máy không bình thường.

Ví dụ 6

Năm trước tiền lương trung bình của các cử nhân quản trị kinh doanh làm việc tại các công ty

liên doanh nước ngoài là 210 USD/tháng. Năm nay điều tra ngẫu nhiên lương tháng của 25 cử

nhân đang làm việc cho các công ty đó tìm được 218x USD/tháng, độ lệch chuẩn 10s .

Nếu giả thiết tiền lương là biến ngẫu nhiên phân phối chuẩn thì với mức ý nghĩa 5% có thể

cho rằng năm nay các nhân viên đó có hưởng mức lương cao hơn hay không?

Giải

Tiền lương trung bình của các cử nhân quản trị kinh doanh năm trước là 0 210 .

Tiền lương trung bình của các cử nhân quản trị kinh doanh năm nay là chưa biết.

Đưa giả thiết 0 : 210H

Đối thiết : 2101

H

Ta thấy n=25 < 30, X có phân phối chuẩn, 2 chưa biết nên thuộc trường hợp 3.

Tính kiểm định 0 218 21025 4

10

xt n

s

245% 1,7109t tra bảng phụ lục 9.

Page 63: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

63

So sánh: t =4 > 24 1,7109t nên ta chấp nhận đối thiết : 210

1H .

Kết luận: năm nay các nhân viên đó có hưởng mức lương cao hơn năm trước.

II. Kiểm định giả thiết về tỷ lệ tổng thể

1. Bài Toán

Giả sử tổng thể chia 2 loại phần tử. Tỷ lệ phần tử có tính chất A là p chưa biết. Ta cần kiểm

tra giả thiết 0:

0H p p .

Hãy đưa ra quy tắc căn cứ vào mẫu gồm n quan sát độc lập (1,..., nx x ) mà chấp nhận hay bác

bỏ giả thiết trên với mức ý nghĩa .

2. Quy tắc thực hành

Bước 0 0:H p p

1 0:H p p

0 0:H p p

1 0:H p p

0 0:H p p

1 0:H p p

1. Tính z 0

0 0(1 )

f pz n

p p

0

0 0(1 )

f pz n

p p

0

0 0(1 )

f pz n

p p

2. Tra bảng /2z : / 2z tra

bảng phụ lục 6.

z : z tra bảng

phụ lục 7.

z : z tra bảng

phụ lục 7.

3a. Chấp nhận 0

H / 2| z | z z z z z

3b. Bác bỏ 0

H / 2| z | z z z z z

Ví dụ 7

Một máy sản xuất hàng loạt tỷ lệ sản phẩm loại A lúc đầu là 0 0,15p . Sau khi áp dụng

phương pháp sản xuất mới, kiểm tra 1000 sản phẩm ta thấy tỷ lệ loại A trong mẫu là f=0,2.

Cho kết luận về phương pháp sản xuất mới này với 5% .

Giải

Tỷ lệ loại A lúc đầu là 0 0,15p

Tỷ lệ loại A sau khi áp dụng phương pháp mới là p chưa biết.

Ta đặt giả thiết 0 : 0,15H p

Đối thiết 1 : 0,15H p

- Kiểm tra giả thiết:

+ Tính kiểm định 0

0 0

0,2 0,151000 4,42

(1 ) 0,15(1 0,15)

f pz n

p p

+ Tìm / 2z : / 25% 1,96z tra bảng phụ lục 6.

So sánh: |z| = 4,42 > / 2 1,96z nên bác bỏ giả thiết H0, xem 0p p .

Vậy phương pháp sản xuất mới khác với phương pháp lúc đầu.

Ví dụ 8

Một trường trung học có tỷ lệ học sinh giỏi lúc đầu là 0 0,15p . Sau khi áp dụng

phương pháp dạy học mới, kiểm tra 1000 học sinh thấy tỷ lệ học sinh giỏi trong mẫu là f=0,2.

Có thể xem phương pháp dạy học mới này có hiệu quả không với 5% .

Bài giải

Tỷ lệ học sinh giỏi lúc đầu là 0 0,15p

Tỷ lệ học sinh giỏi sau khi áp dụng phương pháp dạy học mới là p chưa biết.

Ta đặt giả thiết 0 : 0,15H p

Đối thiết 1 : 0,15H p

- Kiểm tra giả thiết:

Page 64: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

64

+ Tính kiểm định 0

0 0

0,2 0,151000 4,42

(1 ) 0,15(1 0,15)

f pz n

p p

+Tìm z : 5% 1,645z tra bảng phụ lục 7.

So sánh: z = 4,42 > 1,645z nên ta chấp nhận đối thiết 1 : 0,15H p .

Vậy phương pháp dạy học mới này có hiệu quả.

III. Kiểm định giả thiết về sự bằng nhau của hai kỳ vọng.

Giả sử X và Y là hai đại lượng ngẫu nhiên độc lập có cùng phân phối chuẩn với ,X Y chưa

biết. Ta cần kiểm định giả thiết : X YH

Lấy mẫu ngẫu nhiên kích thước n đối với X và mẫu ngẫu nhiên kích thước m đối với Y ta có 2

trường hợp sau:

TH biết

2 2,X Y TH chƣa biết 2 2, , 30X Y n

Tính toán -

2 2

X Y

x yz

n m

-22yx

x yz

ss

n m

- /2z : /2z tra bảng phụ lục 6.

So sánh - / 2| |z z chấp nhận giả thiết H, coi EX=EY.

- / 2| |z z bác bỏ giả thiết H, coi EX EY .

Ví dụ 9

Trọng lượng sản phẩm do hai nhà máy sản xuất là các đại lượng ngẫu nhiên có phân phối

chuẩn và có cùng độ lệch chuẩn là 1 kg. Với mức ý nghĩa 5% , có thể xem trọng lượng

trung bình của sản phẩm do hai nhà máy sản xuất là như nhau không? Nếu cân thử 25 sản phẩm

của nhà máy A ta tính được 50x kg, cân 20 sản phẩm của nhà máy B thì tính được

50,6y kg.

Giải

Gọi trọng lượng sản phẩm của nhà máy A là X; trọng lượng sản phẩm của nhà máy B là Y thì

X,Y là các đại lượng ngẫu nhiên có phân phối chuẩn với 2 2 1X Y .Ta kiểm định giả thiết

: X YH

+ Tính 50 50,6

21 1

25 20

z

+Tìm / 2z : / 25% 1,96z tra bảng phụ lục 6.

+ Ta thấy / 2| |z z bác bỏ giả thiết H, tức là trọng lượng trung bình của sản phẩm ở hai nhà

máy là khác nhau.

IV. Kiểm định giả thiết về sự bằng nhau của hai tỷ lệ.

Giả sử 1 2,p p tương ứng là tỷ lệ các phần tử có tính chất A của tổng thể thứ nhất và tổng thể

thứ hai. Ta cần kiểm định giả thiết

1 2: p pH

Page 65: TÀI LIỆU HỌC TẬP - elearning.tdmu.edu.vn

65

Tính toán 1 2

* *

1 2

1 1(1 )

f fz

p pn n

với * 1 1 2 2

1 2

n f n fp

n n

-/2z :

/2z tra bảng phụ lục 6.

So sánh - / 2| |z z chấp nhận giả thiết H, coi

1 2p p .

- / 2| |z z bác bỏ giả thiết H, coi 1 2p p .

Ví dụ 10

Kiểm tra các sản phẩm được chọn ở hai nhà máy sản xuất ta được số liệu sau

Nhà máy Số sản phẩm được kiểm tra Số phế phẩm

I 1 100n 20

II 2 120n 36

Với mức ý nghĩa 1% , có thể coi tỷ lệ phế phẩm của hai nhà máy là như nhau không ?

Giải

Gọi 1 2,p p là tỷ lệ phế phẩm của nhà máy I, II. Ta cần kiểm định giả thiết

1 2:H p p

Từ các số liệu đã cho ta có

+ 1 2

20 360,2; 0,3

100 120f f

+* *100 0,2 120 0,3

0,227 1 0,773100 120

p p

+0,2 0,3

1,761 1

0,227 0,773100 120

z

+Tìm / 2z : / 21% 2,576z tra bảng phụ lục 6.

Ta thấy / 2| |z z nên chấp nhận giả thiết H, tức là tỷ lệ phế phẩm của hai nhà máy là như

nhau.