tai lieu cntt

50
Contents Dœ li»u thLng kê Ưc lưæng tham sL thLng kê Ki”m đnh gi£ thuy‚t thLng kê XÁC SUT TH¨NG KÊ GV: Th.S Hoàng Vy Thy Lynh Khoa Toán - ĐH Khoa hc Tü nhiên Bº môn: Xác su§t ThLng kê GV: Th.S Hoàng Vy Thy Lynh XÁC SUT TH¨NG KÊ

Upload: xuan-bach

Post on 16-Apr-2015

55 views

Category:

Documents


2 download

DESCRIPTION

Tai Lieu CNTT

TRANSCRIPT

Page 1: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

XÁC SUẤT THỐNG KÊ

GV: Th.S Hoàng Vy Thụy Lynh

Khoa Toán - ĐH Khoa học Tự nhiên

Bộ môn: Xác suất Thống kê

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 2: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Thống kê Toán

1 Dữ liệu thống kê

2 Ước lượng tham số thống kê

3 Kiểm định giả thuyết thống kê

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 3: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Các khái niệm và tính chất

- Tổng thể.- Mẫu và cỡ mẫu.

- Mẫu đại diện tốt nếu thỏa:* Mẫu phải được chọn ngẫu nhiên từ tổng thể.* Các phần tử của mẫu phải được chọn độc lập với nhau.

- Ký hiệu x1, x2, ..., xN lần lượt là các giá trị quan sát X trên Nphần tử của tổng thể. Do lấy mẫu ngẫu nhiên nên X là biếnngẫu nhiên có phân phối

P (X = xi) =1

N

- Phương pháp lấy mẫu ngẫu nhiên.GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 4: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Các khái niệm và tính chất

Tính chất của mẫuKý hiệu Xi là giá trị quan sát X trên phần tử thứ i của mẫu.Ta có:- Bộ n biến ngẫu nhiên (X1, X2, ..., Xn) là mẫu lấy từ biến ngẫunhiên X.- Các Xi có cùng phân phối như X- Các Xi độc lập với nhau.- Mẫu (X1, X2, ..., Xn) nhận các giá trị (x1, x2, ..., xn) thì(X1, X2, ..., Xn) gọi là mẫu lý thuyết, và (x1, x2, ..., xn) là mẫuthực nghiệmKhông gian mẫuTập hợp tất cả các mẫu quan sát X trên các phần tử của tổngthể được gọi là không gian mẫu. Mỗi phần tử có dạng(x1, x2, ..., xn)

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 5: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Mô tả dữ liệu

- Biến định lương và biến định tính.- Bảng tần số:

Khoảng Tần số(a1, a2] n1(a2, a3] n2

... ...(ak, ak + 1] nk

- Biểu đồ tần số- Biểu đồ tần suất và biểu đồ đường tần suất

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 6: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Hàm phân phối mẫu

Giả sử biến ngẫu nhiên X có hàm phân phối F (x) (ta cóF (x) = P (X ≤ x), x ∈ R, hay còn gọi là hàm phân phối lýthuyết của X).Với mẫu (X1, X2, ..., Xn) lấy từ X gọi N(x) là số các phần tửcủa Xi nhỏ hơn hoặc bằng x, x ∈ R.Khi đó hàm

Fn(x) =N(x)

n

được gọi là hàm phân phối mẫu của X.

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 7: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Tính chất Hàm phân phối mẫu

- Fn(x) là biến ngẫu nhiên nhận các giá trị 0,1

n,

2

n, ...,

n

n= 1 với

P

(Fn(x) =

k

n

)= P (N(x) = k)

P

(Fn(x) =

k

n

)= CknF

k(x) (1− F (x))n−k , k = 0, 1, ..., n

- Đối với mỗi mẫu, hàm phân phối xác định duy nhất và có đủtính chất của hàm phân phối (thay đổi trên đoạn [0, 1], khônggiảm và liên tục phải, đồ thị có hình bậc thang, tăng ở những

điểm gián đoạn, các bước nhảy đều bằng1

n).

- Khi gia tăng cỡ mẫu, hàm phân phối mẫu sẽ tiến tới hàmphân phối lý thuyết, nghĩa là

∀ε > 0, x ∈ R, limn→∞

P (|Fn(x)− F (x)| < ε) = 1

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 8: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Các đặc trưng của mẫu: Trung bình mẫu

KH µ = E(X), σ2 = D(X) (tham số lý thuyết)a) Xét mẫu lý thuyết X1, X2, ..., Xn lấy từ X, trung bình mẫu:

X =1

n

n∑i=1

Xi

E(X) = µ D(X) =σ2

n

√D(X) =

σ√n

b) Xét mẫu thực nghiệm (x1, x2, ..., xn), trung bình mẫu là

x =1

n

n∑i=1

xi

x =1

n

n∑i=1

nixi (Mẫu có lặp) x =1

n

n∑i=1

niθi (Mẫu chia khoảng)

Với ni là tần số và θi là giá trị đại diện của lớp ghépGV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 9: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Các đặc trưng của mẫu: Phương sai mẫu

Xét mẫu lý thuyết X1, X2, ..., Xn

- Phương sai mẫu

s2 =1

n

n∑i=1

(Xi −X)2

E(s2) = σ2 − σ2

n=n− 1

nσ2

Có thể biểu diễn s2 = X2 − (X)2 trong đó X2 =1

n

n∑i=1

X2i

- Phương sai mẫu có điều chỉnh

S2 =1

n− 1

n∑i=1

(Xi −X)2 hay S2 =n

n− 1s2

E(S2) = σ2GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 10: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Các đặc trưng của mẫu: Phương sai mẫu

Xét mẫu thực nghiệm (x1, x2, ..., xn)- Mẫu có lặp

s2 =1

n

k∑i=1

ni(xi − x)2 và S2 =1

n− 1

k∑i=1

ni(xi − x)2

Hay s2 = x2 − x2, với x2 =1

n

k∑i=1

nix2i

- Mẫu chia khoảng:

s2 =1

n

k∑i=1

ni(θi − x)2 và S2 =1

n− 1

k∑i=1

ni(θi − x)2

Hay s2 = x2 − x2, với x2 =1

n

k∑i=1

niθ2i

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 11: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Các đặc trưng của mẫu: Tỷ lệ mẫu

Gọi tham số p là tỷ lệ trên tổng thể J của các phần tử loại Ltrong tổng thể . Xét mẫu lý thuyết (X1, X2, ..., Xn) với Xi = 1nếu phần tử thứ i của mẫu thuộc loại L và Xi = 0 trong trườnghợp ngược lại. Ta có Xi ∼ B(1, p).Gọi m là số phần tử loại L trên mẫu n phần tử. Khi đóm = X1 +X2 + ...+Xn và

f =m

n

gọi là tỷ lệ mẫu (tần suất) của các phần tử loại L trên mẫu.

E(f) = E(m

n) =

1

n[E(X1) + E(X2) + ...+ E(Xn)] =

np

n= p

D(f) = D(m

n) =

1

n2[D(X1) +D(X2) + ...+D(Xn)] =

npq

n2=pq

n

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 12: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Đại lượng thống kê

Xét mẫu lý thuyết (X1, X2, ..., Xn) lấy từ biến ngẫu nhiên X.Hàm số bất kỳ T (X1, X2, ..., Xn) phụ thuộc vào mẫu được gọi làđại lượng thống kê trên không gian mẫu (hay còn gọi là thốngkê)- Thống kê là một biến ngẫu nhiên.- Kỳ vọng mẫu, phương sai mẫu, tỷ lệ mẫu là những thống kê.- Nếu X có hàm mật độ f(x) thì do Xi, i = 1, 2, ..., n độc lậpcùng phân phối với X nên mật độ đồng thời của(X1, X2, ..., Xn) là

f(x1, x2, ..., xn) = f(x1)f(x2)...f(xn)

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 13: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Ước lượng không chệch

Thống kê θ(X1, X2, ..., Xn) được gọi là ước lượng không chệchcủa tham số θ, nếu

E[θ(X1, X2, ..., Xn)] = θ, ∀θ ∈ Θ

Ngược lại, gọi là ước lượng chệch- Độ chệch của ước lượng c(θ) = E(θ)− θ- Ước lượng không chệch có c(θ) = 0- E[(θ − θ)2] = D(θ)− c2(θ) gọi là trung bình bình phương saisố, đối với ước lượng không chệch thì nó bằng phương sai củaước lượng.- g(X1, X2, ..., Xn) được gọi là ước lượng không chệch của g(θ)nếu

E[g(X1, X2, ..., Xn)] = g(θ)

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 14: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Ước lượng không chệch

VD:- Kỳ vọng mẫu X, phương sai mẫu hiệu chỉnh S2, tỷ lệ mẫu flần lượt là ước lượng không chệch cho µ = E(X), σ2 = D(X) vàp.- Phương sai mẫu s2 là ước lượng chệch cho σ2.Độ chính xác của ước lượng không chệch. Quy tắc 3σ- Giả sử θ(X1, X2, ..., Xn) là ước lượng không chệch cho θ vàD[θ(X1, X2, ..., Xn)] = σ2. Ta có

P(|θ − θ| ≤ 3σ

)≈ 0.889

- Một số phân phối, quy tắc 3σ đạt được xác suất cao hơn rấtnhiều, nên ta dùng quy tắc 2σ. VD: phân phối chuẩn.

P(|θ − θ| ≤ 2σ

)≈ 0.955

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 15: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Ước lượng vững

Ước lượng θn = θ(X1, X2, ..., Xn) được gọi là ước lượng vữngnếu

∀ε > 0, limn→∞

P(|θn − θ| ≤ ε

)= 1

hay nói cách khác, sai số tuyệt đối |θn − θ| nhỏ hơn một sốdương bất kỳ ε với xác suất gần 1 khi cỡ mẫu lớn.

- Nếu E(θn)→ θ và D(θn)→ 0 khi n→∞ thì θn là ước lượngvững.VD: Ước lượng µn = X của µ = E(X) là ước lượng vững vì

E(X) = µ và D(X) =σ2

n→ 0, n→∞.

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 16: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Ước lượng hiệu quả

Ước lượng θ của tham số θ được gọi là ước lượng hiệu quả nếu θcó phương sai nhỏ nhất trong các ước lượng không chệch của θ.

VD1: Nếu mẫu (X1, X2, ..., Xn) lấy từ X ∼ N(µ, σ2) với σ2 đãbiết thì X là ước lượng hiệu quả cho µ.VD2: Đo 22 lần góc của 1 vật thể được các kết quả: 3.1, 3.3,2.9, 3.0, 3.1, 3.2, 2.8, 2.7, 3.1, 3.2, 2.9, 3.0, 2.9, 3.2, 2.8, 2.9, 3.2,3.3, 2.9, 3.1, 3.2, 3.0. Hỏi giá trị thật của góc là bao nhiêu?

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 17: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Các phương pháp tìm ước lượng: Phương pháp hợp lýcực đại

Giả sử biến ngẫu nhiên X nhận các giá trị x1, x2, ... với xác suấtpi(θ) tương ứng, trong đó θ là tham số chưa biết. Xác suất đểtrong n quan sát X nhận được mẫu (X1, X2, ..., Xn) bằng

L = L(X1, X2, ..., Xn; θ) = p1(θ).p2(θ)...pn(θ)

Gọi θ(X1, X2, ..., Xn) là ước lượng của θ. Ta mong muốn

L = L(X1, X2, ..., Xn; θ) = maxθL(X1, X2, ..., Xn; θ) (hàm hợp lý)

Nếu X liên tục với hàm mật độ f(x, θ) thì

L = L(X1, X2, ..., Xn; θ) = f(X1, θ)....f(Xn, θ)

Phương pháp tìm θ(X1, X2, ..., Xn) để hàm hợp lý cực đại gọi làphương pháp hợp lý cực đại. Và θ(X1, X2, ..., Xn) gọi là ướclượng hợp lý cực đại của θ.

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 18: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Phương pháp hợp lý cực đại

Vì lnL và L khi mẫu cố định có chiều biến thiên như nhau (đạtgiá trị cực đại tại các điểm như nhau). Do đó để tìm ước lượnghợp lý cực đại cần giải phương trình hợp lý cực đại sau:

∂lnL

∂θ= 0 (a)

TH có nhiều tham số chưa biết (θ1, θ2, ..., θs) ta giải hệ:∂lnL

∂θk= 0, k = 1, 2, ..s (a)

Tính chất- Phương trình (a) có nghiệm là ước lượng vững của θ.- Ước lượng hợp lý cực đại rất gần với ước lượng hiệu quả.- Nghiệm của phương trình (a) có phân phối rất gần với phânphối chuẩn.VD: p183-184

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 19: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Ước lượng tham số bằng khoảng tin cậy

- Dựa vào mẫu tìm khoảng dao động của ước lượng quanh thamsố với một xác suất lớn cho trước, từ đó ta có thể lấy bất kỳ giátrị nào trong khoảng đó là xấp xỉ cho tham số, gọi là phươngpháp ước lượng tham số bằng khoảng tin cậy:Tìm 2 thống kê θ1 = θ1(X1, X2, ..., Xn) , θ2 = θ2(X1, X2, ..., Xn)sao cho

P (θ1 ≤ θ ≤ θ2) = γ

với γ cho trước, đủ lớn, gọi là độ tin cậy, và khoảng [θ1, θ2] gọilà khoảng tin cậy.- Với xác suất γ gần 1, các TH để θ rơi ra ngoài khoảng [θ1, θ2]là (1− γ)100% trong một số lớn lần lấy mẫu. Thường chọnγ = 0.9; 0.95, 0.99. Biến cố với xác suất như vậy được coi làchắc chắn.

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 20: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Khoảng tin cậy cho kỳ vọng

Giả sử tham số µ = E(X) chưa biết của biến ngẫu nhiên X vàσ2 = D(X). Dựa vào mẫu (X1, X2, ..., Xn) cần tìm 2 tham sốµ1(X1, X2, ..., Xn) và µ2(X1, X2, ..., Xn) sao cho:

P (µ1 ≤ µ ≤ µ2) = γ

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 21: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Khoảng tin cậy cho kỳ vọng

Với z 1+γ2

là phân vị mức 1+γ2 của Φ(x), tức là

Φ(z 1+γ

2

)=

1 + γ

2

Và tn−11+γ2

là phân vị mức 1+γ2 của luật phân phối Student với

n− 1 bậc tự do.VD1: Đo chiều dài một chi tiết máy 25 lần ta được số đo trungbình X = 20.05 (cm). Biết chiều dài chi tiết máy là biến ngẫunhiên tuân theo phân phối chuẩn với σ = 2. Tìm khoảng ướclượng cho chiều dài TB với mức ý nghĩa γ = 0.99.VD2: Kiểm tra độ chịu lực của 200 mẫu bê tông, ta tính đượcX = 221kG/cm2, với S2 = 152.6kG. Với độ tin cậy γ = 0.95 hãytìm khoảng ước lượng của độ chịu lực TB của lô bê tông trên.

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 22: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Khoảng tin cậy cho tỷ lệ

Giả sử tham số p là tỷ lệ các phần tử loại L trên tổng thể J. Cầntìm 2 đại lượng p1(X1, X2, ..., Xn) và p2(X1, X2, ..., Xn) sao cho

P (p1 ≤ p ≤ p2) = γ

Xét mẫu cỡ lớn: nf ≥ 10, n(1− f) ≥ 10 và thống kê

Z =f − p√p(1−p)n

∼ N(0, 1) , với f là tỷ lệ mẫu

p1,2 = f ± z 1+γ2

√f(1− f)

n

VD: Từ một lô hàng, kiểm tra 200 sản phẩm, thì có 17 sảnphẩm không đạt chất lượng. Với độ tin cậy γ = 0.95 hãy tìmkhoảng ước lượng của tỷ lệ sản phẩm không đạt chất lượng củatoàn lô sản phẩm.

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 23: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Khoảng tin cậy cho phương sai

Cho biến ngẫu nhiên X ∼ N(µ, σ2)

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 24: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Độ chính xác của ước lượng và xác định cỡ mẫu

Độ chính xác của ước lượng X cho tham số µ = E(X) với độtin cậy γ là số ε > 0 sao cho

P(|X − µ| ≤ ε

)= γ

Ta cóε = z 1+γ

2

σ√n, nếu σ2 đã biết

ε = z 1+γ2

S√n, nếu σ2 không biết

Cho ε và γ, tìm cỡ mẫu n

n ≥[z 1+γ

2

σ

ε

]2, nếu σ2 đã biết

n ≥[z 1+γ

2

S

ε

]2, nếu σ2 không biết

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 25: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Độ chính xác của ước lượng và xác định cỡ mẫu

Độ chính xác của ước lượng f cho tham số p với độ tin cậy γ làsố ε > 0 sao cho

P (|f − p| ≤ ε) = γ

ε = z 1+γ2

√f(1− f)

n

Cho ε và γ, tìm cỡ mẫu n

n ≥

[z 1+γ

2

√f(1− f)

ε

]2VD: Đo độ ion Na+ có kết quả như sau: 129, 132, 140, 141, 138,137, 140, 143, 138, 140, 143, 133.a) Ước lượng TB µ và phương sai σ2 ở độ tin cậy 0.95.b) Nếu muốn sai số ước lượng TB không quá ε = 1 với độ tincậy 0.95 thì cỡ mẫu quan sát là bao nhiêu?

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 26: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Ước lượng tham số bằng phương pháp bình phương nhỏnhất

Ứng với các giá trị quan sát X1, ..., Xn từ biến ngẫu nhiên X,quan sát biến Y được các giá trị Y1, ..., Yn. Với ei là sai số ngẫunhiên của quan sát ta có:

Yi = g(Xi, θ) + ei

Ta cần tìm ước lượng θ của θ sao cho:

ρ =

n∑i=1

[Yi − g(Xi, θ)]2 = minθ

n∑i=1

[Yi − g(Xi, θ)]2

Giải phương trình:

∂ρ

∂θ=

n∑i=1

[Yi − g(Xi, θ)]g′θ = 0

VD: p 193GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 27: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Kiểm định giả thuyết về tham số

- Giả thuyết thống kê là một mệnh đề về tổng thể nào đó.- Kiểm định giả thuyết là quá trình mà qua đó có thể quyếtđịnh bác bỏ giả thuyết hay không, dựa vào mẫu (X1, X2, ..., Xn)lấy từ tổng thể.- Giả thuyết H0 gọi là giả thuyết không, giả thuyết không có sựthay đổi. Giả thuyết H1 gọi là đối thuyết.- Do dựa vào mẫu để xét đoán nên quá trình kiểm định giảthuyết phải chỉ ra những mẫu nào trên không gian mẫu M khiđược lấy ra sẽ bác bỏ H0 (chấp nhận H1), còn lại là các mẫukhi lấy ra sẽ chấp nhận H0 (bác bỏ H1). Người ta chia khônggian mẫu thành 2 miền: M0: miền chấp nhận H0 và phần bùcủa nó M1: miền bác bỏ H0

M0 ∪M1 = M

M0 ∩M1 = ∅GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 28: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Sai lầm khi kiểm định giả thuyết

* Sai lầm loại I: Nếu thực tế H0 đúng, mà ta bác bỏ H0.Xác suất sai lầm loại I

α = P [(X1, X2, ..., Xn) ∈M1/H0 đúng ] = P (M1/H0)

* Sai lầm loại II: Nếu thực tế H0 sai, mà ta chấp nhận H0.Xác suất sai lầm loại II

β = P [(X1, X2, ..., Xn) ∈M0/H1 đúng ] = P (M0/H1)

- Cố định α đủ nhỏ và tìm một quy tắc sao cho β nhỏ có thểchấp nhận được. Xác suất α được gọi là mức ý nghĩa của quytắc. Thường chọn α = 0.05; 0.01- Khi cố định α thì "chất lượng" của quy tắc kiểm định đượcxác định bởi xác suất chấp nhận H1 khi H1 đúng, xác suất nàyđược gọi là lực lượng của quy tắc. Ký hiệu

π = 1− β = 1− P (M0/H1) = P (M1/H1)GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 29: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Kiểm định giả thuyết về so sánh kỳ vọng với một số chotrước

Biến ngẫu nhiên cần quan sát X. Đặt µ = E(X), σ2 = D(X).Các giả thuyết về µ có dạng:

a){H0 : µ = µ0H1 : µ > µ0

b){H0 : µ = µ0H1 : µ < µ0

c){H0 : µ = µ0H1 : µ 6= µ0

Đối thuyết trong a) và b) là đối thuyết một phía. Đối thuyếttrong c) là đối thuyết hai phía.

VD: Xét TH X ∼ N(µ, σ2) và cần kiểm định giả thuyết{H0 µ = µ0H1 µ > µ0

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 30: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Kiểm định giả thuyết về so sánh kỳ vọng với một số chotrước

Điều kiện n và σ2 Xét thống kê (H0 đúng) Miền bác bỏ H0

n ≥ 30, σ2 đã biết Z =X − µ0

σ√n

∼ N(0, 1) (1)

n ≥ 30, σ2 không biết Z =X − µ0

S√n

∼ N(0, 1) (1)

n < 30, σ2 đã biết Z =X − µ0

σ√n

∼ N(0, 1) (1)

n < 30, σ2 không biết T =X − µ0

S√n

∼ t(n− 1) (2)

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 31: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Kiểm định giả thuyết về so sánh kỳ vọng với một số chotrước

Với: (1): Miền bác bỏ H0 ứng với các đối thuyết có dạng:

a) M1 = {(x1, x2, ..., xn) : Z > z1−α}

b) M1 = {(x1, x2, ..., xn) : Z < −z1−α}c) M1 = {(x1, x2, ..., xn) : |Z| > z1−α/2}

Trong đó zα là phân vị mức α của Φ(x)(2): Miền bác bỏ H0 ứng với các đối thuyết có dạng:

a) M1 = {(x1, x2, ..., xn) : T > tn−11−α}

b) M1 = {(x1, x2, ..., xn) : T < −tn−11−α}

c) M1 = {(x1, x2, ..., xn) : |T | > tn−11−α/2}

Trong đó tn−1α là phân vị mức α của luật Student t(n− 1)GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 32: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Kiểm định giả thuyết về so sánh hai kỳ vọng

Quan sát X trên hai mẫu lấy từ hai tổng thể A và B:- Trên tổng thể A: X có kỳ vọng µ1 và phương sai σ21, mẫu cỡn1, kỳ vọng mẫu X1, phương sai mẫu có điều chỉnh S2

1 .- Trên tổng thể B: X có kỳ vọng µ2 và phương sai σ22, mẫu cỡn2, kỳ vọng mẫu X2, phương sai mẫu có điều chỉnh S2

2 .

Xét các giả thuyết:H0 : µ1 = µ2

a) H1 : µ1 > µ2; b) H1 : µ1 < µ2; c) H1 : µ1 6= µ2;

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 33: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Kiểm định giả thuyết về so sánh hai kỳ vọng

ĐK n1, n2 và σ21, σ22 Xét thống kê (H0 đúng) Miền bác bỏ H0

n1, n2 ≥ 30, σ21, σ22 biết Z =

X1 −X2√σ21n1

+σ22n2

∼ N(0, 1) (1)

n1, n2 < 30, σ21 = σ22 = σ2 T =X1 −X2√S2(

1n1

+ 1n2

) ∼ t(n1 + n2 − 2) (2)

Tương ứng 2 TH có miền bác bỏ là (1) và (2)Với:

S2 =(n1 − 1)S2

1 + (n2 − 1)S22

n1 + n2 − 2

gọi là phương sai mẫu gộp.GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 34: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Kiểm định giả thuyết về so sánh tỷ lệ với số cho trước

Giả sử tham số p là tỷ lệ các phần tử loại L trên tổng thể J.Gọi m là số phần tử loại L trên mẫu có cỡ mẫu n, và f =

m

nlà

tỷ lệ mẫu của các phần tử loại L.Các giả thuyết có dạng:

H0 : p = p0

a) H1 : p > p0 b) H1 : p < p0 c) H1 : p 6= p0

Xét mẫu cỡ lớn: nf ≥ 10, n(1− f) ≥ 10 và thống kê (khi H0

đúng)

Z =f − p0√p0(1− p0)

n

∼ N(0, 1)

Miền bác bỏ H0: (1)GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 35: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Kiểm định giả thuyết về so sánh hai tỷ lệ

Xét cỡ mẫu lớn: n1 ≥ 30, n2 ≥ 30- Tổng thể A: tỷ lệ phần tử loại L là p1, cỡ mẫu n1, tần suất f1- Tổng thể B: tỷ lệ phần tử loại L là p2, cỡ mẫu n2, tần suất f2

H0 : p1 = p2

a) H1 : p1 > p2 b) H1 : p1 < p2 c) H1 : p1 6= p2

và thống kê (khi H0 đúng)

Z =f1 − f2√

pq

(1

n1+

1

n2

) ∼ N(0, 1)

p =n1f1 + n2f2n1 + n2

và q = 1− p

Miền bác bỏ H0: (1)GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 36: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Kiểm định giả thuyết về so sánh hai phương sai

- Trên tổng thể A: X ∼ N(µ1, σ21), mẫu cỡ n1, phương sai mẫu

có điều chỉnh S21 .

- Trên tổng thể B: X ∼ N(µ2, σ22), mẫu cỡ n2, phương sai mẫu

có điều chỉnh S22 .

H0 : σ21 = σ22

a) H1 : σ21 > σ22; b) H1 : σ21 6= σ22;

và thống kê (khi H0 đúng) F =S21

S22∼ F (n1 − 1, n2 − 1)

Miền bác bỏ H0 ứng với các đối thuyết:

a) M1 = {(x1, x2, ..., xn) : F > Fn1−1,n2−11−α }

b) M1 = {(x1, x2, ..., xn) : |F | > Fn1−1,n2−11−α/2 }

Fn1−1,n2−1α là phân vị mức α của luật F (n1 − 1, n2 − 1)

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 37: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Các kiểm định khác

- Kiểm định giả thuyết về luật phân phối.- Kiểm định giả thuyết về tính độc lập.p 205-207

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 38: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Các luật phân phối liên tục

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 39: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Các luật phân phối liên tục

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 40: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Các luật phân phối liên tục

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 41: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Các luật phân phối liên tục

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 42: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Các định lý giới hạn

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 43: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Bảng phân phối xác suất đồng thời của vecto ngẫunhiên

pij = P [(X = xi)(Y = yj)] = P (X = xi;Y = yj)∑i,j

pij =∑i

P (X = xi) =∑j

P (Y = yj) = 1

X Y y1 y2 .... yn Tổng hàngx1 p11 p12 .... p1n p1.x2 p21 p22 .... p2n p2.... ... ... .... ... ...

xm pm1 pm2 .... pmn pm.Tổng cột p.1 p.2 .... p.n 1

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 44: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Bảng phân phối lề của vecto ngẫu nhiên

X x1 x2 .... xmP p1. p2. .... pm.

Y y1 y2 .... ynP p.1 p.2 .... p.n

VD: p131

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 45: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Hàm phân phối và hàm mật độ

p130-140- Xác suất có điều kiện và phân phối xác suất có điều kiện.- Hàm phân phối xác suất đồng thời.Hàm 2 biến F (x, y) = P (X ≤ x, Y ≤ y), x, y ∈ R được gọi làhàm phân phối xác suất đồng thời của (X,Y ).- Hàm mật độ đồng thời.Nếu hàm phân phối đồng thời của véc-tơ (X,Y ) có thể biểudiễn dưới dạng

F (x, y) =

∫ x

−∞

∫ y

−∞f(u, v)dudv, x, y ∈ R

thì hàm số f(x, y) được gọi là hàm mật độ đồng thời của (X,Y ).

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 46: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Hàm phân phối và hàm mật độ

- Hàm mật độ lề.

fX(x) =

∫ +∞

−∞f(x, y)dy

fY (y) =

∫ +∞

−∞f(x, y)dx

- Hàm mật độ có điều kiện.

fX|Y=y0(x) = f(x|y0) =f(x, y0)

fY (y0)

fY |X=x0(y) = f(y|x0) =f(x0, y)

fX(x0)

F (x|y0) =P (X ≤ x;Y ≤ y0)

P (Y ≤ y0)=F (x, y0)

FY (y0)

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 47: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Tính độc lập ngẫu nhiên

- Tính độc lập ngẫu nhiên.Cho (X,Y ), hai biến ngẫu nhiên X và Y được gọi là độc lập nếuvà chỉ nếu F (x, y) = FX(x)FY (y)* Trường hợp rời rạc ∀i = 1, ...,m; j = 1, ..., nP (X = xi;Y = yj) = P (X = xi)P (Y = yj)* Trường hợp liên tục ∀x, y ∈ R f(x, y) = fX(x)fY (y).- Hàm mật độ tổng các ngẫu nhiên độc lập.

FX+Y (z) =

∫ +∞

−∞fX(x)fY (z − x)dx

X và Y rời rạc độc lập ta có

P (X + Y = z) =∑xi

P (X = xi)P (Y = z − xi)

với xi là điểm mà P (X = xi) > 0.GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 48: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Hiệp phương sai

cov(X,Y ) = E([X − E(X)][Y − E(Y )])

cov(X,Y ) = E(XY )− E(X)E(Y )

* Trường hợp rời rạc

cov(X,Y ) =

n∑i=1

n∑j=1

(xi − EX)(yi − EY )pij

Ta cần E(XY ) =∑n

i=1

∑nj=1 xiyjpij

* Trường hợp liên tục

cov(X,Y ) =

∫ +∞

−∞

∫ +∞

−∞(x− EX)(y − EY )f(x, y)dxdy

Ta cần E(XY ) =∫ +∞−∞

∫ +∞−∞ xyf(x, y)dxdy

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 49: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Hệ số tương quan

Hệ số tương quan giữa biến ngẫu nhiên X và Y được xác địnhbởi công thức

r(X,Y ) =cov(X,Y )√D(X)D(Y )

VD: p133-140

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ

Page 50: Tai Lieu CNTT

Contents Dữ liệu thống kê Ước lượng tham số thống kê Kiểm định giả thuyết thống kê

Tài liệu tham khảo

[1] Tô Anh Dũng, Lý thuyết Xác suất và thống kê Toán, NXBĐH Quốc gia TpHCM.[2] https://sites.google.com/site/xstkcntt2012/

GV: Th.S Hoàng Vy Thụy Lynh XÁC SUẤT THỐNG KÊ