btl xstk thầy thi

Post on 18-Jul-2016

214 Views

Category:

Documents

21 Downloads

Preview:

Click to see full reader

DESCRIPTION

BTL

TRANSCRIPT

TRƯỜNG ĐẠI HỌC BÁCH KHOA TP.HCM

BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

Giáo viên hướng dẫn: Nguyễn Bá Thi.

MỤC LỤC

Đề tài nhóm 10

Bài 1: Một nông trường nuôi bò nuôn ba giống bò sữa A, B,C. Lượng sữa của các con bò

được thống kê trong bảng sau đây

Loại bò

Lượng sữa

Ít Trung Bình Nhiều

A

B

C

92

53

74

37

15

19

46

19

12

Với mức ý nghĩa , hãy nhận định xem có phải ba giống bò này có phân

bố tỉ lệ như nhau về phương diện sữa hay không?

Bài 2: So sánh mức lợi nhuận trung bình trong kinh doanh của một Công ty tại 5 thị

trường khác nhau trên cơ sở bảng số liệu thống kê sau đây với :

Số thứ tự

quan sát

Thị trường

I II III IV V

1

2

3

4

7,3

7,6

8,3

8,3

5,4

7,1

7,4

6,4

8,1

7,9

9,5

9,6

7,1

Bài 3: Theo dõi số học sinh đến lớp muộn của 4 trường PTTH người ta thu được về số

lượng học sinh trung bình đến lớp muộn của các trường đó như sau:

Ngày trong

tuần

Trường PTTH

A B C D

Thứ hai

Thứ tư

Thứ sáu

Thứ bảy

5

4

4

4

4

5

3

4

5

3

4

3

7

2

5

2

Bạn có nhận xét gì về số lượng học sinh đến lớp muộn của trường. Chọn

.

Bài 4: Tính tỷ số tương quan của Y đối với X, hệ số tương quan và hệ số xác định của tập

số liệu sau đây. Với mức ý nghĩa , có kết luận gì về mối tương quan giữa X và Y

(Có phi tuyến không? Có tuyến tính không ? ). Tìm đường hồi quy của Y đối với X

X Y X Y X Y X Y

50

130

210

240

90

210

75

235

235

195

115

295

90

90

270

130

50

270

135

175

115

255

15

75

50

240

170

270

210

50

35

235

295

135

315

55

170

210

270

170

170

90

355

275

95

335

315

155

BÀI 1:

Một nông trường nuôi bò nuôn ba giống bò sữa A, B,C. Lượng sữa của các con bò được

thống kê trong bảng sau đây

Loại bò

Lượng sữa

Ít Trung Bình Nhiều

A

B

C

92

53

74

37

15

19

46

19

12

Với mức ý nghĩa , hãy nhận định xem có phải ba giống bò này có phân

bố tỉ lệ như nhau về phương diện sữa hay không?

BÀI LÀM

Nhận xét: Đây là bài toán kiểm định giả thuyết vể tỷ lệ.

Giải thuyết H0: Tỷ lệ sữa của ba giống bò này có phân phân bố tỉ lệ như nhau.

THỰC HIỆN BÀI TOÁN BẰNG EXCEL

Nhập giá trị vào bảng tính:

Tính tổng các số:

Tổng hàng: Chọn E3, nhập =SUM(B3:D3), rồi Enter, dùng con trỏ kéo nút

tự điều khiển từ điền từ E4 đến E5.

Tổng cột: Chọn B6, nhập =SUM(B3:B5), rồi Enter, dùng con trỏ kéo nút tự

điều khiển từ B6 đến D6.

Tổng cộng: chọn E8 và nhập =SUM(E3:E5).

Tính các tần số lý thuyết: (tổng hàng*tổng cột)/tổng cộng

A: Chọn B11: nhập =E3*$B$6/$E$6, rùi Enter, dùng con trỏ kéo nút tự điều

khiển từ B11 đến B13.

B: Chọn C11: nhập =E3*$C$6/$E$6, rồi Enter, dùng con trỏ kéo nút tự điều

khiển từ C11 đến C13.

C: Chọn D11: nhập =E3*$D$6/$E$6, rồi Enter, dùng con trỏ kéo nút tự điều

khiển từ D11 đến D13.

Áp dụng hàm số CHITEST tính giá trị

Chọn B15, nhập =CHITEST(B3:D5,B11:D13), rồi Enter.

Biện luận:

Bác bỏ giả thuyết H0.

Kết luận: Ba giống bò này có tỉ lệ khác nhau về phương diện sữa.

BÀI 2

So sánh mức lợi nhuận trung bình trong kinh doanh của một Công ty tại 5 thị

trường khác nhau trên cơ sở bảng số liệu thống kê sau đây với :

Số thứ tự

quan sát

Thị trường

I II III IV V

1

2

3

4

7,3

7,6

8,3

8,3

5,4

7,1

7,4

6,4

8,1

7,9

9,5

9,6

7,1

BÀI LÀM

Nhận xét: Đây là bài toán phân tích phương sai một yếu tố.

Sự phân tích phương sai một yếu tố là đánh giá sự ảnh hưởng của một yếu

tố (nhân tạo hay tự nhiên) nào đó trên các giá trị quan sát, Yi (i=1,2,…,k)

Giả thuyết:

“Các giá trị trung bình bằng nhau”

“Ít nhất có hai giá trị trung bình khác nhau”.

Giá trị thống kê:

Biện luận:

Nếu Chấp nhận giả thiết H0.

Ta giả thuyết H0: mức lợi lợi nhuận trung bình trong kinh doanh của một Công

ty tại 5 thị trường là như nhau.

THỰC HIỆN BÀI TOÁN BẰNG EXCEL

Nhập bản số liệu:

Vào Data/Data analysis, chọn Anova: Singer Factor.

Trên màn hình sẽ hiện ra hội thoại của Anova: Single Factor.

Ta nhập thông sô như hình bên dưới:

+ Phạm vi biến số Y (Input Range): ta kéo từ A1 đến E5

+ Group By: chọn Columns

+ Nhấp vào Labels in First Row

+ Nhận giá trị 0.1 vào Alpha.

+ Tọa độ đầu ra Output Range: nhấp vào A8. Nhấn OK.

Ta được kết quả như sau:

Biện luận:

Ta thấy

=> Bác bỏ giả thuyết H0 với mức ý nghĩ

Vậy mức lợi nhuận trung bình trong kinh doanh của một Công ty tại 5 thị

trường khác nhau thì khác nhau.

BÀI 3

Theo dõi số học sinh đến lớp muộn của 4 trường PTTH người ta thu được về số lượng

học sinh trung bình đến lớp muộn của các trường đó như sau:

Ngày trong

tuần

Trường PTTH

A B C D

Thứ hai

Thứ tư

Thứ sáu

Thứ bảy

5

4

4

4

4

5

3

4

5

3

4

3

7

2

5

2

Bạn có nhận xét gì về số lượng học sinh đến lớp muộn của trường. Chọn .

BÀI LÀM

Nhận xét: Đây là bài toán phân tích phương sai hai tố không lặp

Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị

quan sát Yij (i=1,2…r: yếu tố A; j=1,2…c: yếu tố B)

Giả thuyết:

“Các giá trị trung bình bằng nhau”

“Ít nhất có hai giá trị trung bình khác nhau”

Giá trị thống kê:

Biện luận:

Nếu => Chấp nhận H0 (yếu tố A)

Nếu => Chấp nhận H0 (yếu tố B).

Ta giả thuyết:

H01: yếu tố ngày không ảnh hưởng đến số lượng học sinh trung bình đến lớp

muộn của các trường đó.

H02: yếu tố trường khác không ảnh hưởng đến số lượng học sinh trung bình

đến lớp muộn của các trường đó.

THỰC HIỆN BÀI TOÁN BẰNG EXCEL

Nhập bảng số liệu như hình dưới:

Vào Data/Data analysis, chọn Anova: Two-Factor Without Replication, bấm

OK.

Trên màn hình sẽ hiện lên hộp thoại của Anova: Two-Factor Without

Replication như hình dưới:

Ta nhập các thông số như hình bên dưới:

+ Phạm vi của biến sô Y (Input Range): ta kéo từ ô A2 tới ô E6

+ Nhấp vào Labels, điền giá trị Alpha 0.1

+ Tọa độ đầu ra Output Range: nhấp vào A8.

+ Nhấn OK.

Ta được kết quả như sau:

Biện luận

Ta thấy: => Chấp nhận H01.

=> Chấp nhận H02.

Vậy cả 2 yếu tố ngày trong tuần và trường khác đều không ảnh hưởng đến số

lượng học sinh trung đi đến lớp muộn.

BÀI 4

Tính tỷ số tương quan của Y đối với X, hệ số tương quan và hệ số xác định của tập số

liệu sau đây. Với mức ý nghĩa , có kết luận gì về mối tương quan giữa X và Y

(Có phi tuyến không? Có tuyến tính không ? ). Tìm đường hồi quy của Y đối với X

X Y X Y X Y X Y

50

130

210

240

90

210

75

235

235

195

115

295

90

90

270

130

50

270

135

175

115

255

15

75

50

240

170

270

210

50

35

235

295

135

315

55

170

210

270

170

170

90

355

275

95

335

315

155

BÀI LÀM

Nhận xét: Đây là bài toán phân tích tương quan, phân tích hồi quy tuyến tính

THỰC HIỆN BÀI TOÁN BẰNG EXCEL

(i) Phân tích tương quan tuyến tính

Nhập bảng giá trị:

Vào Data/Data analysis, chọn Correlation:

Trên màn hình xuất hiện hộp thoại Correlation, ta nhập vào như hình sau:

+ Phạm vi đầu vào (Input Range), ta kéo từ ô A1 đến ô B25.

+ Ở Grouped By: chọn Comlumns.

+ Đánh dấu vào Label in First Row.

+ Tọa độ đầu ra (Output Range): ta chọn ô D4. Nhấn OK.

Ta được kết quả như sau:

Ta tìm được:

+ Hệ số tương quan:

+ Hệ số xác định :

Giả thuyết H0: X và Y không có quan hệ tương quan tuyến tính.

Ta có: √

Mà :

(c là phân vị mức

của phân bố Student với n-2=22 bậc tự do)

Vì | | nên chưa có cơ sở bác bỏ giả thuyết H0.

Vậy: Chưa kết luận được X và Y có tương quan tuyến tính.

(ii) Phân tích tương quan phi tuyến:

Phân tích lại bảng số liệu:

Vào Data/Data analysic, chọn Anova: Single Factor, Nhấn OK.

Trên màn hình xuất hiện Anova: Single Factor.

Trong hội thoại Anova: Single Factor, ta điền các giá trị như hình sau:

+ Phạm vi đầu vào (Input Range): ta kéo từ ô B1 đến ô H5.

+ Trong Grouped By: chọn Columns

+ Chọn Labels in first row

+ Nhập 0.05 vào Alpha.

+ Tọa độ đầu ra (Output Range): ta chọn ô A8.

Ta được kết quả như sau:

Rút ra được từ bảng Anova:

SSF = 237383,3

SST = 248383,3

Tính được:

=> Tỷ sô tương quan:

Suy ra:

+ Giả thiết H0: X và Y không tương quan phi tuyến

Ta có:

(c là phân vị mức của phân bố Fisher bậc tự do (k-2,n-k)=(5,21))

Vì: F>c nên không chấp nhận giả thuyết H0.

Vậy X và Y có tương quan phi tuyến.

(iii) Tìm đường hồi quy của X và Y

Giả thuyết H0: X và Y hồi quy tuyến tính

Ta nhập bản giá trị.

Vào Data/Data Analysic, chọn Regression.

Trong hội thoại Regression ta nhập vào các giá trị như hình sau:

+ Phạm vi đầu vào Y (Input Y Range): ta chọn từ ô B1 đến ô B25.

+ Phạm vi đầu vào X (Input X Range): ta chọn từ ô A1 đến ô A25.

+ Nhấp vào Labels.

+ Nhấp vào Line Fit Plots

+ Tọa đồ đầu ra (Output Range): chọn ô D1. Nhấ OK

Ta được kết quả như sau.

Kết luận: Đường hồi quy của Y đối với X là:

0

100

200

300

400

50

21

0

90

90

27

0

50

50

17

0

21

0

17

0

27

0

17

0

Y

X

X Line Fit Plot

Y

Predicted Y

top related