btl xstk thầy thi

24
TRƯỜNG ĐẠI HC BÁCH KHOA TP.HCM BÁO CÁO BÀI TP LN XÁC SUT THNG KÊ

Upload: trinhcanhphuc

Post on 18-Jul-2016

212 views

Category:

Documents


21 download

DESCRIPTION

BTL

TRANSCRIPT

Page 1: BTL XSTK Thầy Thi

TRƯỜNG ĐẠI HỌC BÁCH KHOA TP.HCM

BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

Page 2: BTL XSTK Thầy Thi

Giáo viên hướng dẫn: Nguyễn Bá Thi.

MỤC LỤC

Page 3: BTL XSTK Thầy Thi

Đề tài nhóm 10

Bài 1: Một nông trường nuôi bò nuôn ba giống bò sữa A, B,C. Lượng sữa của các con bò

được thống kê trong bảng sau đây

Loại bò

Lượng sữa

Ít Trung Bình Nhiều

A

B

C

92

53

74

37

15

19

46

19

12

Với mức ý nghĩa , hãy nhận định xem có phải ba giống bò này có phân

bố tỉ lệ như nhau về phương diện sữa hay không?

Bài 2: So sánh mức lợi nhuận trung bình trong kinh doanh của một Công ty tại 5 thị

trường khác nhau trên cơ sở bảng số liệu thống kê sau đây với :

Số thứ tự

quan sát

Thị trường

I II III IV V

1

2

3

4

7,3

7,6

8,3

8,3

5,4

7,1

7,4

6,4

8,1

7,9

9,5

9,6

7,1

Bài 3: Theo dõi số học sinh đến lớp muộn của 4 trường PTTH người ta thu được về số

lượng học sinh trung bình đến lớp muộn của các trường đó như sau:

Page 4: BTL XSTK Thầy Thi

Ngày trong

tuần

Trường PTTH

A B C D

Thứ hai

Thứ tư

Thứ sáu

Thứ bảy

5

4

4

4

4

5

3

4

5

3

4

3

7

2

5

2

Bạn có nhận xét gì về số lượng học sinh đến lớp muộn của trường. Chọn

.

Bài 4: Tính tỷ số tương quan của Y đối với X, hệ số tương quan và hệ số xác định của tập

số liệu sau đây. Với mức ý nghĩa , có kết luận gì về mối tương quan giữa X và Y

(Có phi tuyến không? Có tuyến tính không ? ). Tìm đường hồi quy của Y đối với X

X Y X Y X Y X Y

50

130

210

240

90

210

75

235

235

195

115

295

90

90

270

130

50

270

135

175

115

255

15

75

50

240

170

270

210

50

35

235

295

135

315

55

170

210

270

170

170

90

355

275

95

335

315

155

Page 5: BTL XSTK Thầy Thi

BÀI 1:

Một nông trường nuôi bò nuôn ba giống bò sữa A, B,C. Lượng sữa của các con bò được

thống kê trong bảng sau đây

Loại bò

Lượng sữa

Ít Trung Bình Nhiều

A

B

C

92

53

74

37

15

19

46

19

12

Với mức ý nghĩa , hãy nhận định xem có phải ba giống bò này có phân

bố tỉ lệ như nhau về phương diện sữa hay không?

BÀI LÀM

Nhận xét: Đây là bài toán kiểm định giả thuyết vể tỷ lệ.

Giải thuyết H0: Tỷ lệ sữa của ba giống bò này có phân phân bố tỉ lệ như nhau.

THỰC HIỆN BÀI TOÁN BẰNG EXCEL

Nhập giá trị vào bảng tính:

Tính tổng các số:

Tổng hàng: Chọn E3, nhập =SUM(B3:D3), rồi Enter, dùng con trỏ kéo nút

tự điều khiển từ điền từ E4 đến E5.

Page 6: BTL XSTK Thầy Thi

Tổng cột: Chọn B6, nhập =SUM(B3:B5), rồi Enter, dùng con trỏ kéo nút tự

điều khiển từ B6 đến D6.

Tổng cộng: chọn E8 và nhập =SUM(E3:E5).

Tính các tần số lý thuyết: (tổng hàng*tổng cột)/tổng cộng

A: Chọn B11: nhập =E3*$B$6/$E$6, rùi Enter, dùng con trỏ kéo nút tự điều

khiển từ B11 đến B13.

B: Chọn C11: nhập =E3*$C$6/$E$6, rồi Enter, dùng con trỏ kéo nút tự điều

khiển từ C11 đến C13.

C: Chọn D11: nhập =E3*$D$6/$E$6, rồi Enter, dùng con trỏ kéo nút tự điều

khiển từ D11 đến D13.

Áp dụng hàm số CHITEST tính giá trị

Page 7: BTL XSTK Thầy Thi

Chọn B15, nhập =CHITEST(B3:D5,B11:D13), rồi Enter.

Biện luận:

Bác bỏ giả thuyết H0.

Kết luận: Ba giống bò này có tỉ lệ khác nhau về phương diện sữa.

Page 8: BTL XSTK Thầy Thi

BÀI 2

So sánh mức lợi nhuận trung bình trong kinh doanh của một Công ty tại 5 thị

trường khác nhau trên cơ sở bảng số liệu thống kê sau đây với :

Số thứ tự

quan sát

Thị trường

I II III IV V

1

2

3

4

7,3

7,6

8,3

8,3

5,4

7,1

7,4

6,4

8,1

7,9

9,5

9,6

7,1

BÀI LÀM

Nhận xét: Đây là bài toán phân tích phương sai một yếu tố.

Sự phân tích phương sai một yếu tố là đánh giá sự ảnh hưởng của một yếu

tố (nhân tạo hay tự nhiên) nào đó trên các giá trị quan sát, Yi (i=1,2,…,k)

Giả thuyết:

“Các giá trị trung bình bằng nhau”

“Ít nhất có hai giá trị trung bình khác nhau”.

Giá trị thống kê:

Biện luận:

Nếu Chấp nhận giả thiết H0.

Ta giả thuyết H0: mức lợi lợi nhuận trung bình trong kinh doanh của một Công

ty tại 5 thị trường là như nhau.

THỰC HIỆN BÀI TOÁN BẰNG EXCEL

Page 9: BTL XSTK Thầy Thi

Nhập bản số liệu:

Vào Data/Data analysis, chọn Anova: Singer Factor.

Trên màn hình sẽ hiện ra hội thoại của Anova: Single Factor.

Ta nhập thông sô như hình bên dưới:

+ Phạm vi biến số Y (Input Range): ta kéo từ A1 đến E5

+ Group By: chọn Columns

+ Nhấp vào Labels in First Row

Page 10: BTL XSTK Thầy Thi

+ Nhận giá trị 0.1 vào Alpha.

+ Tọa độ đầu ra Output Range: nhấp vào A8. Nhấn OK.

Ta được kết quả như sau:

Biện luận:

Page 11: BTL XSTK Thầy Thi

Ta thấy

=> Bác bỏ giả thuyết H0 với mức ý nghĩ

Vậy mức lợi nhuận trung bình trong kinh doanh của một Công ty tại 5 thị

trường khác nhau thì khác nhau.

Page 12: BTL XSTK Thầy Thi

BÀI 3

Theo dõi số học sinh đến lớp muộn của 4 trường PTTH người ta thu được về số lượng

học sinh trung bình đến lớp muộn của các trường đó như sau:

Ngày trong

tuần

Trường PTTH

A B C D

Thứ hai

Thứ tư

Thứ sáu

Thứ bảy

5

4

4

4

4

5

3

4

5

3

4

3

7

2

5

2

Bạn có nhận xét gì về số lượng học sinh đến lớp muộn của trường. Chọn .

BÀI LÀM

Nhận xét: Đây là bài toán phân tích phương sai hai tố không lặp

Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị

quan sát Yij (i=1,2…r: yếu tố A; j=1,2…c: yếu tố B)

Giả thuyết:

“Các giá trị trung bình bằng nhau”

“Ít nhất có hai giá trị trung bình khác nhau”

Giá trị thống kê:

Biện luận:

Nếu => Chấp nhận H0 (yếu tố A)

Nếu => Chấp nhận H0 (yếu tố B).

Ta giả thuyết:

Page 13: BTL XSTK Thầy Thi

H01: yếu tố ngày không ảnh hưởng đến số lượng học sinh trung bình đến lớp

muộn của các trường đó.

H02: yếu tố trường khác không ảnh hưởng đến số lượng học sinh trung bình

đến lớp muộn của các trường đó.

THỰC HIỆN BÀI TOÁN BẰNG EXCEL

Nhập bảng số liệu như hình dưới:

Vào Data/Data analysis, chọn Anova: Two-Factor Without Replication, bấm

OK.

Trên màn hình sẽ hiện lên hộp thoại của Anova: Two-Factor Without

Replication như hình dưới:

Page 14: BTL XSTK Thầy Thi

Ta nhập các thông số như hình bên dưới:

+ Phạm vi của biến sô Y (Input Range): ta kéo từ ô A2 tới ô E6

+ Nhấp vào Labels, điền giá trị Alpha 0.1

+ Tọa độ đầu ra Output Range: nhấp vào A8.

+ Nhấn OK.

Ta được kết quả như sau:

Page 15: BTL XSTK Thầy Thi

Biện luận

Ta thấy: => Chấp nhận H01.

=> Chấp nhận H02.

Vậy cả 2 yếu tố ngày trong tuần và trường khác đều không ảnh hưởng đến số

lượng học sinh trung đi đến lớp muộn.

Page 16: BTL XSTK Thầy Thi

BÀI 4

Tính tỷ số tương quan của Y đối với X, hệ số tương quan và hệ số xác định của tập số

liệu sau đây. Với mức ý nghĩa , có kết luận gì về mối tương quan giữa X và Y

(Có phi tuyến không? Có tuyến tính không ? ). Tìm đường hồi quy của Y đối với X

X Y X Y X Y X Y

50

130

210

240

90

210

75

235

235

195

115

295

90

90

270

130

50

270

135

175

115

255

15

75

50

240

170

270

210

50

35

235

295

135

315

55

170

210

270

170

170

90

355

275

95

335

315

155

BÀI LÀM

Nhận xét: Đây là bài toán phân tích tương quan, phân tích hồi quy tuyến tính

THỰC HIỆN BÀI TOÁN BẰNG EXCEL

(i) Phân tích tương quan tuyến tính

Nhập bảng giá trị:

Page 17: BTL XSTK Thầy Thi

Vào Data/Data analysis, chọn Correlation:

Trên màn hình xuất hiện hộp thoại Correlation, ta nhập vào như hình sau:

+ Phạm vi đầu vào (Input Range), ta kéo từ ô A1 đến ô B25.

+ Ở Grouped By: chọn Comlumns.

+ Đánh dấu vào Label in First Row.

Page 18: BTL XSTK Thầy Thi

+ Tọa độ đầu ra (Output Range): ta chọn ô D4. Nhấn OK.

Ta được kết quả như sau:

Ta tìm được:

+ Hệ số tương quan:

Page 19: BTL XSTK Thầy Thi

+ Hệ số xác định :

Giả thuyết H0: X và Y không có quan hệ tương quan tuyến tính.

Ta có: √

Mà :

(c là phân vị mức

của phân bố Student với n-2=22 bậc tự do)

Vì | | nên chưa có cơ sở bác bỏ giả thuyết H0.

Vậy: Chưa kết luận được X và Y có tương quan tuyến tính.

(ii) Phân tích tương quan phi tuyến:

Phân tích lại bảng số liệu:

Vào Data/Data analysic, chọn Anova: Single Factor, Nhấn OK.

Trên màn hình xuất hiện Anova: Single Factor.

Page 20: BTL XSTK Thầy Thi

Trong hội thoại Anova: Single Factor, ta điền các giá trị như hình sau:

+ Phạm vi đầu vào (Input Range): ta kéo từ ô B1 đến ô H5.

+ Trong Grouped By: chọn Columns

+ Chọn Labels in first row

+ Nhập 0.05 vào Alpha.

+ Tọa độ đầu ra (Output Range): ta chọn ô A8.

Ta được kết quả như sau:

Page 21: BTL XSTK Thầy Thi

Rút ra được từ bảng Anova:

SSF = 237383,3

SST = 248383,3

Tính được:

=> Tỷ sô tương quan:

Suy ra:

+ Giả thiết H0: X và Y không tương quan phi tuyến

Ta có:

Page 22: BTL XSTK Thầy Thi

(c là phân vị mức của phân bố Fisher bậc tự do (k-2,n-k)=(5,21))

Vì: F>c nên không chấp nhận giả thuyết H0.

Vậy X và Y có tương quan phi tuyến.

(iii) Tìm đường hồi quy của X và Y

Giả thuyết H0: X và Y hồi quy tuyến tính

Ta nhập bản giá trị.

Vào Data/Data Analysic, chọn Regression.

Page 23: BTL XSTK Thầy Thi

Trong hội thoại Regression ta nhập vào các giá trị như hình sau:

+ Phạm vi đầu vào Y (Input Y Range): ta chọn từ ô B1 đến ô B25.

+ Phạm vi đầu vào X (Input X Range): ta chọn từ ô A1 đến ô A25.

+ Nhấp vào Labels.

+ Nhấp vào Line Fit Plots

+ Tọa đồ đầu ra (Output Range): chọn ô D1. Nhấ OK

Ta được kết quả như sau.

Page 24: BTL XSTK Thầy Thi

Kết luận: Đường hồi quy của Y đối với X là:

0

100

200

300

400

50

21

0

90

90

27

0

50

50

17

0

21

0

17

0

27

0

17

0

Y

X

X Line Fit Plot

Y

Predicted Y