tài liệu tham khảo – tin học đại cươngmis.hvnh.edu.vn/upload/170/20131203/kiem dinh...

24
Một số phương pháp kiểm định mối liên hệ giữa các biến Ở phần trên ta đã mô tả được mối quan hệ giữa các biến, ví dụ số người trình độ cao đẳng có thu nhập cá nhân một tháng dưới 2 triệu chiếm 45%, số người trình độ đại học có thu nhập cá nhân một tháng dưới 2 triệu chiếm 3%... Tuy nhiên đây mới chỉ mô tả cho chúng ta biết mối quan hệ thu được trên các mẫu chứ chưa khẳng định được mối quan hệ giữa các biến về mặt tổng thể. Trong quá trình nghiên cứu, từ mối quan hệ trên các mẫu ta có thể đưa ra một số nhận định hoặc giả thuyết về mối liên hệ tổng thể giữa các biến, ví dụ từ mối quan hệ giữa biến Trình độ học vấn và biến Thu nhập cá nhân ở trên ta có thể đưa ra nhận định Trình độ học vấn có ảnh hưởng đến Thu nhập cá nhân. Nhưng để biết được kết quả trên mẫu có đủ mạnh để thuyết phục rằng nhận định trên đúng với tổng thể không thì chúng ta phải thực hiện các phép toán kiểm định. 1.1. Kiểm định Chi-bình phương Kiểm định Chi-bình phương 2 sử dụng phổ biến trong việc kiểm định mối liên hệ giữa hai biến Định danh - Định danh hoặc Định danh - Thứ bậc. Phép kiểm định này cho chúng ta biết có tồn tại hay không mối liên hệ giữa hai biến trong tổng thể. 1.1.1. Lý thuyết Chi-bình phương Bước 1: Đặt giả thuyết H o : “Không có mối liên hệ giữa hai biến” hay “Hai biến độc lập với nhau”. Bước 2: Thực hiện kiểm định 2 1

Upload: dominh

Post on 19-Apr-2018

228 views

Category:

Documents


5 download

TRANSCRIPT

Page 1: Tài liệu tham khảo – Tin học đại cươngmis.hvnh.edu.vn/upload/170/20131203/Kiem dinh SPSS.docx · Web viewBài tập: Thử các mức tuổi trung bình 34 và 20. Kiểm

Một số phương pháp kiểm định mối liên hệ giữa các biến

Ở phần trên ta đã mô tả được mối quan hệ giữa các biến, ví dụ số người trình độ cao đẳng có thu nhập cá nhân một tháng dưới 2 triệu chiếm 45%, số người trình độ đại học có thu nhập cá nhân một tháng dưới 2 triệu chiếm 3%... Tuy nhiên đây mới chỉ mô tả cho chúng ta biết mối quan hệ thu được trên các mẫu chứ chưa khẳng định được mối quan hệ giữa các biến về mặt tổng thể. Trong quá trình nghiên cứu, từ mối quan hệ trên các mẫu ta có thể đưa ra một số nhận định hoặc giả thuyết về mối liên hệ tổng thể giữa các biến, ví dụ từ mối quan hệ giữa biến Trình độ học vấn và biến Thu nhập cá nhân ở trên ta có thể đưa ra nhận định Trình độ học vấn có ảnh hưởng đến Thu nhập cá nhân. Nhưng để biết được kết quả trên mẫu có đủ mạnh để thuyết phục rằng nhận định trên đúng với tổng thể không thì chúng ta phải thực hiện các phép toán kiểm định.

1.1. Kiểm định Chi-bình phươngKiểm định Chi-bình phương 2 sử dụng phổ biến trong việc kiểm định mối liên hệ giữa hai biến Định danh - Định danh hoặc Định danh - Thứ bậc. Phép kiểm định này cho chúng ta biết có tồn tại hay không mối liên hệ giữa hai biến trong tổng thể.

1.1.1. Lý thuyết Chi-bình phươngBước 1: Đặt giả thuyết Ho: “Không có mối liên hệ giữa hai biến” hay “Hai biến độc lập với nhau”.

Bước 2: Thực hiện kiểm định 2

Bước 3: So sánh giá trị p-value với giá trị

+ Chấp nhận Ho nếu p-value >

+ Bác bỏ Ho nếu p-value

Trong đó, P-value là xác suất phạm sai lầm khi loại bỏ giả thuyết Ho, xác suất này càng cao thì hậu quả của việc phạm sai lầm khi loại bỏ giả thuyết Ho càng nghiêm trọng và ngược lại. Trong SPSS p-value chính là giá trị Sig. trong bảng kết quả kiểm định. là khả năng tối đa cho phép phạm sai lầm trong kiểm định tức là khả năng ta bác bỏ Ho mặc dù thực tế Ho đúng. Nếu =5% thì khi kiểm định ta chấp nhận khả năng sai lầm tối đa là 5%, từ đó ta có độ tin cậy của phép kiểm định là (1-) = 95%.

1

Page 2: Tài liệu tham khảo – Tin học đại cươngmis.hvnh.edu.vn/upload/170/20131203/Kiem dinh SPSS.docx · Web viewBài tập: Thử các mức tuổi trung bình 34 và 20. Kiểm

1.1.2. Kiểm định Chi-bình phương trong SPSSĐể minh họa kiểm định Chi-bình phương trong phần mềm SPSS, ta xét ví dụ kiểm định mối liên hệ giữa biến trình độ học vấn hocvan và thu nhập cá nhân tncn. Các bước thực hiện như sau:

Bước 1: Đặt giả thuyết Ho: “Học vấn không có ảnh hưởng tới mức thu nhập cá nhân”.

Bước 2: Tạo bảng quan hệ chéo Crosstabs giữa 2 biến:

+ Vào Analyze/Descriptive Statistics/Crosstabs xuất hiện hộp hội thoại Crosstabs, đưa biến hocvan vào ô Rows, đưa biến tncn vào ô Columns:

Bước 3: Chọn kiểm định 2

+ Trong hộp thoại Crosstabs chọn Statistics, xuất hiện hộp thoại Crosstabs: Statistics, đánh dấu chọn đại lượng Chi-square.

2

Page 3: Tài liệu tham khảo – Tin học đại cươngmis.hvnh.edu.vn/upload/170/20131203/Kiem dinh SPSS.docx · Web viewBài tập: Thử các mức tuổi trung bình 34 và 20. Kiểm

+ Kích chọn nút Continue để quay lại hộp hội thoại Crosstabs.

Bước 4: Xác định đại lượng thống kê: Trong hộp thoại Crosstabs chọn Cells, xuất hiện hộp thoại Crosstabs: Cell Display

3

Page 4: Tài liệu tham khảo – Tin học đại cươngmis.hvnh.edu.vn/upload/170/20131203/Kiem dinh SPSS.docx · Web viewBài tập: Thử các mức tuổi trung bình 34 và 20. Kiểm

+ Trong hộp Counts chọn Observed để đếm tần số quan sát.

+ Trong hộp Percentages chọn Row để thể hiện % theo biến trình độ học vấn.

+ Kích chọn nút Continue để quay lại hộp hội thoại Crosstabs.

Bước 5: Thực hiện phép kiểm định

+ Trong hộp thoại Crosstabs chọn OK, kết quả thu được 3 bảng. Bảng đầu tiên thể hiện những thông tin tổng hợp, bảng thứ 2 là bảng chéo kết hợp giữa hai biến được kiểm định, bảng thứ 3 là bảng kết quả của phép kiểm định Chi-bình phương.

4

Page 5: Tài liệu tham khảo – Tin học đại cươngmis.hvnh.edu.vn/upload/170/20131203/Kiem dinh SPSS.docx · Web viewBài tập: Thử các mức tuổi trung bình 34 và 20. Kiểm

Ở bảng kết quả kiểm định Chi-Square Tests thực hiện ở trên ta có Sig. = 0 < = 0.05 nên ta có thể bác bỏ giả thuyết Ho, tức là học vấn có ảnh hưởng đến mức thu nhập cá nhân.

Giải thích các đại lượng trong bảng Chi-bình phương:

+ Kiểm định Chi-bình phương chỉ có ý nghĩa khi số quan sát đủ lớn, nếu có quá 20% số ô trong bảng chéo có tần suất lý thuyết nhỏ hơn 5 thì giá trị 2 nói chung không còn đáng tin cậy. Cuối bảng Chi-Square Tests luôn đưa ra một dòng thông báo cho bạn biết % số ô có tần suất mong đợi dưới 5 của bảng.

+ Continuity Correction là một dạng biến thể của Pearson Chi-Square để sử dụng cho những bảng dạng 2x2 tức là bảng kết hợp của 2 biến mà mỗi biến đều chỉ có 2 biểu hiện.

+ Likelihood Ratio là một số thống kê tượng tự Pearson Chi-Square, với những cỡ mẫu lớn kết quả của 2 số thống kê này rất gần nhau.

+ Linear-by-Linear Association đo lường mối liên hệ tuyến tính giữa 2 biến, số thống kê này chỉ hữu dụng khi biến hàng và cột được sắp xếp trật tự từ nhỏ nhất đến lớn nhất, còn nếu không hãy bỏ qua nó.

5

Page 6: Tài liệu tham khảo – Tin học đại cươngmis.hvnh.edu.vn/upload/170/20131203/Kiem dinh SPSS.docx · Web viewBài tập: Thử các mức tuổi trung bình 34 và 20. Kiểm

Phân tích liên hệ giữa biến nguyên nhân định tính và biến kết quả định lượng : Kiểm định trung bình tổng thể

1.2. Kiểm định One-Sample T-TestKiểm định One-Sample T-Test là phép kiểm định giả thuyết về trung bình của tổng thể, được dùng trong trường hợp ta muốn phân tích mối liên hệ giữa giá trị trung bình của một tổng thể định lượng với một giá trị cụ thể xác định.

1.2.1. Lý thuyết kiểm định One-Sample T-TestCác bước khi thực hiện kiểm định One-Sample T-Test bao gồm:

+ Bước 1: Đặt giả thuyết Ho: “Giá trị trung bình của biến tổng thể = giá trị cho trước”

+ Bước 2: Lọc ra các trường hợp thỏa mãn các điều kiện (nếu có) của nhóm đối tượng tham gia kiểm định.

+ Bước 3: Thực hiện kiểm định One-Sample T-Test

+ Bước 4: Tìm giá trị Sig tương ứng với giá trị T-Test t đã tính được.

+ Bước 5: So sánh giá trị Sig với giá trị xác suất

+ Nếu Sig> thì ta chấp nhận giả thuyết Ho

+ Nếu Sig thì ta bác bỏ giả thuyết Ho

1.2.2. Kiểm định One-Sample T-Test trong SPSSTa xét ví dụ: Hãy kiểm định giả thuyết “Trung bình số tuổi của các đối tượng tham gia phỏng vấn là 40”. Các bước thực hiện như sau:

Bước 1: Đặt giả thuyết Ho: “Trung bình số tuổi của các đối tượng tham gia phỏng vấn = 40”.

Bước 2: Vào Analyze/Compare Means/One Sample T-Test xuất hiện hộp thoại One-Sample T Test, đưa biến Tuoi vào khung Test Variable, khai báo Test Value = 40 là giá trị trung bình cần kiểm định.

6

Page 7: Tài liệu tham khảo – Tin học đại cươngmis.hvnh.edu.vn/upload/170/20131203/Kiem dinh SPSS.docx · Web viewBài tập: Thử các mức tuổi trung bình 34 và 20. Kiểm

Kích chọn nút Options để xác định độ tin cậy cho phép kiểm định, ở đây ta chọn độ tin cậy là 95% có nghĩa = 0.05.

+ Exclude cases analysis by analysis: Mỗi kiểm định T sử dụng toàn bộ các trường hợp chứa giá trị có ý nghĩa đối với biến được kiểm định.

+ Exclude cases listwise: Mỗi kiểm định T chỉ sử dụng các trường hợp có giá trị đầy đủ ở tất cả các biến được đưa vào kiểm định cùng một lúc, lúc này kích thước mẫu sẽ không đổi trong tất cả các trường hợp.

Kích chọn Continue để trở về hộp thoại One-Sample T Test.

7

Page 8: Tài liệu tham khảo – Tin học đại cươngmis.hvnh.edu.vn/upload/170/20131203/Kiem dinh SPSS.docx · Web viewBài tập: Thử các mức tuổi trung bình 34 và 20. Kiểm

Bước 4: Thực hiện phép kiểm định: Kích chọn OK, kết quả thu được các bảng sau:

Kết quả ta có giá trị của kiểm định t = -15.267 ứng với mức ý nghĩa quan sát Sig = 0 nhỏ hơn độ tin cậy =0.05 điều này có nghĩa ta sẽ bác bỏ giả thuyết Ho và căn cứ vào kết quả kiểm định ta có thể khẳng định: Trung bình số tuổi của các đối tượng tham gia phỏng vấn là dưới 40.

Bài tập: Thử các mức tuổi trung bình 34 và 20.

Kiểm định giả thuyết mức độ hài lòng trung bình về tính xác thực của thông tin là 3.

1.3. Kiểm định Independent-Samples T-TestKiểm định Independent-Samples T-Test là phép kiểm định giả thuyết về trung bình của tổng thể, được dùng trong trường hợp ta muốn kiểm định giả thuyết về sự bằng nhau của 2 trung bình tổng thể dựa trên 2 mẫu độc lập rút từ 2 tổng thể này.

Trong kiểm định Independent-Samples T-Test ta có 1 biến định lượng để tính trung bình và 1 biến định tính dùng để chia nhóm ra so sánh.

Ví dụ: Hãy kiểm định giả thuyết “Trung bình số nhân khẩu trong một gia đình của 2 nghề nghiệp Công chức và Tự kinh doanh là như nhau”

8

Page 9: Tài liệu tham khảo – Tin học đại cươngmis.hvnh.edu.vn/upload/170/20131203/Kiem dinh SPSS.docx · Web viewBài tập: Thử các mức tuổi trung bình 34 và 20. Kiểm

1.3.1. Lý thuyết kiểm định Independent-Samples T-TestCác bước khi thực hiện kiểm định Independent-SamplesT-Test bao gồm:

+ Bước 1: Đặt giả thuyết Ho: “Giá trị trung bình của 2 biến tổng thể là như nhau”.

+ Bước 2: Thực hiện kiểm định Independent-Samples T-Test

+ Bước 3: Tìm giá trị Sig tương ứng với kiểm định sự bằng nhau của 2 phương sai tổng thể Levene đã tính được:

+ Nếu Sig < thì phương sai giữa 2 nhóm đối tượng là khác nhau, ta sẽ sử dụng kết quả kiểm định t ở phần Equal variances not assumed.

+ Nếu Sig thì phương sai giữa 2 nhóm đối tượng là không khác nhau, ta sẽ sử dụng kết quả kiểm định t ở phần Equal variances assumed.

+ Bước 4: So sánh giá trị Sig của kiểm định t được xác định ở bước 3 với xác suất :

+ Nếu Sig thì ta chấp nhận giả thuyết Ho

+ Nếu Sig < thì ta bác bỏ giả thuyết Ho

1.3.2. Kiểm định Independent-Samples T-Test trong SPSSTa xét ví dụ: Hãy kiểm định giả thuyết “Trung bình số nhân khẩu (c10) trong một gia đình của những người đọc báo SGTT (sonk): Gần như đọc hàng tuần (2) và Không bỏ sót số báo nào (3) là như nhau”.

Các bước thực hiện như sau:

Bước 1: Đặt giả thuyết Ho “Trung bình số nhân khẩu trong một gia đình của 2 nhóm đọc báo SGTT Gần như đọc hàng tuần và Không bỏ sót số báo nào là như nhau”.

Bước 2: Vào Analyze/Compare Means/Independent Samples T-Test xuất hiện hộp thoại Independent-Samples T Test, đưa biến định lượng muốn kiểm định trị trung bình sonk vào khung Test Variable, đưa biến định tính muốn chia thành 2 nhóm Đọc báo SGTT – c10 vào khung Grouping Variable:

9

Page 10: Tài liệu tham khảo – Tin học đại cươngmis.hvnh.edu.vn/upload/170/20131203/Kiem dinh SPSS.docx · Web viewBài tập: Thử các mức tuổi trung bình 34 và 20. Kiểm

Bước 3: Kích chọn nút Define Groups để chỉ định 2 nhóm cần so sánh với nhau, ở đây ta cần so sánh nhóm Gần như đọc hàng tuần có giá trị 2 và nhóm Không bỏ sót số báo nào có giá trị 3 nên ta nhập 2 vào Group 1 và nhập 3 vào Group 2:

Nhấn Continue để trở về hộp thoại Independent-Samples T Test.

Bước 5: Kích chọn nút Options để xác định độ tin cậy cho phép kiểm định, ở đây ta chọn độ tin cậy là 95% có nghĩa = 0.05.

10

Page 11: Tài liệu tham khảo – Tin học đại cươngmis.hvnh.edu.vn/upload/170/20131203/Kiem dinh SPSS.docx · Web viewBài tập: Thử các mức tuổi trung bình 34 và 20. Kiểm

Kích chọn Continue để trở về hộp thoại Independent-Samples T Test.

Bước 6: Thực hiện phép kiểm định: Kích chọn OK, kết quả thu được các bảng sau:

Kết quả ta có trong kiểm định sự bằng nhau của 2 phương sai tổng thể Levene thì Sig = 0.473 > = 0.05 tức là ta chấp nhận giả thuyết H0 không có sự khác nhau về phương sai của 2 tổng thể do đó ta sẽ sử dụng kết quả kiểm định t ở phần Equal Variances assumed.

Ta có trong kiểm định t thì Sig = 0.115 > = 0.05 điều này có nghĩa ta sẽ chấp nhận giả thuyết Ho, tức là không có sự khác biệt có ý nghĩa về trị trung bình số nhân khẩu trong một gia đình giữa 2 nhóm đọc báo SGTT.

Bài tập: Có sự khác biệt hay không giữa hai khu vực nghiên cứu (Hà Nội – TPHCM) trong quan điểm về tính xác thực thông tin và tính thời sự cập nhật của báo SGTT

11

Page 12: Tài liệu tham khảo – Tin học đại cươngmis.hvnh.edu.vn/upload/170/20131203/Kiem dinh SPSS.docx · Web viewBài tập: Thử các mức tuổi trung bình 34 và 20. Kiểm

1.4. Kiểm định Paired-Samples T-TestNếu muốn so sánh hai trị trung bình của 2 nhóm tổng thể riêng biệt có đặc điểm là mỗi phần tử quan sát trong tổng thể này có sự tương đồng theo cặp với một phần tử ở tổng thể bên kia ta thực hiện phép kiểm định giả thuyết về sự bằng nhau của 2 trung bình tổng thể dựa trên dữ liệu mẫu rút ra từ 2 tổng thể theo cách phối hợp từng cặp: Paired-Sample T-Test. Dữ liệu của mẫu thu thập ở dạng thang đo định lượng khoảng cách hoặc tỉ lệ. Quá trình kiểm định sẽ bắt đầu với việc tính toán chênh lệch giá trị trên từng cặp quan sát bằng phép trừ sau đó kiểm nghiệm xem chênh lệch trung bình của tổng thể có = 0 không, nếu = 0 tức là không có khác biệt. Lợi thế của phép kiểm định mẫu phối hợp từng cặp là loại trừ được những yếu tố tác động bên ngoài vào nhóm thử.

Phương pháp kiểm định này rất thích hợp với dạng thử nghiệm trước và sau. Ví dụ một công ty tiến hành khảo sát trên một nhóm người về 2 loại sản phẩm đậu phộng chưa cải tiến và đã cải tiến.

Điều kiện để áp dụng Paired-Samples T-Test là kích cỡ 2 mẫu so sánh phải bằng nhau và chênh lệch giữa các giá trị của 2 mẫu phải có phân phối chuẩn hoặc cỡ mẫu phải đủ lớn để xem như xấp xỉ phân phối chuẩn.

1.4.1. Lý thuyết kiểm định Paired-Samples T-TestCác bước khi thực hiện kiểm định Paired-SamplesT-Test bao gồm:

+ Bước 1: Đặt giả thuyết Ho: “Không có sự khác nhau về trị hai trung bình tổng thể”, tức là khác biệt giữa 2 trung bình là bằng 0.

+ Bước 2: Thực hiện kiểm định Paired-Samples T-Test

+ Bước 3: So sánh giá trị Sig của kiểm định t được xác định ở bước 2 với xác suất :

+ Nếu Sig thì ta chấp nhận giả thuyết Ho

+ Nếu Sig < thì ta bác bỏ giả thuyết Ho

12

Page 13: Tài liệu tham khảo – Tin học đại cươngmis.hvnh.edu.vn/upload/170/20131203/Kiem dinh SPSS.docx · Web viewBài tập: Thử các mức tuổi trung bình 34 và 20. Kiểm

1.4.2. Kiểm định Paired-Samples T-Test trong SPSSTa xét ví dụ: Hãy kiểm định giả thuyết “Đánh giá của người dùng về Tính xác thực thông tin và Tính thời sự cập nhật của báo SGTT là như nhau”. Các bước thực hiện như sau:

Bước 1: Đặt giả thuyết Ho “Trung bình tổng thể của Tính xác thực thông tin và Tính thời sự cập nhật là như nhau”.

Bước 2: Vào Analyze/Compare Means/Paired Samples T-Test xuất hiện hộp thoại Paired-Samples T Test, đưa 2 biến muốn kiểm định trị trung bình vào khung Paired Variables

Bước 3: Kích chọn nút Options để xác định độ tin cậy cho phép kiểm định, ở đây ta chọn độ tin cậy là 95% có nghĩa = 0.05.

13

Page 14: Tài liệu tham khảo – Tin học đại cươngmis.hvnh.edu.vn/upload/170/20131203/Kiem dinh SPSS.docx · Web viewBài tập: Thử các mức tuổi trung bình 34 và 20. Kiểm

Kích chọn Continue để trở về hộp thoại Paired-Samples T Test.

Bước 4: Thực hiện phép kiểm định: Kích chọn OK, kết quả thu được các bảng sau:

Ta có Sig = 0.668> = 0.05 điều này có nghĩa ta sẽ chấp nhận giả thuyết Ho, tức là trung bình tổng thể của Tính xác thực thông tin và Tính thời sự cập nhật là như nhau.

Bài tập: Theo dõi nhịp tim của 12 bệnh nhân bị bệnh độc giáp trạng trước và sau điều trị kết quả như sau. Hỏi tác dụng làm chậm nhịp tim của thuốc có đáng tin cậy hay không

Trước điều trị

115 120 110 100 95 110 120 115 100 120 110 90

Sau điều trị

100 100 90 100 90 100 100 90 90 100 100 100

14

Page 15: Tài liệu tham khảo – Tin học đại cươngmis.hvnh.edu.vn/upload/170/20131203/Kiem dinh SPSS.docx · Web viewBài tập: Thử các mức tuổi trung bình 34 và 20. Kiểm

TƯƠNG QUAN VÀ HỒI QUY TUYẾN TÍNH

Tương quan và hồi quy tuyến tính dùng để xem xét mối liên hệ giữa hai hay nhiều biến định lượng.

1.1. Tương quan tuyến tínhGiả sử cần đo lường mối quan hệ giữa 2 biến định lượng Doanh số bán hàng (y) với Chi phí chào hàng (x). Đồ thị phân tán là công cụ hữu ích cho ta thấy nhiều mối liên hệ giữa hai biến khảo sát như Liên hệ tuyến tính thuận, liên hệ tuyến tính nghịch, liên hệ phi tuyến, không có liên hệ...

1.1.1. Hệ số tương quan đơn r (Pearson Correlation Coefficient)Ta sử dụng hệ số tương quan Pearson (ký hiệu r) để lượng hóa mức độ chặt chẽ của mối liên hệ tuyến tính giữa hai biến định lượng, r có giá trị nằm trong đoạn [-1,1], giá trị tuyệt đối của r cho biết mức độ chặt chẽ của mối liên hệ tuyến tính.

+ Nếu r >0 thì mối liên hệ là tuyến tính thuận

+ Nếu r <0 thì mối liên hệ là tuyến tính nghịch

+ Nếu r=0 thì 2 biến không có mối liên hệ tuyến tính, ta có 2 trường hợp là không có mối liên hệ giữa 2 biến hoặc hai biến có mối liên hệ nhưng không phải tuyến tính tức là phi tuyến.

Cách tính r trong SPSS:

Vào Analyze/Correlate/Bivariate xuất hiện hộp hội thoại tương quan hai biến Bivariate Correlate:

+ Đưa các biến cần phân tích vào khung Variables, nếu tất cả các trường hợp quan sát đều có giá trị bị thiếu đối với một hay cả hai biến được chọn hoặc tất cả các trường hợp đều có cùng một giá trị trên một biến (không có biến thiên) thì hệ số tương quan không thể tính được và được SPSS thể hiện bằng một dấu chấm (.)

+ Ở phần Hệ số tương quan - Correlation Coefficients: hệ số Pearson được lựa chọn mặc định, bẳng kết quả sẽ thể hiện một ma trận vuông đối xứng gồm các hệ số tương quan giữa các biến, tương quan của một biến với chính nó = 1 và là đường chéo của ma trận.

15

Page 16: Tài liệu tham khảo – Tin học đại cươngmis.hvnh.edu.vn/upload/170/20131203/Kiem dinh SPSS.docx · Web viewBài tập: Thử các mức tuổi trung bình 34 và 20. Kiểm

+ Trong phần lựa chọn kiểm định mức ý nghĩa – Test of Significance gồm 2 loại: Two-tailed (kiểm định 2 phía) được sử dụng trong trường hợp chiều hướng của mối liên hệ tuyến tính không thể xác định trước. Ngược lại là loại One-tailed (kiểm định 1 phía).

+ Việc xử lý giá trị khuyết thiếu có 2 lựa chọn: Exclude cases pairwise – các trường hợp quan sát bị thiếu giá trị ở một hoặc hai biến của cặp biến đang được xét sẽ bị loại khỏi quá trình tính toán, nhưng nếu ở với một cặp biến khác mà quan sát đó không thiếu giá trị thì chúng vẫn được sử dụng (như vậy các hệ số tương quan có thể được tính trên số lượng các quan sát khác nhau) đây là lựa chọn mặc định

. Exclude cases listwise – các trường hợp quan sát bị thiếu giá trị ở bất kỳ biến nào cũng sẽ bị loại ra khỏi toàn bộ các phân tích tính toán (như vậy các hệ số tương quan đều tính toán từ cùng một số lượng các quan sát).

Ở bảng kết quả nếu hệ số r có một dấu * thì có nghĩa ta có thể kiểm định các giả thuyết ở mức ý nghĩa nhỏ hơn 0.05, còn nếu có hai dấu ** thì mức ý nghĩa nhỏ hơn 0.01.

16

Page 17: Tài liệu tham khảo – Tin học đại cươngmis.hvnh.edu.vn/upload/170/20131203/Kiem dinh SPSS.docx · Web viewBài tập: Thử các mức tuổi trung bình 34 và 20. Kiểm

1.2. Hồi quy tuyến tínhNếu kết luận được là 2 biến có liên hệ tương quan tuyến tính chặt chẽ với nhau qua hệ số tương quan r thì ta có thể mô hình hóa mối quan hệ nhân quả của chúng bằng mô hình hồi quy tuyến tính trong đó một biến được gọi là biến phụ thuộc y còn biến kia là biến độc lập x.

Trong phân tích tương quan các biến có tính chất đối xứng tức là không có sự phân biệt giữa 2 biến, còn trong phân tích hồi quy ta ngầm giả định là X gây ra Y, ta ước lượng Y trên cơ sở đã biết X, tức là biến độc lập X ta đã biết giá trị còn biến phụ thuộc Y là một biến ngẫu nhiên.

1.2.1. Hồi quy đơn tuyến tínhGiả sử xét mối liên hệ tuyến tính giữa một biến phụ thuộc và một biến độc lập ta xây dựng mô hình hồi quy tuyến tính là phương trình có dạng:

Yi = B0 + B1 * Xi

Trong đó: Xi là trị quan sát thứ i của biến độc lập

Yi là giá trị dự đoán thứ i của biến phụ thuộc

B0, B1 là các hệ số hồi quy, phương pháp để xác định hệ số hồi quy là phương pháp bình phương nhỏ nhất OLS (Ordinary least square).

Ví dụ xây dựng mô hình hồi quy tuyến tính giữa doanh số bán hàng và chi phí chào hàng (ở phần tương quan ta có hệ số r =0.905 tức là giữa 2 biến đã có mối quan hệ tương quan tuyến tính rất mạnh).

Xét doanh số bán hàng là biến phụ thuộc, chi phí chào hàng là biến độc lập ta có phương trình hồi quy như sau:

Doanh số dự đoán = B0 + B1 * Chi phí chào hàng

Ở phương trình này độ dốc B1 là lượng tăng giảm (triệu đồng) của doanh số dự đoán do lượng tăng giảm của chi phí chào hàng. Hằng số B0 (tung độ của vị trí tại đó đường thẳng cắt trục tung) là giá trị doanh số dự đoán khi chi phí chào hàng =0.

17

Page 18: Tài liệu tham khảo – Tin học đại cươngmis.hvnh.edu.vn/upload/170/20131203/Kiem dinh SPSS.docx · Web viewBài tập: Thử các mức tuổi trung bình 34 và 20. Kiểm

1.2.2. Xây dựng mô hình hồi quy đơn tuyến tính bằng SPSSVào Analyze/Regression/Linear xuất hiện hộp hội thoại Linear Regression

+ Đưa biến phụ thuộc doanh số vào ô Dependent

+ Đưa biến độc lập chào hàng vào ô Independent

+ Bấm OK ta có kết quả như sau

18