phÂn tÍch -...

27
INSTITUTE OF SOCIAL AND MEDICAL STUDIES PHÂN TÍCH ĐƠN BIẾN VÀ ĐA BIẾN Nguyễn Trương Nam Nguyễn Hồng Phương

Upload: others

Post on 17-Oct-2019

9 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: PHÂN TÍCH - thongke.info.vnthongke.info.vn/Download.aspx/ABC27AF23EF848D880B56709FDBDA251/1/IS… · Kiểm định tham số Kiểm định phi tham số Forecast Biến chia nhóm

INSTITUTE OF SOCIAL AND MEDICAL STUDIES

PHÂN TÍCH

ĐƠN BIẾN VÀ ĐA BIẾN

Nguyễn Trương Nam

Nguyễn Hồng Phương

Page 2: PHÂN TÍCH - thongke.info.vnthongke.info.vn/Download.aspx/ABC27AF23EF848D880B56709FDBDA251/1/IS… · Kiểm định tham số Kiểm định phi tham số Forecast Biến chia nhóm

Mục tiêu

Hiểu được các cách tiếp cận khác nhau của

phân tích đơn biến và đa biến

Tự tin khi sử dụng SPSS để phân tích số

liệu

Page 3: PHÂN TÍCH - thongke.info.vnthongke.info.vn/Download.aspx/ABC27AF23EF848D880B56709FDBDA251/1/IS… · Kiểm định tham số Kiểm định phi tham số Forecast Biến chia nhóm

Một số lệnh cơ bản của SPSS

Select case (Lựa chọn các trường hợp)

Recode into the same variable (Mã hóa lại biến mới

thay thế biến cũ)

Recode into different variable (Mã hóa lại biến mới

giữ nguyên biến cũ)

Compute variables (Tạo các biến mới)

Page 4: PHÂN TÍCH - thongke.info.vnthongke.info.vn/Download.aspx/ABC27AF23EF848D880B56709FDBDA251/1/IS… · Kiểm định tham số Kiểm định phi tham số Forecast Biến chia nhóm

Ví dụ.

Sử dụng một số biến có trong bộ số liệu.

- Tuổi (q2).

- Dân tộc (Q4).

- Trình độ học vấn (Q5).

- Tình trạng hôn nhân(Q7).

- Số lần sinh con còn sống (Q37)

- Số lần nạo phá thai (Q40).

Page 5: PHÂN TÍCH - thongke.info.vnthongke.info.vn/Download.aspx/ABC27AF23EF848D880B56709FDBDA251/1/IS… · Kiểm định tham số Kiểm định phi tham số Forecast Biến chia nhóm

Thực hành.

Chọn những người dân tộc kinh (Select cases)

Data/select cases/if/Q3=1.

Recode lại biến số lần nạo phá thai thành biến nhị phân 1 “Nạo phá thai lặp lại>=2 lần” 0 “Không nạo phá thai lặp

lại<=1 lần” (Recode)

Recode q40 (2 thr HIGHEST=1) (0=0) (1=0) (missing=sysmis) into

Q40_re_abor.

VARIABLE LABELS Q40_re_abor "Q40-repeated abortion in the life time".

value labels q40_re_abor 1 "repeated_abortion_life“ 0 “No repeated abortion in lifetime”.

execute.

Page 6: PHÂN TÍCH - thongke.info.vnthongke.info.vn/Download.aspx/ABC27AF23EF848D880B56709FDBDA251/1/IS… · Kiểm định tham số Kiểm định phi tham số Forecast Biến chia nhóm

Tạo một biến mới số con sinh ra còn sống từ các biến đẻ lần 1…đẻ lần 10. (Compute)

recode q371b (1=1) (else=0) into q371b_re.

recode q372b (1=1) (else=0) into q372b_re.

recode q373b (1=1) (else=0) into q373b_re.

recode q374b (1=1) (else=0) into q374b_re.

recode q375b (1=1) (else=0) into q375b_re.

recode q376b (1=1) (else=0) into q376b_re.

recode q377b (1=1) (else=0) into q377b_re.

recode q378b (1=1) (else=0) into q378b_re.

recode q378b (1=1) (else=0) into q379b_re.

recode q3710b (1=1) (else=0) into q3710b_re.

Compute nu_chi_alive=q371b_re+q372b_re+q373b_re+q374b_re+q375b_re+q376b_re+q377b_re+q378b_re+q379b_re+q3710b_re.

VARIABLE LABELS nu_chi_alive "Number of child alive".

Page 7: PHÂN TÍCH - thongke.info.vnthongke.info.vn/Download.aspx/ABC27AF23EF848D880B56709FDBDA251/1/IS… · Kiểm định tham số Kiểm định phi tham số Forecast Biến chia nhóm

Lựa chọn các thuật toán thống kê

Xác định các biến cần dùng

Phân tích đơn biến Phân tích hai biến Phân tích đa biến

Frequencies

Means

Descriptive

Explore

Cross tabs/ chi square

Tương quan 2 biến

So sánh các trung bình -Independent

-Pair t-test - One sample t-test

Page 8: PHÂN TÍCH - thongke.info.vnthongke.info.vn/Download.aspx/ABC27AF23EF848D880B56709FDBDA251/1/IS… · Kiểm định tham số Kiểm định phi tham số Forecast Biến chia nhóm

Tính tỷ lệ

Phân bố tần suất (Frequencies)

Phân bổ phần trăm (Percentages)

Các biểu đồ phân bố tần suất

◦ Biểu đồ cột (Bar charts)

◦ Biểu đồ tròn (Pie charts)

◦ Histograms

Page 9: PHÂN TÍCH - thongke.info.vnthongke.info.vn/Download.aspx/ABC27AF23EF848D880B56709FDBDA251/1/IS… · Kiểm định tham số Kiểm định phi tham số Forecast Biến chia nhóm

Mô tả các biến liên tục

Central tendency

◦Mean

◦Median

◦Mode

Dispersion measures

◦Range

◦ Interquartile range

◦Variance

◦Standard deviation

Distribution

◦Skewness

◦ Kurtosis

◦Both =0 for normal distribution

Page 10: PHÂN TÍCH - thongke.info.vnthongke.info.vn/Download.aspx/ABC27AF23EF848D880B56709FDBDA251/1/IS… · Kiểm định tham số Kiểm định phi tham số Forecast Biến chia nhóm

Sử dụng Explore để kiểm tra phân

bố chuẩn

Analyze

◦ Descriptive statistics

explore

Outlier

Percentile

Normal plot with tests

Stem and leaf

Page 11: PHÂN TÍCH - thongke.info.vnthongke.info.vn/Download.aspx/ABC27AF23EF848D880B56709FDBDA251/1/IS… · Kiểm định tham số Kiểm định phi tham số Forecast Biến chia nhóm

11

Làm thế nào để biết một biến liên tục có phân

bố chuẩn?

Sử dụng biểu đồ Histogram với đường cong phân bố chuẩn (Histogram with normal curve )

Skewness (-: đường cong nghiêng về bên trái, +: đường cong nghiêng về bên phải) và Kurtosis (-: flat, 0: bình thường, +: too pointy)

Q-Q plot (các số liệu phải nằm trên đường thẳng)

Kiểm định Kolmogorov-Smirnov

Page 12: PHÂN TÍCH - thongke.info.vnthongke.info.vn/Download.aspx/ABC27AF23EF848D880B56709FDBDA251/1/IS… · Kiểm định tham số Kiểm định phi tham số Forecast Biến chia nhóm

Thực hành: Kiểm tra phân bố chuẩn-Biến tuổi

Page 13: PHÂN TÍCH - thongke.info.vnthongke.info.vn/Download.aspx/ABC27AF23EF848D880B56709FDBDA251/1/IS… · Kiểm định tham số Kiểm định phi tham số Forecast Biến chia nhóm

Xử lý như thế nào nếu biến liên tục

không có phân bố chuẩn?

◦ Natural log

◦ Square root

◦ Square

◦ 1/square root

◦ Cube

◦ Sử dụng lệnh tạo biến mới (transform- compute

new variables)

Page 14: PHÂN TÍCH - thongke.info.vnthongke.info.vn/Download.aspx/ABC27AF23EF848D880B56709FDBDA251/1/IS… · Kiểm định tham số Kiểm định phi tham số Forecast Biến chia nhóm

Bảng mối liên hệ đa biến

Biến số Mô tả biến số Kiểm định tham

số Kiểm định phi tham số Forecast

Biến chia

nhóm và

biến chia

nhóm

Bar plot

Two-dimensional

contingency table

---

Chi square for a two-

dimensional contingency

table

---

Biến 2

nhóm và

biến liên

tục

Boxplot

So sánh trung bình

Kiểm định t cho 2

giá trị trung bình

quần thể

Mann-Whitney

Hồi quy tuyến

tính

Hồi quy logistic

(Biến phụ thuộc

là biến nhị thức)

Biến 3

nhóm trở

lên và biến

liên tục

Boxplot

So sánh trung bình

Kiểm định phân

tích phương sai

(ANOVA)

Kruskal-Wallis Hồi quy tuyến

tính

Biến liên

tục và biến

liên tục

Scatterplot

Pearson

Kiểm định t ghép

cặp

Spearman

Wilcoxon signed rank

test

Hồi quy tuyến

tính

Page 15: PHÂN TÍCH - thongke.info.vnthongke.info.vn/Download.aspx/ABC27AF23EF848D880B56709FDBDA251/1/IS… · Kiểm định tham số Kiểm định phi tham số Forecast Biến chia nhóm

Mô tả mối tương quan

Xu hướng Strength

Tự nhiên

Tương quan thuận

– Tương quan nghịch

Mạnh- Yếu

Tương quan tuyến tính

– Không tuyến tính

Page 16: PHÂN TÍCH - thongke.info.vnthongke.info.vn/Download.aspx/ABC27AF23EF848D880B56709FDBDA251/1/IS… · Kiểm định tham số Kiểm định phi tham số Forecast Biến chia nhóm

Crosstabs- Chi square test From the menus choose:

Analyze

Descriptive Statistics

Crosstabs...

Biến định danh và định danh

Page 17: PHÂN TÍCH - thongke.info.vnthongke.info.vn/Download.aspx/ABC27AF23EF848D880B56709FDBDA251/1/IS… · Kiểm định tham số Kiểm định phi tham số Forecast Biến chia nhóm

Thực hành- Tìm hiểu mối liên quan giữa việc nạo

phá thai và nghề nghiệp của bà mẹ.

Page 18: PHÂN TÍCH - thongke.info.vnthongke.info.vn/Download.aspx/ABC27AF23EF848D880B56709FDBDA251/1/IS… · Kiểm định tham số Kiểm định phi tham số Forecast Biến chia nhóm

Kiểm định t không ghép cặp

Biến nhị thức và biến liên tục -2 nhóm độc lập

From the menus choose:

Analyze

Compare Means

Independent-Samples T Test...

Page 19: PHÂN TÍCH - thongke.info.vnthongke.info.vn/Download.aspx/ABC27AF23EF848D880B56709FDBDA251/1/IS… · Kiểm định tham số Kiểm định phi tham số Forecast Biến chia nhóm

Kiểm định t ghép cặp Biến nhị thức và biến liên tục- kiểm định trước và sau

(cùng 1 nhóm) From the menus choose:

Analyze

Compare Means

Paired-Samples T Test...

Page 20: PHÂN TÍCH - thongke.info.vnthongke.info.vn/Download.aspx/ABC27AF23EF848D880B56709FDBDA251/1/IS… · Kiểm định tham số Kiểm định phi tham số Forecast Biến chia nhóm

Kiểm một giá trị trung bình

From the menus choose:

Analyze

Compare Means

One-Sample T Test...

So sánh giá trị trung bình với một giá trị đã

biết

Page 21: PHÂN TÍCH - thongke.info.vnthongke.info.vn/Download.aspx/ABC27AF23EF848D880B56709FDBDA251/1/IS… · Kiểm định tham số Kiểm định phi tham số Forecast Biến chia nhóm

Kiểm định ANOVA Biến định danh và liên tục -3 hoặc nhiều

nhóm From the menus choose:

Analyze

Compare Means

One-Way ANOVA...

Page 22: PHÂN TÍCH - thongke.info.vnthongke.info.vn/Download.aspx/ABC27AF23EF848D880B56709FDBDA251/1/IS… · Kiểm định tham số Kiểm định phi tham số Forecast Biến chia nhóm

Mô tả mối liên quan

Biểu đồ phân tán (Scattergram or scatterplot)

Được sử dụng để biểu diễn mối liên quan giữa 2 biến định danh

weight

Age

Variable A

Variable B

Page 23: PHÂN TÍCH - thongke.info.vnthongke.info.vn/Download.aspx/ABC27AF23EF848D880B56709FDBDA251/1/IS… · Kiểm định tham số Kiểm định phi tham số Forecast Biến chia nhóm

Mối tương quan Biến liên tục và biến liên tục (2 biến liên tục)

From the menus choose:

Analyze

Correlate

Bivariate…

Page 24: PHÂN TÍCH - thongke.info.vnthongke.info.vn/Download.aspx/ABC27AF23EF848D880B56709FDBDA251/1/IS… · Kiểm định tham số Kiểm định phi tham số Forecast Biến chia nhóm

Biểu đồ phân tán mô tả: ◦ Độ mạnh của sự kết hợp

Mạnh (Strong)

Trung bình (Moderate)

Yếu (Weak)

◦ Mối quan hệ tuyến tính

Tuyến tính (Linear)

Không tuyến tính (Curvilinear)

◦ Xu hướng

Thuận (Positive)

Nghịch (Negative)

Page 25: PHÂN TÍCH - thongke.info.vnthongke.info.vn/Download.aspx/ABC27AF23EF848D880B56709FDBDA251/1/IS… · Kiểm định tham số Kiểm định phi tham số Forecast Biến chia nhóm

Mối tương quan

Hệ số tương quan-số dùng để mô tả độ

mạnh yếu và xu hướng liên quan giữa các

biến Rất mạnh = .80 đến 1

Trung bình khá = .60 đến .79

Trung bình = .50 đến .59

Trung bình yếu = .30 đến .49

Rất yếu đến không có mối liên quan từ 0 đến .29

-1.00

Mối liên hệ ngược

chiều (âm tính)

0.00

Không có

mối liên quan

1.00

Mối liên hệ thuận chiều

(dương tính)

Page 26: PHÂN TÍCH - thongke.info.vnthongke.info.vn/Download.aspx/ABC27AF23EF848D880B56709FDBDA251/1/IS… · Kiểm định tham số Kiểm định phi tham số Forecast Biến chia nhóm

26

Tổng kết

Biến số Mô tả Kiểm định tham

số

Kiểm định phi tham

số Forecast

Biến chia

nhóm và

biến chia

nhóm

Bar plot

Two-dimensional

contingency table

---

Chi square for a two-

dimensional

contingency table

---

Biến 2

nhóm và

biến liên

tục

Boxplot

So sánh trung bình

Kiểm định t cho

hai giá trị trung

bình quần thể

Mann-Whitney

Hồi quy tuyến

tính

Hồi quy logistic (Biến phụ thuộc là biến

phân loại)

Biến 3

nhóm trở

lên và biến

liên tục

Boxplot

So sánh trung bình

Kiểm định phân

tích phương sai

(ANOVA)

Kruskal-Wallis Hồi quy tuyến

tính

Biến liên

tục và biến

liên tục

Scatterplot

Pearson

Kiểm định t ghép

cặp

Spearman

Wilcoxon signed rank

test

Hồi quy tuyến

tính

Page 27: PHÂN TÍCH - thongke.info.vnthongke.info.vn/Download.aspx/ABC27AF23EF848D880B56709FDBDA251/1/IS… · Kiểm định tham số Kiểm định phi tham số Forecast Biến chia nhóm

27

Các kiểm định phi tham số

Mann-Whitney test ◦ Independent Samples Settings: Mann-Whitney U ◦ H0: position/order of distribution for population A = position/order of distribution

for population B

◦ H0: Phân bố quần thể A=quần thể B.

Kruskal-Wallis test ◦ Independent Samples Settings: Kruskal-Wallis 1-way

ANOVA ◦ H0: position/order of distribution of populations is the same

◦ H0: Phân bố các quần thể là như nhau.

Wilcoxon matched pair signed rank test ◦ Related Samples Settings: Wilcoxon matched-pair signed-

rank ◦ H0: position/order of distribution of variable 1 = position/order of

distribution of variable 2

◦ H0: Phân bố biến số 1 = biến số 2