phÂn tÍch -...
TRANSCRIPT
INSTITUTE OF SOCIAL AND MEDICAL STUDIES
PHÂN TÍCH
ĐƠN BIẾN VÀ ĐA BIẾN
Nguyễn Trương Nam
Nguyễn Hồng Phương
Mục tiêu
Hiểu được các cách tiếp cận khác nhau của
phân tích đơn biến và đa biến
Tự tin khi sử dụng SPSS để phân tích số
liệu
Một số lệnh cơ bản của SPSS
Select case (Lựa chọn các trường hợp)
Recode into the same variable (Mã hóa lại biến mới
thay thế biến cũ)
Recode into different variable (Mã hóa lại biến mới
giữ nguyên biến cũ)
Compute variables (Tạo các biến mới)
Ví dụ.
Sử dụng một số biến có trong bộ số liệu.
- Tuổi (q2).
- Dân tộc (Q4).
- Trình độ học vấn (Q5).
- Tình trạng hôn nhân(Q7).
- Số lần sinh con còn sống (Q37)
- Số lần nạo phá thai (Q40).
Thực hành.
Chọn những người dân tộc kinh (Select cases)
Data/select cases/if/Q3=1.
Recode lại biến số lần nạo phá thai thành biến nhị phân 1 “Nạo phá thai lặp lại>=2 lần” 0 “Không nạo phá thai lặp
lại<=1 lần” (Recode)
Recode q40 (2 thr HIGHEST=1) (0=0) (1=0) (missing=sysmis) into
Q40_re_abor.
VARIABLE LABELS Q40_re_abor "Q40-repeated abortion in the life time".
value labels q40_re_abor 1 "repeated_abortion_life“ 0 “No repeated abortion in lifetime”.
execute.
Tạo một biến mới số con sinh ra còn sống từ các biến đẻ lần 1…đẻ lần 10. (Compute)
recode q371b (1=1) (else=0) into q371b_re.
recode q372b (1=1) (else=0) into q372b_re.
recode q373b (1=1) (else=0) into q373b_re.
recode q374b (1=1) (else=0) into q374b_re.
recode q375b (1=1) (else=0) into q375b_re.
recode q376b (1=1) (else=0) into q376b_re.
recode q377b (1=1) (else=0) into q377b_re.
recode q378b (1=1) (else=0) into q378b_re.
recode q378b (1=1) (else=0) into q379b_re.
recode q3710b (1=1) (else=0) into q3710b_re.
Compute nu_chi_alive=q371b_re+q372b_re+q373b_re+q374b_re+q375b_re+q376b_re+q377b_re+q378b_re+q379b_re+q3710b_re.
VARIABLE LABELS nu_chi_alive "Number of child alive".
Lựa chọn các thuật toán thống kê
Xác định các biến cần dùng
Phân tích đơn biến Phân tích hai biến Phân tích đa biến
Frequencies
Means
Descriptive
Explore
Cross tabs/ chi square
Tương quan 2 biến
So sánh các trung bình -Independent
-Pair t-test - One sample t-test
Tính tỷ lệ
Phân bố tần suất (Frequencies)
Phân bổ phần trăm (Percentages)
Các biểu đồ phân bố tần suất
◦ Biểu đồ cột (Bar charts)
◦ Biểu đồ tròn (Pie charts)
◦ Histograms
Mô tả các biến liên tục
Central tendency
◦Mean
◦Median
◦Mode
Dispersion measures
◦Range
◦ Interquartile range
◦Variance
◦Standard deviation
Distribution
◦Skewness
◦ Kurtosis
◦Both =0 for normal distribution
Sử dụng Explore để kiểm tra phân
bố chuẩn
Analyze
◦ Descriptive statistics
explore
Outlier
Percentile
Normal plot with tests
Stem and leaf
11
Làm thế nào để biết một biến liên tục có phân
bố chuẩn?
Sử dụng biểu đồ Histogram với đường cong phân bố chuẩn (Histogram with normal curve )
Skewness (-: đường cong nghiêng về bên trái, +: đường cong nghiêng về bên phải) và Kurtosis (-: flat, 0: bình thường, +: too pointy)
Q-Q plot (các số liệu phải nằm trên đường thẳng)
Kiểm định Kolmogorov-Smirnov
Thực hành: Kiểm tra phân bố chuẩn-Biến tuổi
Xử lý như thế nào nếu biến liên tục
không có phân bố chuẩn?
◦ Natural log
◦ Square root
◦ Square
◦ 1/square root
◦ Cube
◦ Sử dụng lệnh tạo biến mới (transform- compute
new variables)
Bảng mối liên hệ đa biến
Biến số Mô tả biến số Kiểm định tham
số Kiểm định phi tham số Forecast
Biến chia
nhóm và
biến chia
nhóm
Bar plot
Two-dimensional
contingency table
---
Chi square for a two-
dimensional contingency
table
---
Biến 2
nhóm và
biến liên
tục
Boxplot
So sánh trung bình
Kiểm định t cho 2
giá trị trung bình
quần thể
Mann-Whitney
Hồi quy tuyến
tính
Hồi quy logistic
(Biến phụ thuộc
là biến nhị thức)
Biến 3
nhóm trở
lên và biến
liên tục
Boxplot
So sánh trung bình
Kiểm định phân
tích phương sai
(ANOVA)
Kruskal-Wallis Hồi quy tuyến
tính
Biến liên
tục và biến
liên tục
Scatterplot
Pearson
Kiểm định t ghép
cặp
Spearman
Wilcoxon signed rank
test
Hồi quy tuyến
tính
Mô tả mối tương quan
Xu hướng Strength
Tự nhiên
Tương quan thuận
– Tương quan nghịch
Mạnh- Yếu
Tương quan tuyến tính
– Không tuyến tính
Crosstabs- Chi square test From the menus choose:
Analyze
Descriptive Statistics
Crosstabs...
Biến định danh và định danh
Thực hành- Tìm hiểu mối liên quan giữa việc nạo
phá thai và nghề nghiệp của bà mẹ.
Kiểm định t không ghép cặp
Biến nhị thức và biến liên tục -2 nhóm độc lập
From the menus choose:
Analyze
Compare Means
Independent-Samples T Test...
Kiểm định t ghép cặp Biến nhị thức và biến liên tục- kiểm định trước và sau
(cùng 1 nhóm) From the menus choose:
Analyze
Compare Means
Paired-Samples T Test...
Kiểm một giá trị trung bình
From the menus choose:
Analyze
Compare Means
One-Sample T Test...
So sánh giá trị trung bình với một giá trị đã
biết
Kiểm định ANOVA Biến định danh và liên tục -3 hoặc nhiều
nhóm From the menus choose:
Analyze
Compare Means
One-Way ANOVA...
Mô tả mối liên quan
Biểu đồ phân tán (Scattergram or scatterplot)
Được sử dụng để biểu diễn mối liên quan giữa 2 biến định danh
weight
Age
Variable A
Variable B
Mối tương quan Biến liên tục và biến liên tục (2 biến liên tục)
From the menus choose:
Analyze
Correlate
Bivariate…
Biểu đồ phân tán mô tả: ◦ Độ mạnh của sự kết hợp
Mạnh (Strong)
Trung bình (Moderate)
Yếu (Weak)
◦ Mối quan hệ tuyến tính
Tuyến tính (Linear)
Không tuyến tính (Curvilinear)
◦ Xu hướng
Thuận (Positive)
Nghịch (Negative)
Mối tương quan
Hệ số tương quan-số dùng để mô tả độ
mạnh yếu và xu hướng liên quan giữa các
biến Rất mạnh = .80 đến 1
Trung bình khá = .60 đến .79
Trung bình = .50 đến .59
Trung bình yếu = .30 đến .49
Rất yếu đến không có mối liên quan từ 0 đến .29
-1.00
Mối liên hệ ngược
chiều (âm tính)
0.00
Không có
mối liên quan
1.00
Mối liên hệ thuận chiều
(dương tính)
26
Tổng kết
Biến số Mô tả Kiểm định tham
số
Kiểm định phi tham
số Forecast
Biến chia
nhóm và
biến chia
nhóm
Bar plot
Two-dimensional
contingency table
---
Chi square for a two-
dimensional
contingency table
---
Biến 2
nhóm và
biến liên
tục
Boxplot
So sánh trung bình
Kiểm định t cho
hai giá trị trung
bình quần thể
Mann-Whitney
Hồi quy tuyến
tính
Hồi quy logistic (Biến phụ thuộc là biến
phân loại)
Biến 3
nhóm trở
lên và biến
liên tục
Boxplot
So sánh trung bình
Kiểm định phân
tích phương sai
(ANOVA)
Kruskal-Wallis Hồi quy tuyến
tính
Biến liên
tục và biến
liên tục
Scatterplot
Pearson
Kiểm định t ghép
cặp
Spearman
Wilcoxon signed rank
test
Hồi quy tuyến
tính
27
Các kiểm định phi tham số
Mann-Whitney test ◦ Independent Samples Settings: Mann-Whitney U ◦ H0: position/order of distribution for population A = position/order of distribution
for population B
◦ H0: Phân bố quần thể A=quần thể B.
Kruskal-Wallis test ◦ Independent Samples Settings: Kruskal-Wallis 1-way
ANOVA ◦ H0: position/order of distribution of populations is the same
◦ H0: Phân bố các quần thể là như nhau.
Wilcoxon matched pair signed rank test ◦ Related Samples Settings: Wilcoxon matched-pair signed-
rank ◦ H0: position/order of distribution of variable 1 = position/order of
distribution of variable 2
◦ H0: Phân bố biến số 1 = biến số 2