ch6 correlation analysiselearning.kocw.net/contents4/document/lec/2012/konkuk_g... ·...
Post on 05-Jul-2018
214 Views
Preview:
TRANSCRIPT
Rehabilitation Lab
1. 상관관계 분석이란?
Ø Ch. 3(t-test)과 Ch. 4(One way ANOVA) : 집단간의 평균을 비교
Ø Ch. 5(χ2-test) : 범주형 자료의 분석
ØCh. 6(Correlation analysis) : 2개의 변수간의 밀접한 정도, 즉 상관관계를 분석하는 통계적 분석 방법
Ø Ch. 3(t-test)과 Ch. 4(One way ANOVA) : 집단간의 평균을 비교
Ø Ch. 5(χ2-test) : 범주형 자료의 분석
ØCh. 6(Correlation analysis) : 2개의 변수간의 밀접한 정도, 즉 상관관계를 분석하는 통계적 분석 방법
Rehabilitation Lab
1. 상관관계 분석이란?
Ø Correlation의 의미
- 한 변수가 증가 또는 감소할 때 다른 한 변수는 증가하는지, 또는 감소하는지경향을 나타냄
- 증가, 또는 감소의 경향을 나타내는 두 변수의 관계는 선형관계를 이룸
- 선형관계를 이루는 경향을 객관적으로 수치화한 것 : correlation coefficient
- Correlation coefficient의 절대값이 1에 근접 할 수록 두 변수 간에 상관성이 큼
Ø Correlation의 의미
- 한 변수가 증가 또는 감소할 때 다른 한 변수는 증가하는지, 또는 감소하는지경향을 나타냄
- 증가, 또는 감소의 경향을 나타내는 두 변수의 관계는 선형관계를 이룸
- 선형관계를 이루는 경향을 객관적으로 수치화한 것 : correlation coefficient
- Correlation coefficient의 절대값이 1에 근접 할 수록 두 변수 간에 상관성이 큼
Rehabilitation Lab
1. 상관관계 분석이란?
Ø 자료 형태에 따른 분석 방법 선택
※ 참고 : multiple correlation, canonical correlation 등
두 변수의 자료의 형태 분석 방법
Ø 자료 형태에 따른 분석 방법 선택
※ 참고 : multiple correlation, canonical correlation 등
양적 + 양적 Pearson's correlation
양적 + 순위 or 순위 + 순위 Spearman's correlation
Rehabilitation Lab
1. 상관관계 분석이란?
Ø 자료 형태에 따른 분석 방법 선택
Pearson’s correlation : ①, ②, ③, ⑤
spearman’s correlation : ④, ⑥
자 료 적합한 상관분석 방법
아버지의 혈압과 아들의 혈압의 관계 ①
입원기간과 수술시간의 관계 ②
Ø 자료 형태에 따른 분석 방법 선택
Pearson’s correlation : ①, ②, ③, ⑤
spearman’s correlation : ④, ⑥
혈압과 연령의 관계 ③
경제적 수입과 삶의 질의 정도와의 관계 ④
체중과 WHR과의 관계 ⑤
통증(5점 scale)과 암의 stage(5점 scale)와의 관계 ⑥
Rehabilitation Lab
2. 상관관계분석의 절차 및 상관계수
Ø Correlation analysis의 절차
- 자료의 속성 파악[p. 55]
- Scatter plot을 그려서 경향성 파악(선형관계임을 파악)[p. 112~113]
- 적합한 상관관계 분석방법 채택(Pearson , Spearman…)
• Correlation coefficient 계산
- 상관계수에 대한 가설검정과정(상관계수의 통계적 유의성 파악)
Ø Correlation analysis의 절차
- 자료의 속성 파악[p. 55]
- Scatter plot을 그려서 경향성 파악(선형관계임을 파악)[p. 112~113]
- 적합한 상관관계 분석방법 채택(Pearson , Spearman…)
• Correlation coefficient 계산
- 상관계수에 대한 가설검정과정(상관계수의 통계적 유의성 파악)
Rehabilitation Lab
2. 상관관계분석의 절차 및 상관계수
Ø Scatter plot
- 2가지 변수의 관계를 도시적으로 보여줌
Ø Scatter plot
- 2가지 변수의 관계를 도시적으로 보여줌
Rehabilitation Lab
2. 상관관계분석의 절차 및 상관계수
Ø Scatter plot
- Scatter plot을 통해 파악할 수 있는 사항
① Scatter plot은 관찰자의 주관이 개입된다는 단점이 있지만 직관적으로상관을 알아볼 수 있음
② 얼마나 큰 연관성이 있는지를 보여줌
Ø Scatter plot
- Scatter plot을 통해 파악할 수 있는 사항
① Scatter plot은 관찰자의 주관이 개입된다는 단점이 있지만 직관적으로상관을 알아볼 수 있음
② 얼마나 큰 연관성이 있는지를 보여줌
Rehabilitation Lab
2. 상관관계분석의 절차 및 상관계수
Ø Correlation coefficient
- Population correlation coefficient
- Sample correlation coefficient
Ø Correlation coefficient
- Population correlation coefficient
- Sample correlation coefficient
Rehabilitation Lab
2. 상관관계분석의 절차 및 상관계수
Ø Population Correlation coefficient (Pearson’s correlation)
- 두 개의 변수가 pair로 있어야 함
- 표기 : ρ (rho)
- 정의 : 모집단의 두 변수 사이에 존재하는 선형관계의 객관적인 측도
- 특징
① -1~1사의 값② 양의 선형관계 è 1, 음의 선형관계 è -1, 상관관계 약함 è 0
Ø Population Correlation coefficient (Pearson’s correlation)
- 두 개의 변수가 pair로 있어야 함
- 표기 : ρ (rho)
- 정의 : 모집단의 두 변수 사이에 존재하는 선형관계의 객관적인 측도
- 특징
① -1~1사의 값② 양의 선형관계 è 1, 음의 선형관계 è -1, 상관관계 약함 è 0
Rehabilitation Lab
2. 상관관계분석의 절차 및 상관계수
Ø Sample Correlation coefficient (Pearson’s correlation)
- 두 개의 변수가 pair로 있어야 함
- 표기 : r xy
- 정의 : 모집단으로부터 추출한 크기 n인 표본의 자료를 (x1, y1),…,(xn, yn)라고할 때 다음과 같이 정의
- 특징
① -1~1사의 값② 양의 선형관계 è 1, 음의 선형관계 è -1, 상관관계 약함 è 0
Ø Sample Correlation coefficient (Pearson’s correlation)
- 두 개의 변수가 pair로 있어야 함
- 표기 : r xy
- 정의 : 모집단으로부터 추출한 크기 n인 표본의 자료를 (x1, y1),…,(xn, yn)라고할 때 다음과 같이 정의
- 특징
① -1~1사의 값② 양의 선형관계 è 1, 음의 선형관계 è -1, 상관관계 약함 è 0
Rehabilitation Lab
2. 상관관계분석의 절차 및 상관계수
Ø Correlation coefficient에 대한 가설검정 (Pearson’s correlation)
- 가설설정
Null hypothesis : 두 변수간에 상관이 없다( ρ = 0 )
Alternative hypothesis : 두 변수간에 상관이 있다( ρ ≠ 0)
- 검정통계량의 설정 및 계산
- 유의수준설정 : α= 0.05 (계산된 t값으로 자유도가 n-2인 t-분포에서 p-value 계산)
- 결론 : p-value가 유의수준보다 작으면 null hypothesis를 기각
Ø Correlation coefficient에 대한 가설검정 (Pearson’s correlation)
- 가설설정
Null hypothesis : 두 변수간에 상관이 없다( ρ = 0 )
Alternative hypothesis : 두 변수간에 상관이 있다( ρ ≠ 0)
- 검정통계량의 설정 및 계산
- 유의수준설정 : α= 0.05 (계산된 t값으로 자유도가 n-2인 t-분포에서 p-value 계산)
- 결론 : p-value가 유의수준보다 작으면 null hypothesis를 기각
Rehabilitation Lab
2. 상관관계분석의 절차 및 상관계수
Ø Spearman’s rank correlation coefficient
- 자료의 속성이 순위변수인 경우 가장 대표적으로 사용
- 표기 :
- 모집단에서 추출한 크기 n인 표본의 자료를 (x1, y1),…(xn, yn)라고 하면 는다음과 같은 과정을 거쳐 계산 됨
① 자료 x1, x2, … , xn에 순위를 매긴다.
② 자료 y1, y2, … , yn에 순위를 매긴다.
③ xi의 순위와 yi의 순위 차 di를 구한다.
④ di의 제곱의 합 을 구한다.
⑤ 다음 수식에 의해 를 계산한다.
Ø Spearman’s rank correlation coefficient
- 자료의 속성이 순위변수인 경우 가장 대표적으로 사용
- 표기 :
- 모집단에서 추출한 크기 n인 표본의 자료를 (x1, y1),…(xn, yn)라고 하면 는다음과 같은 과정을 거쳐 계산 됨
① 자료 x1, x2, … , xn에 순위를 매긴다.
② 자료 y1, y2, … , yn에 순위를 매긴다.
③ xi의 순위와 yi의 순위 차 di를 구한다.
④ di의 제곱의 합 을 구한다.
⑤ 다음 수식에 의해 를 계산한다.
top related