제 3 장 자료의 정리
Post on 04-Jan-2016
98 Views
Preview:
DESCRIPTION
TRANSCRIPT
제 3 장 자료의 정리
도수 / 상대도수 / 백분율
cf. 유효백분율 (valid percent)
도수분포표
[ex]
도수분포표의 유형
정성적 자료의 도수분포표 (frequency, 또는 피벗테이블 / 피벗차트 보고서 )
정량적 자료의 도수분포표
계급구간이 없는 도수분포표 (frequency, 또는 피벗테이블 / 피벗차트 보고서 ) 계급구간이 있는 도수분포표
‘ 피벗 테이블 / 피벗 차트 보고서’의 활용
Employee data 에서 jobcat 의 도수분포표를 작성하시오 .( 피벗테이블 / 피벗차트보고서를 활용하여 )
Question
계급구간이 없는 도수분포표
frequency 함수를 이용하여 도수분포표를 작성하시오 .
계급구간이 없는 도수분포표의 작성절차
(1) 자료의 값을 계급으로 설정
(2) 각 계급의 도수를 산정
계급
최소값
최대값
…
도수
자료에서 최소값을 찾는 Excel 함수 : max 함수자료에서 최대값을 찾는 Excel 함수 : min 함수
frequency함수
max 함수 / min 함수
= max(Data)
Data : 자료가 입력되어 있는 영역주소
자료에서 최대값을 찾아 반환하는 함수
= min(Data)
Data : 자료가 입력되어 있는 영역주소
자료에서 최소값을 찾아 반환하는 함수
frequency 함수
계급구간이 있는 도수분포표
frequency 함수를 이용하여 도수분포표를 작성하시오 .
계급구간이 있는 도수분포표 작성절차 (Guideline)
Question
통계분석사례
비오는 날 또는 월요일이 사람에게 신체적 또는 정신적으로 영향을 준다고 많은 사람들이 이야기 한다 . 월요일에 자살하는 사람이 다른 요일보다 더 많다고 알려져 있다 . 또한 심장병으로 사망하는 사람이 월요일에 더 많다는 연구결과가 보고 (Rabkin et al. 1980) 되기도 하였다 .
Rabkin, S. W., F. A. Mathewson and R. B. Tate. Chronobiology of cardiac sudden death in men. Journal of the American Medical Association, 244:12, (1980), 1357-1358.
Western Electric Study 자료에서 dayofwk 의 도수분포를 통해서 월요일에 사망하는 사람이 다른 요일과 비교해 상대적으로 많은가를 검토해 보자 .
도수분포표의 활용
Western Electric Study (electric)Western Electric Study 는 건강한 사람이 관상동맥 심장질환 (coronary heart disease: CHD) 에 걸리게 되는 요인에 관하여 연구하기 위해 1957 년에 수행되었다 . 시카고 지역에 있는 Western Electric Company 의 Hawthorne공장에서 최소 2 년 이상 근무한 경험이 있는 40 세 ~55 세의 남성 5,397명에서 240 명을 표본으로 선택하였다 .
자료에 포함된 변수- caseid - firstchd : 최초의 CHD 증상 (1: No CHD, 2: Sudden death, 3: Non fatal MI, 5: Fatal MI, 6: Other CHD)- age - dbp58 : 평균혈압 - eduyr : 교육년수- chol58 : 콜레스테롤 (mg per dl)- cgt58 : 일일흡연량 ( 개비 )- ht58 : 신장 ( 인치 )- wt58 : 몸무게 ( 파운드 )
- dayofwk : 사망요일 (1: 일 , 2: 월 , 3: 화 , 4: 수 , 5: 목 , 6: 금 , 7: 토 , 9:결측 )- vital10 : 10 년간 상태 (0: 생존 , 1: 사망 )- famhxcvr : CHD 가족력 (N: No, Y: Yes)- chd : CHD 발생여부 (1: 발생 , 0: 미발생 )
Western Electric Study
교차표
[ 예 ] 자료세트
[Q] 자료의 요소
ID X Y1 1 12 1 23 1 24 2 15 2 2
도수분포표
X 도수12 5
Y 도수12 5
교차표
X1 2Y
12
통계분석사례
미국에서는 1964 년 공표된 Civil Rights Act 에 의해 성별 또는 인종에 따라 작업장에서 차별하는 것을 금지하고 있다 . 불공정한 고용 및 승진이 있을 경우 고용주는 기소될 수 있다 . 미국 법정에서는 통계분석결과가 차별에 대한 명백한 증거 (prima facie evidence) 로 사용될 수 있음을 규정하고 있으며 실제로 수많은 소송에서 복잡한 통계분석결과가 동일한게 qualified 된 종업원이 차별대우를 받았다는 것을 입증하는 증거로 사용된 바 있다 .
bank 자료에서jobcat 과 sexrace 의 교차표를 작성하고 이를 기초로 차별이 있었는가에 대하여 분석해 보시오 .
bank 자료Employee data 와 동일하지만 jobcat 이 7 가지로 세분되어 있고sexrace 변수가 추가되어 있다 .
jobcat 1 : Clerical 2 : Office Trainee 3 : Security Officer 4 : College Trainee 5 : Exempt Employee 6 : MBA Trainee 7 : Technical
sexrace 1 : White Males 2 : Minority Males 3 : White Females 4 : Minority Females
Clerical
Manager
Custodial
분석결과
막대그래프와 히스토그램
계급
도수상대도수
막대그래프 (ex. 불량품수의 막대그래프)히스토그램 (ex. 109개 국가 출생률의 히스토그램)
불량품수의 막대그래프
109 개 국가의 출생률 히스토그램
꺾은선그래프
ex. 인하식품의 인천지역 제품별/월별 판매량의 꺾은선그래프
인하식품의 인천지역 제품별 / 월별 판매량의 꺾은선그래프
OgiveOgive : 누적백분율곡선 , 누적백분율을 꺽은선그래프로 나타낸 그림
원그래프원그래프 : 원을 각 집단에 속하는 도수의 비율을 기준으로 분할해 놓은 그림
Question
어떤 도수분포표인가 ? ( 도수분포표의 유형 )
적합한 그래프 유형은 ? ( 막대그래프 , 히스토그램 , 꺽은선그래프 , 원도표 )
줄기와 잎 그림
(SPSS 11.0)
(SPSS 10.0k)
[Q]
다음의 줄기와 잎 그림을 보고 가능한 상태까지 원래의 자료를 복원해 보시오 .
[Q] 자료의 요소
?
?
?
top related