sbe2012 week2(확률변수...
TRANSCRIPT
Business and economics statistics | Fall, 2012 | Week2 (RV and Expectation)
| 10 Professor Kwon, Sehyug | Dept. of Statistics, HANNAM Univ. 010.6365.7622 http://wolfpack.hnu.ac.kr
Random variable
(정의)
확률변수(random variable) X 는 정의역(domain)이 표본공간이고 치역이 실수인
함수이다. :X S R . 확률변수 X 의 Range (공간)은 실수 { : ( ), }x x X w w S A= 이다.
)(AP
probability measure
)(wX
)(),( xfxP
( ) ( ) ( )XP X A P A P C { : and ( ) }C w w S X w A
Discrete 이산형
확률변수 X 가 가질 수 있는 값이 유한(finite)이거나 셀 수 있는 (countable) 경우
Continuous 연속형
확률변수 X 가 가질 수 있는 서로 다른 값이 무한인 경우, 임의의 작은 구간을
잡아도 그 구간 내의 값이 관측될 수 있음
확률밀도함수 Probability Density function f(x)
확률변수 X 가 가지는 값 x와 그에 대응하는 확률 ( )p x 을 그래프, 수식, 표
형태로 나타낸 것이다.
확률변수 X 의 범위가 정의역(domain, X-축), 확률 ( )p x 가 치역(range, Y-축)인
함수 : 이산형 ( )p x , 연속형 R.V. : )(xf
(누적확률)분포함수 Cumulative Probability Density function, F(x)
임의의 값 x까지 누적 확률
xx
dxxfxpxXPxF )()()()( ,
0)( F , 1)( F
Business and economics statistics | Fall, 2012 | Week2 (RV and Expectation)
| 11 Professor Kwon, Sehyug | Dept. of Statistics, HANNAM Univ. 010.6365.7622 http://wolfpack.hnu.ac.kr
확률 공리
(1) 모든 x에 대하여 1)(),(0 xfxp , 확률은 0 보다 크고 1 보다 작다
(2) 1)()( dxxfxpx
모든 원소의 확률의 합은 1 이다.
기대값 (The expected value)
정의 확률변수 X 가 확률밀도함수 ( )p x 을 갖는다고 가정하자. 확률변수 X 의
기대값은 다음과 같이 정의한다. dxxxfxpxXEx
)()()(
2))(( XEX 의 기대값=확률변수 X 의 분산(variance) : 2))(()( XEXEXV
22 )()()( XEXEXV (간편식)
분산의 양의 제곱근을 확률변수 X 의 표준편차(standard deviation)
모집단 : 평균은 )(XE 분산은 22 )( XE
표본 데이터 : 평균은 nxx i , 분산은 )1/()( 22 nxXs
확률변수 X 의 함수 )(xg 의 기대값
dxxfxgxpxgxgEx
)()()()())((
2cXY 의 기대값 : )()()( 22 xpcXcXEYE
정리(THEOREM)
상수 c 에 대하여
ccE )( , cXEcXE )()( , )()( XcEcXE , ))(())(( xgcExcgE
0)( cV , )()( XVcXV , )()( 2 XVccXV , ))(())(( 2 xgVcxcgV
Business and economics statistics | Fall, 2012 | Week2 (RV and Expectation)
| 12 Professor Kwon, Sehyug | Dept. of Statistics, HANNAM Univ. 010.6365.7622 http://wolfpack.hnu.ac.kr
# Problems
Business and economics statistics | Fall, 2012 | Week2 (RV and Expectation)
| 13 Professor Kwon, Sehyug | Dept. of Statistics, HANNAM Univ. 010.6365.7622 http://wolfpack.hnu.ac.kr
Bivariate Distribution 이변량 분포
확률변수 ),( YX 가 동시에 발생하는 경우
결합확률밀도함수 joint PDF
),(),( yYxXPyxp (이산형), ),( yxf (연속형)
확률 공리
0),( yxf , for all ),( yx
1),( yxf
주변확률밀도함수 marginal PDF
y
x yxpxp ),()( 이산형, dyyxfxfy
x ),()( 연속형
조건부확률밀도함수 conditional PDF
)(
),()|(
yp
yxpyxp
y
이산형, )(
),()|(
yf
yxfyxf
y
연속형
독립 independence
(정의) 만약 )()|( xfyxf 이면, 두 확률변수 ),( YX 는 서로 독립이다.
확률변수 ),( YX 는 서로 독립이면 => )()(),( yfxfyxf yx
공분산 covariance
두 확률변수 간 선형관계 정도를 측정 (한 확률변수의 값이 증가하면 다른
확률변수의 값이 직선의 관계 속에서 변하는 정도)
(정의) )()()())())(((),( YEXEXYEYEYXEXEYXCOV
만약 확률변수 ),( YX 는 서로 독립이면, )()()( YEXEXYE
그러므로 0),( YXCOV
그러나 0),( YXCOV 라고 확률변수 ),( YX 는 서로 독립인 것은 아니다.
Business and economics statistics | Fall, 2012 | Week2 (RV and Expectation)
| 14 Professor Kwon, Sehyug | Dept. of Statistics, HANNAM Univ. 010.6365.7622 http://wolfpack.hnu.ac.kr
상관계수
공분산의 측정 단위를 표준화 값으로 -1 과 1 의 값을 갖는다.
(정의) )()(
),(),(
YVXV
YXCOVYXCorr , 기호 (모집단) r(표본 데이터)
양(음)의 직선관계가 완벽하면 (모든 점들이 직선에 놓임) 상관계수=1 (-1)
일반 실험 측정형 데이터 0.8 이상이면 직선 관계가 높음
기대값
)()()( YEXEYXE
),(2)()()( YXCOVYVXVYXV
만약 YX , )()()( YVXVYXV
확률변수 iX , 상수 ic 에 대하여
)()( iiii XEcXcE
),(2)()( 2jjiiiiii XcXcCOVXVcXcV
만약 확률변수 iX 가 서로 독립이면, )()( 2 iiii XVcXcV
Business and economics statistics | Fall, 2012 | Week2 (RV and Expectation)
| 15 Professor Kwon, Sehyug | Dept. of Statistics, HANNAM Univ. 010.6365.7622 http://wolfpack.hnu.ac.kr
Problems
Business and economics statistics | Fall, 2012 | Week2 (RV and Expectation)
| 16 Professor Kwon, Sehyug | Dept. of Statistics, HANNAM Univ. 010.6365.7622 http://wolfpack.hnu.ac.kr
Case Study : Portfolio PORTFOLIO2.xls
Business and economics statistics | Fall, 2012 | Week2 (RV and Expectation)
| 17 Professor Kwon, Sehyug | Dept. of Statistics, HANNAM Univ. 010.6365.7622 http://wolfpack.hnu.ac.kr
Case Study : Portfolio2 PORTFOLIO.xls