curs regresie statistica economica
TRANSCRIPT
Modelul de regresie clasic
CE ESTE REGRESIA? Modelul de regresie– modelează dependenţa variabilelor
complexe de un ansamblu de factori principali şi secundari, sistematici sau aleatori, care acţionează în acelaşi sens sau în sensuri diferite
CauzeFuncţia Efect
Variabileindependente
f Variabiladependentă
f(x1,x2,...,xn)=Y
REGRESIA – Când şi cum o utilizăm?
Regresia se foloseşte pentru: a determina o relaţie cauzală a testa o relaţie cauzală a previziona o variabilă dependentă în funcţie de una sau mai multe
variabile independente a explica efectul în funcţie de cauze
Regresia simpla liniară
Corelație pozitivă Corelație negativă
Nu există corelație
Specificarea unui model de regresie
Modelul liniar general de regresie unifactorială:
Y=+·x + Componenta predictibilă
Variabila/eroarea
aleatoare
Specificarea unui model de regresie
Modelul liniar unifactorial y=1+0,5xX
Y
1.0
1
0,5
XY
εε
Specificarea unui model de regresie
Se efectuează o selecţie de volum n : (xi,yi)i=1...n Modelul de regresie liniară observat este:
yi = a + bxi + eicu componenta predictibila:
ei = yi – (a + bxi)
ii bxay
Estimarea parametrilor modelului de regresie clasic
Metoda celor mai mici pătrate:
Pentru estimarea parametrilor şi pe baza datelor observate =>minimizarea erorilor observate:
i
iiii bxaye 22 )(minmin
Estimarea parametrilor modelului de regresie clasic
Condiţiile de ordin 1: determinarea soluţiei
Condiţia de ordin 2: soluţia găsită este un punct de minim. Matricea derivatelor parţiale de ordin doi trebuie să fie pozitiv definită.
0)(
0)(
2
2
b
ea
e
ii
ii
bxaxyx
bxnay
ii
ii
iii
ii
ii
)()(
)(
2
Estimarea parametrilor modelului de regresie clasic
22
2
xnx
yxnyx
xx
xn
yxx
yn
b
xbya
ii
iii
ii
ii
ii
iii
ii
ii
22
2
22
2
2
2
ii
ii
ii
ii
iii
ii
ii
ii
ii
ii
i
ii
ii
ii
iii
ii
ii
ii
ii
ii
ii
iii
ii
ii
ii
xxn
yxyxn
xx
xn
yxx
yn
b
xxn
yxxxy
xx
xn
xyx
xy
a
Condiţiile de ordin 1:
Estimarea parametrilor modelului de regresie clasic
Condiţia de ordin 2
Deci matricea este pozitiv definită
ii
ii
ii
ii
ii
ii
ii
xx
xn
b
e
ab
eba
e
a
e
2
22
2222
22
22
22
22
22
)()(
)()(
0)(4)(44
02
02
222
2
ii
ii
ii
ii
xxnxxn
x
n
Estimarea parametrilor modelului de regresie clasic
Deci:2x
xy
ss
b
ii
iii
ii
iii
ii
iii
iii
iii
ii
ii
ii
ii
ii
iii
xx
yyxx
xxxxxx
yxxyxx
xxx
yxx
xnxxxxx
yxnyxyxyxb
2
22
)(
))((
)()(
)()(
)(
)(
Estimarea parametrilor modelului de regresie clasic
sxy este covarianţa între x şi y.
Linii de regresie cu a) pantă pozitivă b) pantă negativă c) pantă egală cu zero
Exemplu Directorul unui liceu dorește să vadă dacă media cu care un elev de
clasa a noua încheie anul depinde de media de la examenul de admitere în liceul respectiv. În acest scop el selectează aleatoriu 20 de studenți pentru care înregistrează media la admitere și media obținută la sfârșitul primului am de studii în liceu. Rezultatele obținute sunt:
Determinați dreapta de regresie ce descrie cel mai bine legătura între media de la examenul de admitere în liceu și media de la sfârșitul primului an de studii.
Medie primul an 9 8.3 8.2 7.4 8 9.7 9.5 8.7 8.2 7.8 8.4 8.9 8.5 9.8 8.1 7.8 8.5 9.4 7.6 8.2Nota la admitere 9.1 8.3 9 7.9 8.5 9.7 9.4 8.6 8.8 7.6 8 8.9 8.3 9.2 7.8 7.4 8 9.8 8.2 7.5
Exemplu
y estimat erori8,96745 0,032558,34465 -0,04465
8,8896 -0,68968,03325 -0,633258,50035 -0,500359,43455 0,26545
9,201 0,2998,5782 0,12188,7339 -0,53397,7997 0,00038,1111 0,2889
8,81175 0,088258,34465 0,15535
9,0453 0,75477,9554 0,1446
7,644 0,1568,1111 0,38899,5124 -0,11248,2668 -0,6668
7,72185 0,47815
Medie primul an
Nota la admitere
Mean 8,5Mean 8,5Standard Error 0,154919Standard Error 0,160918Median 8,35Median 8,4Mode 8,2Mode 8,3Standard Deviation 0,69282
Standard Deviation 0,719649
Sample Variance 0,48Sample Variance 0,517895Kurtosis -0,59508Kurtosis -0,9326Skewness 0,496952Skewness 0,238184Range 2,4Range 2,4Minimum 7,4Minimum 7,4Maximum 9,8Maximum 9,8Sum 170Sum 170Count 20Count 20
Exemplu