econometria 2. modelo de regresión lineal simple prof. ma. isabel santana
Post on 10-Feb-2015
88 Views
Preview:
TRANSCRIPT
Econometria2. Modelo de Regresión Lineal Simple
Prof. Ma. Isabel Santana
FRP Y FRM
• La diferencia entre los Yi poblacionales y los Y^ estimados es lo que llamaremos residuos
EStimación de β1 y β2
• El objetivo es determinar la FRM de tal manera que esté lo más cerca posible a la Y observada.
• Una posibilidad sería minimizar la sumatoria de los residuos
• Sin embargo, este método no es factible ya que da el mismo peso a todos los residuos sin considerar qué tan cerca o qué tan dispersas están las observaciones de la FRM.
YY iiiˆ
EStimación de β1 y β2
• Esto se puede evitar adoptando el criterio de mínimos cuadrados
• Adicionalmente, este método posee propiedades estadísticas deseables (que veremos más adelante
YY iiiˆˆ
22
XY iii 212 ˆˆˆ
2
21ˆ,ˆ2ˆ f
i
Derivación
XY iii 212min ˆˆˆ
2
0ˆˆ
1
2
i
0ˆ
ˆ
2
2
i
0ˆ
ˆ2
1
22
i
0ˆ
ˆ22
22
i
CNPO
CNSO
01ˆˆ2ˆˆ
21
1
2
iii XY
0ˆˆ21 ii XY
0ˆ1ˆ21 ii XY
12ˆˆ ii XY
12 ˆ
ˆ
n
X
n
Y ii
Resolviendo para :1
(1)
Derivación
01ˆˆ2ˆ
ˆ21
2
2
iiii XXY
0ˆˆ 2
21 iiii XXXY
0ˆˆ 2
22 iiii XXXYXY
0ˆˆ 2
22 iiiii XXXXYXY
n
nXXX
n
nXYXY iiiii 2
22
ˆˆ
22
22
ˆˆ XnXXYnXY iii
222
ˆ XnXXYnXY iii
222
XnX
XYnXY
i
ii
Resolviendo para :2
(2)
Sustituyendo XY 21ˆˆ
Derivación
01ˆ2ˆˆ
1
2
i
i
0ˆ i
01ˆ2ˆ
ˆ
2
2
ii
i X
(1) También es igual a:
0ˆ iiX
(2) También se puede expresar como:
Ejemplo
• Supongamos que conocemos los datos de producción y horas trabajadas dee 10 trabajadores de una fábrica en un momento de tiempo (corte transversal).
• Definimos Y= producto, X= horas de trabajo.
Ejemplo8X
6.9Y
iii uXY ˆˆˆ21
222ˆ
XnX
XYnXY
i
ii
XY 21ˆˆ
XXY ii 75.06.3ˆˆˆ21
75.0810688
6.9810789ˆ22
8ˆ6.9ˆ21
6.3875.06.91
MICO expresado en desvíos
• Existe otra manera de representar 2
XXx ii
YYy ii
22ˆ
i
ii
x
yx
Si Las variables en minisculas representan desvios respecto a la media de la variable
Entonces:
Propiedades de la regresión MICO
1. Pasa a través de las medias muestrales de Y y X.
0ˆ iiii uXY ˆˆˆ21
iii uXY ˆˆˆ21
nn
X
n
n
n
Y ii 0ˆˆ21
XY 21ˆˆ
X
Y
FRMii XY 21
ˆˆˆ
X
Y
Propiedades de la regresión MICO
2. El valor promedio del Y estimado= , es igual al valor medio del Y real para:
Y
ii XY 21ˆˆˆ
ii XXYY 22ˆˆˆ
XXYY ii 2ˆˆ
XnXYnY ii 22ˆˆˆ
n
Xn
n
X
n
Yn
n
Y ii 22ˆˆˆ
XXYY 22ˆˆˆ
YY ˆ
Propiedades de la regresión MICO3. El valor de la media de los residuos es ceroi
CNPO 01ˆˆ2ˆˆ
21
1
2
iii XY
Dado que iii XYu 21ˆˆˆ
0ˆ2 i
0ˆ i
iii uXY ˆˆˆ21
iii uXnY ˆˆˆ21
ii XnY 21ˆˆ
XY 21ˆˆ
iii XXYY ˆˆ2
iii xy ˆˆ2
La regresión muestral puede ser expresada como desviaciones de Y y X.
Dividiendo por n
0ˆ i*
**
Restando ** de *
Propiedades de la regresión MICO4. Los residuos no están correlacionados con el valor
predicho de Yi, lo cual puede ser verificado utilizando la forma de desviación.
i
iiii xy ˆˆˆ 2
iiiii xyxy 22ˆˆˆ 22
22ˆˆˆ iiiii xyxy
22
ˆi
ii
x
yx
222
222
ˆˆˆ iiii xxy
0ˆ iiy
5. Los residuos no están correlacionados con Xi. Esto es:i0ˆ iix
1. El modelo de regresión es lineal en los parámetros2. Los valores de X son fijos en muestreo repetido3. El valor medio de es igual a cero. 4. Homocedasticidad o igual varianza de . 5. No autocorrelación entre los .6. La covarianza entre y Xi es cero. 7. El número de observaciones debe ser mayor que el
de parámetros8. Variabilidad en los valores de X.9. El modelo de regresión está correctamente
especificado10. No hay multicolinealidad perfecta
Supuestos Clásicos de los MICO
i 0/ ii X
i 2/var sX ii
i 0,cov ji
i
i 0,cov ji X
Supuestos Clásicos de los MICO
1. El modelo de regresión es lineal en los parámetros
2. Los valores de X son fijos en muestreo repetido– Supone que las variables X no son aleatorias– Es posible mantener fijo el valor de X, y repetir el
experimento, obteniendo en cada observación un valor de la variable distinto aleatoria Y.
– El análisis de regresión es un análisis de regresión condicional, es decir, condicionado a los valores dados de los regresores X.
Supuestos Clásicos de los MICO
3. El valor medio de es igual a cero. – Los residuos no son más que las desviaciones de
la muestra aleatoria con respecto a la FRP.
– Los factores que no están incluidos en el modelo, no afectan sistemáticamente el valor esperado de Y.
– Los valores positivos de se cancelan con los valores negativos, de tal manera que su efecto promedio sobre Y es cero.
–
i
i
XXYE 21/
Supuestos Clásicos de los MICO
4. Homocedasticidad o igual varianza de .
– La variación alrededor de la recta de regresión es la misma para los valores de X, es decir, las perturbaciones se distribuyen con igual dispersión respecto a la media.
– y dado el supuesto 2 es equivalente a 22
iii EEV
i
2/var sX ii
22 iE
Homocedasticidad
Heterocestadisticidad
Supuestos Clásicos de los MICO
5. No autocorrelación entre los .
- No existe tendencia de que los errores asociados a una observación estén relacionados a los errores de otra.
- Si en un momento de tiempo o en un individuo de la muestra se genera un error positivo, esto no nos da información alguna sobre si el próximo error será positivo o negativo.
- Los errores no tienen un patrón de comportamiento sistemático.
- Si y están correlacionados, Yt no sólo depende de Xt, sino también de .
t
i 0,cov ji
1ˆ t1ˆ t
Supuestos Clásicos de los MICO
Supuestos Clásicos de los MICO
Supuestos Clásicos de los MICO
6. La covarianza entre y Xi es cero.
– Si hay correlación, no es posible saber como afecta individualmente y a la variable Y i.
– Este supuesto se cumple inmediatamente si X no es una variable aleatoria (sino que es fija).
7. El número de observaciones debe ser mayor que el de parámetros
i
i 0,cov ji X
iX
Supuestos Clásicos de los MICO
8. Variabilidad en los valores de X.– El modelo de MCO requiere que exista una
dispersión entre las X para poder calcular los valores de los coeficientes, pues si no, éstos serían una cantidad infinita.
– Ejemplo.
22ˆ
i
ii
x
yx
02 ix
XX i Si todos los valores de X son idénticos, entonces
Por lo cual
Y entonces,
Supuestos Clásicos de los MICO
9. El modelo de regresión está correctamente especificado
– La forma de la FRM es igual a la FRP– El modelo posee las variables correctas: no se
incluyen variables irrelevante ni se excluyen relevantes.
– La forma funcional es la correcta
10. No hay multicolinealidad perfecta– No hay una relación perfectamente lineal entre las X
top related