técnicas estadísticas en análisis de...
TRANSCRIPT
Técnicas Estadísticas en Análisis de Mercados
Lo que no se mide, lo que de alguna manera no se capta,
NO EXISTE. Teodoro Luque Martinez
©Xavi Barber 2012/2013
3/13
FASE I
• Visualizar los datos desde el punto de vista “Estadístico”
• “Resumir” y “Dibujar” a conveniencia. – Buscar errores de introducción de datos – Buscar errores de “concepto” – Buscar “desviaciones” extrañas
©Xavi Barber 2012/2013
5/13
Relacionando Variables
Queremos Explicar la relación existente entre Una variable, la cual creemos dependiente, y otras continuas o categóricas:
– Regresión Lineal Simple • Y~X1
– Regresión Lineal Multiple • Y~X1+X2+…Xp
– ANOVA • Y~F1+…+Fp
– ANCOVA • Y~X1+…+Xp+F1+…+Fq (y estudiando ∏XiFj)
©Xavi Barber 2012/2013
6/13
Regresión Lineal
• ¿Existe relación Lineal entre las variables? – Gráficamente y Numéricamente Si no aplicar las transformaciones habituales: log(Y)~X ; Y~log(X) ; log(Y)~log(X) ; 1/Y ~1/X
• ¿Son INDEPENDIENTES las Xi? – Gráficamente y Numéricamente Eliminar las relaciones redundantes Si existen excesivas X, aplicar un AF para reducir la dimensión del problema.
©Xavi Barber 2012/2013
7/13
Regresión Lineal
Cargamos los datos del paquete BCA: “Eggs”
©Xavi Barber 2012/2013
Information on weekly sales of eggs in Southern California over a two year period. Week ; MonthFirst.Week; Easter; Cases; Egg.Pr ; Beef.Pr; Pork.Pr; Chicken.Pr ; Cereal.Pr
8/13
Regresion Lineal
Estudio Analítico y Gráfico de las Variables Beef.Pr Cases Cereal.Pr Chicken.Pr Egg.Pr Pork.Pr Beef.Pr 1.00 0.08 0.18 0.36 -0.21 0.06 Cases 0.08 1.00 -0.14 0.01 -0.31 0.05 Cereal.Pr 0.18 -0.14 1.00 -0.33 0.04 0.35 Chicken.Pr 0.36 0.01 -0.33 1.00 -0.24 -0.21 Egg.Pr -0.21 -0.31 0.04 -0.24 1.00 -0.39 Pork.Pr 0.06 0.05 0.35 -0.21 -0.39 1.00 Beef.Pr Cases Cereal.Pr Chicken.Pr Egg.Pr Pork.Pr Beef.Pr 0.00 0.10 0.33 0.42 -0.09 -0.01 Cases 0.10 0.00 -0.16 -0.15 -0.30 -0.06 Cereal.Pr 0.33 -0.16 0.00 -0.35 0.10 0.30 Chicken.Pr 0.42 -0.15 -0.35 0.00 -0.26 -0.21 Egg.Pr -0.09 -0.30 0.10 -0.26 0.00 -0.47 Pork.Pr -0.01 -0.06 0.30 -0.21 -0.47 0.00
©Xavi Barber 2012/2013
16/13
Regresión Lineal
Probando relaciones… ¿Modelo Más Complejo o Modelo más simple? ¿Introducir una a una las variables? ¿quitar una a una las variables has…? ¿Selección automática de Variables?
©Xavi Barber 2012/2013
17/13
Regresión Lineal
• Cuidado con de grados de libertad en la estimación de los parámetros y en el estudio de interacciones.
• Cuidado con la variable “Week”, nos puede servir como una variable para estudiar la Temporalidad o estacionalidad de la “serie”.
• La variable “Month” puede mostrar también puede servir para controlar la estacionalidad de la “serie”
©Xavi Barber 2012/2013
18/13
Regresión Lineal • Modelo SIN Interacciones: modelo1 <- lm(Cases ~ Beef.Pr + Cereal.Pr + Chicken.Pr + First.Week + Month + Easter + Eggs.pr+ Pork.Pr,
data=Eggs) Residuals: Min 1Q Median 3Q Max -12761.0 -3952.6 371.2 3198.0 19988.9 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 116169.57 25697.25 4.521 1.98e-05 *** Beef.Pr 328.78 103.70 3.170 0.002117 ** Cereal.Pr -559.01 177.76 -3.145 0.002291 ** Chicken.Pr -96.08 172.74 -0.556 0.579506 First.Week[T.Yes] 5723.39 1512.71 3.784 0.000287 *** Month[T.February] -5099.38 2972.65 -1.715 0.089909 . Month[T.March] -7065.14 3052.08 -2.315 0.023031 * Month[T.April] -10966.26 3697.23 -2.966 0.003915 ** Month[T.May] -11522.05 3134.58 -3.676 0.000414 *** Month[T.June] -7068.71 3065.47 -2.306 0.023550 * Month[T.July] -9985.28 2816.14 -3.546 0.000640 *** Month[T.August] -12983.81 2946.57 -4.406 3.05e-05 *** Month[T.September] -10898.75 3070.33 -3.550 0.000631 *** Month[T.October] -11498.00 3034.55 -3.789 0.000282 *** Month[T.November] -4542.75 2998.89 -1.515 0.133530 Month[T.December] -1346.49 3021.05 -0.446 0.656945 Easter[T.Pre Easter] 30481.47 5012.45 6.081 3.29e-08 *** Easter[T.Easter] 79238.73 5463.70 14.503 < 2e-16 *** Easter[T.Post Easter] -20021.77 5328.33 -3.758 0.000314 *** Pork.Pr 79.47 40.86 1.945 0.055119 . Egg.Pr -452.62 113.72 -3.980 0.000146 *** --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 5691 on 84 degrees of freedom Multiple R-squared: 0.8725, Adjusted R-squared: 0.8421 F-statistic: 28.74 on 20 and 84 DF, p-value: < 2.2e-16
©Xavi Barber 2012/2013
19/13
Regresión Lineal ANCOVA
• Busca el mejor modelo, probando las interacciones…. Pero cuidado con los Grados de Libertad….
©Xavi Barber 2012/2013
20/13
Regresión NO Lineal
¿Y si resulta que no hemos considerado que el modelo pudiese ser multiplicativo? Venta= a(pr.Huevos)
b(pr.Cereal)
c(pr.Pollo)
d
Variante de la famosa función de producción K-D Aplicando Logaritomos reconvertimos a un modelo aditivo… mira a ver si ajusta mejor
©Xavi Barber 2012/2013