correlacion y regresion
DESCRIPTION
ejercicios resueltos de correlación y regresión (matemática financiera)TRANSCRIPT
CONTROL DE LECTURA N° 05
1.- Suponga que el gerente de comercialización de Bella Holandesa observa el precio y volumen de venta de galones de leche de 10 semanas en forma aleatoria. Los datos obtenidos se presentan en la tabla. Generar el diagrama de dispersión, verificar la tendencia con el coeficiente de correlación, los parámetros de la línea de regresión, el coeficiente de determinación, y la desviación estándar.
Semana Venta Semanal de galones
Precio de Venta por galón (en U$$)
1 10000 1.30
2 6000 2.00
3 5000 1.70
4 12000 1.50
5 10000 1.60
6 15000 1.20
7 5000 1.60
8 12000 1.40
9 17000 1.00
10 20000 1.10
SOLUCIÓN
a) Diagrama de Dispersión: Y=f(x)
X = Venta Semanal de galonesY = Precio de Venta por galón
b) Verificación de la tendencia con el coeficiente de correlación:
Semana Venta Semanal
de galones
Precio de Venta por
galón (en U$$)
XY X2 Y2 (Xi-Xprom)2
(yi-yprom)2
X Y1 10000 1.30 13000 100000000 1.69 1440000 0.01962 6000 2.00 12000 36000000 4 27040000 0.31363 5000 1.70 8500 25000000 2.89 38440000 0.06764 12000 1.50 18000 144000000 2.25 640000 0.0036
Universidad Nacional de Cajamarca
Ingeniería de proyectos
5 10000 1.60 16000 100000000 2.56 1440000 0.02566 15000 1.20 18000 225000000 1.44 14440000 0.05767 5000 1.60 8000 25000000 2.56 38440000 0.02568 12000 1.40 16800 144000000 1.96 640000 0.00169 17000 1.00 17000 289000000 1 33640000 0.1936
10 20000 1.10 22000 400000000 1.21 77440000 0.1156TOTAL 112000 14.40 14930
0148800000
021.5
623360000
00.824
Xpromedio Ypromedio
11200 1.44
Calculo de coeficiente de correlación:
= -0.863488967
Como: -1<R<1 (OK) Se ajusta
c) los parámetros de la línea de regresión:
Formulas paramétricas:
b =
b = -0.0000512842 = -0.00005
a = Yprom – b*Xprom
a= 2.01438356 = 2.00
El ajuste lineal será:
Y = 2.014 – 0.00005*X
Dónde: X = Venta Semanal de galones Y = Precio de Venta por galón
d) Coeficiente de determinación:
Coeficiente de determinación = R2
PROYECTOS I 2013
2
Σ XY−n∗Xprom∗YpromΣ x2−n∗Xprom2
R=n∑ XY−∑ X∑Y
√n∑ X2−¿¿¿¿
0 5000 10000 15000 20000 250000.00
0.50
1.00
1.50
2.00
2.50
Grafico de Dispersion
Venta Semanal de galones
Prec
io d
e Ve
nta
por
galó
n (e
n U
$$)
Ingeniería de proyectos
R2 = 0.745613197
e) Desviaciones Estándar:
Sx= √ Σ (Xi−Xprom )2n−1
= 5094.659513
Sy= √ Σ (Yi−Yprom )2n−1
= 0.302581486
2.- El gerente general de una planta de producción de materiales de construcción considera que la demanda de embarques de aglomerado puede estar relacionado con el número de permisos de construcción emitidos en el municipio durante el trimestre anterior. El gerente ha recolectado los siguientes datos:
a) Revísese el diagrama de dispersión para ver si los datos pueden ser descritos satisfactoriamente por una ecuación lineal. b) Calcúlese la razón de la variación de los embarques ante una variación de los permisos. c) Determínese una estimación de los embarques cuando el número de permisos de construcción es de 30. d) Calcular la desviación estándar.e) Calcular el coeficiente de correlación.
SOLUCION
a) Revísese el diagrama de dispersión para ver si los datos pueden ser descritos satisfactoriamente por una ecuación lineal:
Diagrama de Dispersión: Y=f(x)X = Permisos de ConstrucciónY = Embarque de Conglomerados
PROYECTOS I 2013
3
Ingeniería de proyectos
5 10 15 20 25 30 35 40 450.00
2.00
4.00
6.00
8.00
10.00
12.00
14.00
16.00
18.00
Grafico de Dispersion
Permisos de Construccion
Emba
rque
de
Cong
lom
erad
os
b) Calcúlese la razón de la variación de los embarques ante una variación de los permisos.
Numero Permisos de Construccion
Embarque de Conglomerados
XY X2 Y2 (Xi-Xprom)2
(yi-yprom)2
X Y1 15 6.00 90 225 36 64 162 9 4.00 36 81 16 196 363 40 16.00 640 1600 256 289 364 20 6.00 120 400 36 9 165 25 13.00 325 625 169 4 96 25 9.00 225 625 81 4 17 15 10.00 150 225 100 64 08 35 16.00 560 1225 256 144 36
TOTAL 184 80.00 2146 5006 950 774 150
XPROM YPROM23.00 10.00
Formulas paramétricas:
b =
b = 0.3953488372 = 0.395
a = Yprom – b*Xprom
a= 0.90698 = 0.915
PROYECTOS I 2013
4
Σ XY−n∗Xprom∗YpromΣ x2−n∗Xprom2
Ingeniería de proyectos
El ajuste lineal será:
Y = 0.915 + 0.395*X (SI SE AJUSTA)
Dónde: X = Permisos Y = Embarques
Y = 0.915 + 0.395*X
dYdX
= 0.395
c) Determínese una estimación de los embarques cuando el número de permisos de construcción es de 30.
Para x = 30
Y = 0.915 + 0.395*X
Y = 0.915 + 0.395*30
Y = 12.76 = 13 embaques
d) Calcular la desviación estándar.
Sx= √ Σ (Xi−Xprom )2n−1
= 9.84 = 10
Sy= √ Σ (Yi−Yprom )2n−1
=4.33 = 5
f) Calcular el coeficiente de correlación.
R = nΣXY−ΣXΣY
√(nΣx2−(Σx ) 2 )∗(nΣy2−(Σy ) 2) = 0.898
Como: -1<R<1 (OK) Se ajusta
PROYECTOS I 2013
5
Ingeniería de proyectos
3.- La población de cierta ciudad tiene el siguiente comportamiento histórico:
a) Realizar el diagrama de dispersión. b) Hallar los parámetros de la tendencia. c) Pronosticar la población en el año 15.
SOLUCION
a) Realizar el diagrama de dispersión.
Diagrama de Dispersión: Y=f(x)X = AñoY = Habitantes
PROYECTOS I 2013
6
Ingeniería de proyectos
0 1 2 3 4 5 6 7 8 9 100.00
200000.00
400000.00
600000.00
800000.00
1000000.00
1200000.00
1400000.00
1600000.00
Grafico de Dispersion
Año
Habi
tant
es
b) Hallar los parámetros de la tendencia.
AÑO HABITANTES
XY X2 Y2 (Xi-Xprom)2
(yi-yprom)2
X Y1 1000000.00 1000000 1 1000000000000 16 225000000002 1020000.00 2040000 4 1040400000000 9 169000000003 1050000.00 3150000 9 1102500000000 4 100000000004 1080000.00 4320000 16 1166400000000 1 49000000005 1120000.00 5600000 25 1254400000000 0 9000000006 1170000.00 7020000 36 1368900000000 1 4000000007 1230000.00 8610000 49 1512900000000 4 64000000008 1300000.00 1040000
064 1690000000000 9 22500000000
9 1380000.00 12420000
81 1904400000000 16 52900000000
45 10350000.00 54560000
285 12039900000000
60 137400000000
XPROM YPROM5.00 1150000.0
0
Formulas paramétricas:
PROYECTOS I 2013
7
Ingeniería de proyectos
b =
b = 46833.3333333333= 46833
a = Yprom – b*Xprom
a= 915833
El ajuste lineal será:
Y = 915833 + 46833*X (SI SE AJUSTA)
Dónde: X = Año Y = Habitantes
Calculo del coeficiente de correlación.
R = nΣXY−ΣXΣY
√(nΣx2−(Σx ) 2 )∗(nΣy2−(Σy ) 2) = 0.978672372
Como: -1<R<1 (OK) Se ajusta
Coeficiente de determinación:
Coeficiente de determinación = R2
R2 = 0.957799612
Calcular la desviación estándar.
Sx= √ Σ (Xi−Xprom )2n−1
= 2.738612788 = 3
Sy= √ Σ (Yi−Yprom )2n−1
= 131053.42 = 131053
c) Pronosticar la población en el año 15.
Para x = 15Y = 915833 + 46833*X Y = 915833 + 46833*15
PROYECTOS I 2013
8
R=n∑ XY−∑ X∑Y
√n∑ X2−¿¿¿¿
Σ XY−n∗Xprom∗YpromΣ x2−n∗Xprom2
Ingeniería de proyectos
Y = 1618328 habitantes
4. ¿CUÁL DE LAS SIGUIENTES SITUACIONES ES INCONSISTENTE?
a) Y = 499 + 0.21X y r = 0.75 b) Y = 100 + 0.9X y r = -0.7 c) Y = -20 + X y r = 0.4 d) Y = -7-4X y r = -0.9
Solución
CORRELACIÓN VALOR O RANGO
Perfecta |R| = 1
Excelente 0.9 <= |R| < 1
Buena 0.8 <= |R| < 0.9
Regular 0.5 <= |R| <0.8
Mala |R|< 0.5
Respuesta: Como se puede apreciar en las ecuaciones anteriores, la alternativa que es inconsistente es la “C” por presentar coeficiente de correlación menor de 0.5, lo cual indica que la correlación es mala.
5. Los ingresos de Telefónica se estiman mediante el Producto Nacional Bruto. La ecuación de regresión es Y = 0.078 + 0.06X en donde el PNB se mide en miles de millones de dólares.
Interprete la pendiente.
Interprete la intersección con Y.
SOLUCION
Asumiendo datos:
X Y
0 0.078
100 60.078
150 90.078
200 120.078
PROYECTOS I 2013
9
Ingeniería de proyectos
250 150.078
300 180.078
0 50 100 150 200 250 300 3500
20
40
60
80
100
120
140
160
180
200
a) Interprete la pendiente
Como la pendiente es positiva (ascendente m =0.06) los ingresos de telefónica van en aumento.
b) Interprete la intersección con Y.
Si comenzó con una inversión de telefónica de 0.078 miles de millones de dólares (inversión) (ano = 0).
6. Considere los datos de la tabla siguiente:
Ventas semanales (en US$) Gastos de publicidad (en US$)1,250.00 41,000.001,380.00 54,000.001,425.00 63,000.00
PROYECTOS I 2013
10
Ingeniería de proyectos
1,425.00 54,000.001,450.00 48,000.001,300.00 46,000.001,400.00 62,000.001,510.00 61,000.001,575.00 64,000.001,650.00 71,000.00
a) ¿Existe una relación significativa entre los gastos de publicidad y las ventas?b) Establezca la ecuación de predicción.c) Pronostique las ventas para un gasto de publicidad de US$50.00.d) ¿Qué porcentaje de los gastos en publicidad explican las variaciones en las ventas?
SOLUCIÓN
a) ¿Existe una relación significativa entre los gastos de publicidad y las ventas?
Diagrama de Dispersión: Y=f(x)X = Gastos en publicidadY = Ventas Mensuales
PROYECTOS I 2013
11
Ingeniería de proyectos
35000 40000 45000 50000 55000 60000 65000 70000 750000
200
400
600
800
1000
1200
1400
1600
1800
Grafico de Dispersion
Gastos de publicidad
Vent
as se
man
ales
Si existe una relación significativa debido a que el grafico de dispersión es muy homogéneo es decir no existe mucha diferencia entre gastos y ventas.
b) Establezca la ecuación de predicción.
NUMERO Gastos de publicidad
Ventas semanales
XY X2 Y2 (Xi-Xprom)2 (yi-yprom)2
PROYECTOS I 2013
12
Ingeniería de proyectos
(en US$) (en US$) X Y1 41000 1250 51250000 1681000000 1562500 237160000 34782.252 54000 1380 74520000 2916000000 1904400 5760000 3192.253 63000 1425 89775000 3969000000 2030625 43560000 132.254 54000 1425 76950000 2916000000 2030625 5760000 132.255 48000 1450 69600000 2304000000 2102500 70560000 182.256 46000 1300 59800000 2116000000 1690000 108160000 18632.257 62000 1400 86800000 3844000000 1960000 31360000 1332.258 61000 1510 92110000 3721000000 2280100 21160000 5402.259 64000 1575 100800000 4096000000 2480625 57760000 19182.25
10 71000 1650 117150000 5041000000 2722500 213160000 45582.25TOTAL 564000 14365.00 818755000 32604000000 20763875 794400000 128552.5
XPROM YPROM
56400 1436.50
Formulas paramétricas:
b =
b = 0.0107867573 = 0.0108
a = Yprom – b*Xprom
a= 828.1268882 = 828.127
El ajuste lineal será:
Y = 828.127 + 0.0108*X (SI SE AJUSTA)
Dónde: X = Año Y = Habitantes
Calculo del coeficiente de correlación.
R = nΣXY−ΣXΣY
√(nΣx2−(Σx ) 2 )∗(nΣy2−(Σy ) 2) = 0.848
PROYECTOS I 2013
13
R=n∑ XY−∑ X∑Y
√n∑ X2−¿¿¿¿
Σ XY−n∗Xprom∗YpromΣ x2−n∗Xprom2
Ingeniería de proyectos
Como: -1<R<1 (OK) Se ajusta
Coeficiente de determinación:
Coeficiente de determinación = R2
R2 =0.719
Calcular la desviación estándar.
Sx= √ Σ (Xi−Xprom )2n−1
= 9395.034
Sy= √ Σ (Yi−Yprom )2n−1
= 119.5140624
c) Pronostique las ventas para un gasto de publicidad de US$50.00.
Para x =50Y = 828.127 + 0.0108*X Y = 828.127 + 0.0108*50 Y = 828.667 Las ventas para un gasto de publicidad de 50.00 dólares serán de 829
dólares.
d) ¿Qué porcentaje de los gastos en publicidad explican las variaciones en las ventas?
Coeficiente de variación
C.V(X) = Sx / Xprom = 0.16657862 = 16.65 %
C.V(Y) = Sx / Xprom = 0.083198094 = 8.31 %
CV (Y) < CV (X)
Esto significa que las ventas semanales son más homogéneas, es decir, tienen menos discrepancia que los gastos en publicidad.
7) En la siguiente tabla se presenta la información de una empresa de órdenes por correo para 12 ciudades:
PROYECTOS I 2013
14
Ingeniería de proyectos
Ciudades Número de Órdenes Recibidas por Correo
Número de Catálogos Distribuidos
A 24,000 6,000B 16,000 2,000C 23,000 5,000D 15,000 1,000E 32,000 10,000F 25,000 7,000G 18,000 15,000H 18,000 3,000I 35,000 11,000J 34,000 13,000K 15,000 2,000L 32,000 12,000
a) Determine si existe una relación lineal significativa entre estas dos variables.b) Determine la línea de regresión.c) Determine el error estándar de la estimación.d) ¿Qué porcentaje de la variación de los datos independientes explica la variación de
los datos dependientes?e) Pronostique las órdenes por correo recibidas cuando se distribuyeron 10,000
catálogos.f) Calcule la varianza explicada para la variable Y.
SOLUCION
a) Determine si existe una relación lineal significativa entre estas dos variables.
0 2,000 4,000 6,000 8,000 10,000 12,000 14,000 16,0000
5,000
10,000
15,000
20,000
25,000
30,000
35,000
40,000
Grafico de Dispersion
Numero de catalogos distribuidos
Num
ero
de o
rden
es re
civid
as p
o co
rreo
PROYECTOS I 2013
15
Ingeniería de proyectos
Para determinar si existe una relación lineal significativa procederemos a ajustar los datos a una tendencia lineal
b) Determine la línea de regresión.Ciudade
sNumer
oNúmero
de CatálogosDistribuido
s
Número de Ordenes
Recibidas por Correo
XY X2 Y2 (Xi-Xprom)2
(yi-yprom)2
X Y
A 1 6,000 24,000 144000000 36000000 576000000 1562500 669421.488
B 2 2,000 16,000 32000000 4000000 256000000 27562500 51578512.4
C 3 5,000 23,000 115000000 25000000 529000000 5062500 33057.8512
D 4 1,000 15,000 15000000 1000000 225000000 39062500 66942148.8
E 5 10,000 32,000 320000000 100000000
1024000000
7562500 77760330.6
F 6 7,000 25,000 175000000 49000000 625000000 62500 3305785.12
G 7 15,000 18,000 270000000 225000000
324000000 60062500 26851239.7
H 8 3,000 18,000 54000000 9000000 324000000 18062500 26851239.7
I 9 11,000 35,000 385000000 121000000
1225000000
14062500 139669421
J 10 13,000 34,000 442000000 169000000
1156000000
33062500 117033058
K 11 2,000 15,000 30000000 4000000 225000000 27562500 66942148.8
PROYECTOS I 2013
16
Ingeniería de proyectos
L 12 12,000 32,000 384000000 144000000
1024000000
22562500 77760330.6
TOTAL 78 87,000 287000.00 2366000000
887000000
7513000000
256250000
655396694
Formulas paramétricas:
b =
b = 1.3626607539 = 1.363
a = Yprom – b*Xprom
a= 13302.5277 = 13302.528
El ajuste lineal será:
Y = 13302.528+ 1.363*X (SI SE AJUSTA)
Dónde: X = Catálogos Y = Ordenes
Calculo del coeficiente de correlación.
R = nΣXY−ΣXΣY
√(nΣx2−(Σx ) 2 )∗(nΣy2−(Σy ) 2) = 0.6995
Como: -1<R<1 (OK) Se ajusta
Coeficiente de determinación:
Coeficiente de determinación = R2
R2 =0.489326238
Calcular la desviación estándar.
PROYECTOS I 2013
R=n∑ XY−∑ X∑Y
√n∑ X2−¿¿¿¿
17
Σ XY−n∗Xprom∗YpromΣ x2−n∗Xprom2
XPROM YPROM
7,250 23181.82
Ingeniería de proyectos
Sx= √ Σ (Xi−Xprom )2n−1
= 4826.536496
Sy= √ Σ (Yi−Yprom )2n−1
= 7680.65259
c) Determine el error estándar de la estimación
S yx = 6863.812365
d) ¿Qué porcentaje de la variación de los datos independientes explica la variación de los datos dependientes?
Coeficiente de variación
C.V(X) = Sx / Xprom = 0.665729172 = 67%
C.V (Y) = Sx / Xprom = 0.332972438 = 33%
Coeficiente de variación
CV (X) < CV (Y)
Esto significa que el número de órdenes son más homogéneas, es decir, tienen menos discrepancia que el número de catálogos distribuidos.
e) Pronostique las órdenes por correo recibidas cuando se distribuyeron 10,000 catálogos.
Para x =10000Y = 13302.528+ 1.363*X Y = 13302.528+ 1.363*10000
Y = 26932.528
PROYECTOS I 2013
18
Ingeniería de proyectos
f) Calcule la varianza explicada para la variable Y.
La desviación estándar de la variable “Y” será el cuadrado de su desviación estándar:
Sy2= Σ (Yi−Yprom )2
n−1 = 59581517.66
PROYECTOS I 2013
19