estadistica inferencial 2 relaciones covarianzas y varianzas

35
IGE ESTADISTICA INFERENCIAL II - GÉNESIS GARCÍA ACOSTA - GUSTAVO REYES SANCHEZ [ESTADISTICA INFERENCIAL II] INGENIERÍA EN GESTIÓN EMPRESARIAL

Upload: genesis-acosta

Post on 11-Jul-2015

4.092 views

Category:

Documents


7 download

TRANSCRIPT

Page 1: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE

ESTADISTICA INFERENCIAL II - GÉNESIS GARCÍA ACOSTA - GUSTAVO REYES SANCHEZ

[ESTADISTICA INFERENCIAL II] INGENIERÍA EN GESTIÓN EMPRESARIAL

Page 2: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 1

EJERCICIO 1 : (RESISTENCIA DEL BRAZO Y LEVANTAMIENTO DINÁMICO)

EL ESTUDIO “Development of LIFTEST, A Dynamic Technique to Assess

Individual Capability to Lift Material” se llevo a cabo, en 1982 en la Virginia

Polytechnic Institute and State University, con objeto de determinar si

ciertas mediciones de la resistencia estética del brazo tenían alguna

influencia en las características de la “elevación dinámica” de un

individuo. Veinticinco individuosse sometieron a pruebas de resistencia y

después se les pidió que llevaran acabo una prueba de levantamiento de

pesas en la cual debía levantar el peso en forma dinámica por encima de

la cabeza. Los datos fueron los siguientes:

Individuo Resistencia del brazo, x Levantamiento dinámico, y

1 17.3 71.7

2 19.3 48.3

3 19.5 88.3

4 19.7 75

5 22.9 91.7

6 23.1 100

7 26.4 73.3

8 26.8 65

9 27.6 75

10 28.1 88.3

11 28.2 68.3

12 28.7 96.7

13 29 76.7

14 29.6 78.3

15 29.9 60

16 29.9 71.7

17 30.6 85

18 31.3 85

19 36 88.3

20 39.5 100

21 40.4 100

22 44.3 100

23 44.6 91.7

24 50.4 100

25 55.9 71.7

Page 3: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 2

A) Diagrama de Dispersión.

B) Determinar cada uno de los coeficientes de la línea y la ecuación de

la línea de regresión.

La ecuación de regresión es

Levantamiento dinámico,

y = 64.5 + 0.561

Resistencia del brazo, x

Predictor Coef SE Coef T P

Constante INTERSECCIÓN (a)64.5078.963 7.20 0.000

Resistencia del brazo, x PENDIENTE (b)0.56140.2747 2.04 0.053

C) Determinar la correlación.

Correlaciones: Resistencia del brazo, x, Levantamiento dinámico, y

Correlación de Pearson de Resistencia del brazo, x y Levantamiento

dinámico,

y = 0.392

6050403020

100

90

80

70

60

50

Resistencia del brazo, x

Le

va

nta

ien

to d

iná

mic

o,

yRegresion Lineal

resistencia del brazo- levantamento dinamico

Page 4: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 3

Nos indica que es una correlación débilmente positiva, es decir, que

prácticamente no hay relación entre la resistencia del brazo y

levantamiento dinámico

D) Determinar coeficiente de determinación.

Resumen Estadísticas de la regresión

Coeficiente de correlación múltiple 0.39200086

Coeficiente de determinación R^2 0.15366467

R^2 ajustado 0.11686749

Error típico 13.2782625

Observaciones 25

E) Determinar la inferencia acerca de los coeficientes (prueba de

hipótesis).

Intersección

Pendiente

1. Datos

2.

3.

4.

5. Región critica

6. Cálculos

Predictor Coef SE Coef T P VIF

Constante 64.507 8.963 7.20 0.000

Resistencia del brazo, x 0.5614 0.2747 2.04 0.053 1.000

S = 13.2783R-cuad. = 15.4%

Como el valor del coeficiente de

determinación es de 0.15 ó 15.36% nos

indica que la variabilidad que se tiene

a la resistencia del brazo da la persona

esta explicada en un 15.36% de cada

lanzamiento dinámico del individuo.

Que indica que si se puede utilizar este

modelo para hacer análisis de

predicción.

H1

H0 H1

Región de aceptación

1- =0.95

Región critica o de

rechazo

Región critica o de

rechazo

Valor de de minitab

para la prueba de

hipótesis

Page 5: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 4

7. Decisión

Como ó con un nivel de significancia de 0.05

se acepta la hipótesis nula y se concluye que es evidente que el valor de la

pendiente es igual a cero.

a) Intervalos de confianza para los parámetros de regresión

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%

Intercepción 64.507261 8.96256421 7.19741131 2.5034E-07 45.9667844 83.0477377

Variable X 1 0.56138443 0.27471392 2.04352382 0.05261908 -0.0069046 1.12967347

(-0.0069046, 1.12967347). Hay una confianza del 95% de que la

pendiente dela regresión poblacional de la resistencia del brazo influye en

la elevación dinámica de un individuo caiga entre -0.0069046 a 1.12967347

que tiene dicha influencia.

(45.9667844, 83.0477377).Hay una confianza el 95% de que la

intersección dela regresión poblacional de la resistencia del brazo influye

en la elevación dinámica de un individuo caiga entre 45.9667844 a

83.0477377.

Se aplica

Valores pronosticados para nuevas observaciones

EE de

Nueva obs Ajuste ajuste IC de 95% IP de 95%

1 81.352.67 (75.82, 86.88) (53.33, 109.37)

Valores de predictores para nuevas observaciones

Resistencia

Nueva obs del brazo, x

1 30.0

(75.82, 86.88).Con una confianza del 95% de que para la respuesta

media población para un valor diferente x0 se pueden obtener los

siguientes límites de confianza para está media 75.82 a 86.88 EE de

Nueva obs Ajuste ajuste IC de 95% IP de 95%

1 81.352.67 (75.82, 86.88)(53.33, 109.37)

(53.33, 109.37). Hay una confianza del 95% que un valor futuro de la

variable aleatoria caiga en 53.33 a 109.37

Para

Para

Page 6: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 5

EE de

Nueva obs Ajuste ajuste IC de 95% IP de 95%

1 81.352.67 (75.82, 86.88) (53.33, 109.37)

Hay una confianza del 95% de que el valor medio de la resistencia

del brazo del individuo sea de 30, caiga entre(75.82, 86.88).

Hay una confianza del 95% de que el valor de la resistencia del brazo

del individuo sea de 30,caiga entre (53.33, 109.37).

F) Análisis de varianza de la línea de regresión del modelo establecido

del problema de la resistencia del brazo teniendo influencia en las

características del levantamiento dinámico de un individuo.

1. Datos

2.

3.

4.

5. Región critica

6. Cálculos

ANÁLISIS DE VARIANZA

Grados de

libertad Suma de

cuadrados Promedio de los

cuadrados F Valor crítico de

F

Regresión 1 736.278142 736.278142

4.1759896 0.05261908

Residuos 23 4055.18186 176.312255 Total 24 4791.46

Análisis de varianza

Fuente GL SC CM F P

Regresión 1 736.3 736.3 4.18 0.053

Error residual 23 4055.2 176.3

Falta de ajuste 22 3986.7 181.2 2.65 0.455

Error puro 1 68.4 68.4

Total 24 4791.5

H1 H0

Región critica o de

rechazo

Región de aceptación

1- =0.95

Page 7: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 6

7. Decisión

Como de Excel ó de minitab, con un

nivel de significancia de 0.05 se rechaza la hipótesis nula y se concluye que

la influencia de la resistencia del brazo con respecto a las características

del levantamiento dinámico depende de la resistencia del brazo.

G) Análisis de residuales

Análisis de los residuales

Observación Pronóstico para Y Residuos Residuos estándares

1 74.2192117 -2.51921173 -0.19380507

2 75.3419806 -27.0419806 -2.08036218

3 75.4542575 12.8457425 0.98823371

4 75.5665344 -0.56653438 -0.04358396

5 77.3629646 14.3370354 1.10296012

6 77.4752415 22.5247585 1.73284851

7 79.3278101 -6.02781009 -0.46372447

8 79.5523639 -14.5523639 -1.11952552

9 80.0014714 -5.00147141 -0.38476738

10 80.2821636 8.01783637 0.61681886

11 80.3383021 -12.0383021 -0.92611665

12 80.6189943 16.0810057 1.23712522

13 80.7874096 -4.08740962 -0.31444784

14 81.1242403 -2.82424028 -0.21727117

15 81.2926556 -21.2926556 -1.6380618

16 81.2926556 -9.59265561 -0.73797102

17 81.6856247 3.31437528 0.25497766

18 82.0785938 2.92140618 0.22474622

19 84.7171007 3.58289933 0.27563544

20 86.6819462 13.3180538 1.02456902

21 87.1871922 12.8128078 0.98570002

22 89.3765915 10.6234085 0.8172677

23 89.5450068 2.15499319 0.16578543

24 92.8010365 7.19896347 0.55382228

25 95.8886509 -24.1886509 -1.86085314

Page 8: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 7

A) Gráfica de Normalidad

Existe una normalidad de los

errores porque están muy cerca

de la línea recta.

B) Histograma de Residuales

Podemos observar que los errores

o residuos no son normales. El

histograma presenta varios picos.

C) Residuales Valores predichos

Se detecta que hay dos datos

anormales porque están bastante

lejos de la media.

Page 9: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 8

D) Residuales Índice de la observación

Se observa tres dato deresiduo

muy grande.

E) Residuales Variable predictora

6050403020

20

10

0

-10

-20

-30

Resistencia del brazo, x

Re

sid

uo

Residuos vs. Resistencia del brazo, x(la respuesta es Levantaiento dinámico, y)

Page 10: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 9

23 filas sin réplica

Resistencia Levantamiento EE de Residuo

Obs del brazo, x dinámico, y Ajuste ajuste Residuo estándar

1 17.3 71.70 74.22 4.64 -2.52 -0.20

2 19.3 48.30 75.34 4.20 -27.04 -2.15 R existe un

punto anormal con respecto a la media de los residuo de la resistencia del brazo.

Resistencia de 19.3 con un residuo de -27.04 estandarizado es de -2.15

3 19.5 88.30 75.45 4.16 12.85 1.02

4 19.7 75.00 75.57 4.12 -0.57 -0.04

5 22.9 91.70 77.36 3.49 14.34 1.12

6 23.1 100.00 77.48 3.46 22.52 1.76

7 26.4 73.30 79.33 2.96 -6.03 -0.47

8 26.8 65.00 79.55 2.91 -14.55 -1.12

9 27.6 75.00 80.00 2.83 -5.00 -0.39

10 28.1 88.30 80.28 2.79 8.02 0.62

11 28.2 68.30 80.34 2.78 -12.04 -0.93

12 28.7 96.70 80.62 2.74 16.08 1.24

13 29.0 76.70 80.79 2.72 -4.09 -0.31

14 29.6 78.30 81.12 2.69 -2.82 -0.22

15 29.9 60.00 81.29 2.68 -21.29 -1.64

16 29.9 71.70 81.29 2.68 -9.59 -0.74

17 30.6 85.00 81.69 2.66 3.31 0.25

18 31.3 85.00 82.08 2.66 2.92 0.22

19 36.0 88.30 84.72 2.97 3.58 0.28

20 39.5 100.00 86.68 3.51 13.32 1.04

21 40.4 100.00 87.19 3.67 12.81 1.00

22 44.3 100.00 89.38 4.48 10.62 0.85

23 44.6 91.70 89.55 4.55 2.15 0.17

24 50.4 100.00 92.80 5.92 7.20 0.61

25 55.9 71.70 95.89 7.30 -24.19 -2.18 RX hay una

graninfluencia

R denota una observación con un residuo estandarizado grande.

X denota una observación cuyo valor X le concede gran apalancamiento.

Se detectaron 2 puntos anormales debido a que el valor 2 de la resistencia

del brazo es de 19.3 presenta un residuo de -27.04, lo cual es muy grande

además esta el otro valor número 25 con resistencia del brazo 55.9 el

residuo es de -24.19 en el cual indica que hay una gran influencia debido a

que se presenta un cambio muy significativo.

Page 11: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 10

EJERCICIO 6,381 (EXAMEN DE UBICACIÓN Y CALIFICACIÓN DE CURSO)

Se aplica una prueba de ubicación de matemáticas a todos los alumnos

de primer grado que están ingresando a una institución de enseñanza

superior. No se admiten a los que obtienen una calificación inferior a 35 en

el curso regular de matemáticas y se les coloca en una clase de

regularización. Las calificaciones del examen de ubicación y den examen

final de 20 estudiantes que tomaron el curso regular fueron las siguientes:

Examen de ubicación (x) Calificación de curso (y)

50 53

35 41

35 61

40 56

55 68

65 36

35 11

60 70

90 79

35 59

90 54

80 91

60 48

60 71

60 71

40 47

55 53

50 68

65 57

50 79

Page 12: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 11

A) Gráfica de dispersión

90807060504030

90

80

70

60

50

40

30

20

10

0

exámen de ubicación

ca

lific

ació

n d

el cu

rso

ejercicio de regresión lineal simple y correlaciónexamen de ubicación-calificación del curso

Uno de los de los datos se encuentra mayormente disperso de la

línea de regresión.

B) Determinación del coeficiente de la línea y de la ecuación de la

línea de regresión lineal simple.

Ecuación de regresión:

La ecuación de regresión lineal simple es

Calificación del curso y = 32.5 + 0.471 examen de ubicación

Donde:

El valor de la intercepción (a) = 32.5

El valor de la pendiente (b) = 0.471

Page 13: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 12

Predictor coeficiente Coeficiente de EE T P VIF

Constante 32.5 12.64 2.57 0.019

Examen de ubicación 0.4711 0.2182 2.16 0.045 1.000

Interpretación de la intercepción (a): El valor promedio de las

calificaciones del curso cuando la variable de predicción (examen de

ubicación) es cero es de 32.5

Intercepción de la pendiente (b): El cambio promedio en las calificaciones

del curso ocurrirá con el incremento de la variable predictora (examen de

ubicación) en un 0.0471

C) Correlación de Pearson de examen de ubicación y calificación del

curso

Los datos que arroja el minitab, respecto a este inciso y = 0.454 por lo

tanto se concluye que:

Como el valor de la correlación es de 0.454, indica que es débilmente

positiva y por lo tanto la calificación del examen de ubicación del alumno

no significara que este dentro del curso regular.

D) Determinación del coeficiente de determinación

S = 16.1747 R-cuad. = 20.6% R-cuad.(ajustado) = 16.2%

Como el valor del coeficiente de determinación es de 20.6% nos indica

que la variabilidad que se tiene de la calificación del alumno esta

explicada en un 20.6% por su relación lineal que tiene con el examen de

ubicación, por lo tanto no hay una buena asociación para hacer el análisis

de predicción.

.

Page 14: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 13

E) Inferencia acerca de los coeficientes, prueba de hipótesis

intersección

1. Datos

2. H0: β=0

3. H1:β≠0

4. α=0.0.5

5. region critica

6. cálculos

Predictor Coef SE Coef T P VIF

Constante 32.51 12.64 2.57 0.019

examen de ubicación, x 0.4711 0.2182 2.16 0.045 1.000

Del programa de Minitab tomaremos el dato del valor de P

para realizar el análisis de la hipótesis nula.

Valor P = 0.045

α= 0.05

Como el valor de P (0.045) es menor que el nivel de significancia (α=

0.05) la hipótesis nula se rechaza. Por lo tanto el valor de la pendiente es

diferente a cero.

Valor de de minitab

para la prueba de

hipótesis

Page 15: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 14

Como tR= 2.16 y este es mayor a ttabla=2.101 con un nivel de

significancia de 0.05 se rechaza la H0 y se concluye que la evidencia

demuestra que la pendiente es diferente de cero.

F) Intervalos de confianza para los parámetros de regresión

INTERVALO DE CONFIANZA PARA Β (dato tomado de los cálculos hechos

en Excel)

Hay una confianza de 95% de que la pendiente de la regresión

poblacional de la calificación del curso respecto al examen de ubicación

caiga entre:

(0.0126448, 0.92948441)

INTERVALO PARA (dato tomado de los cálculos hechos en Excel)

Aceptación

Rechazo Rechazo

tR =2.16 tR =2.16

Ttabla =-2.101 Ttabla =2.101

Page 16: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 15

Hay una confianza de 95% de que la intercepción de la regresión

poblacional de la calificación del curso respecto al examen de ubicación

caiga entre:

(5.95315676, 59.0586722)

INTERVALO PARA EL VALOR MEDIO DE (dato tomado de minitab)

v=n-2

Hay una confianza de 95% de que para la respuesta media poblacional

para un valor diferente (X0) se pueden obtener los siguientes limites de

confianza para esta media: (53.8428 , 70.5232)

INTERVALO DE PREDICCIÓN PARA YO (dato tomado de minitab)

v=n-2

Hay una confianza del 95% de que un valor futuro de la variable aleatoria

caiga en este rango: (27.1926, 97.1734)

Conclusión:

Hay un 95% de confianza de que el valor medio de todas la

calificaciones de 63 caigan entre (53.8428, 70.5232)

Hay un 95% de confianza de que la calificación de un alumno sea

de 63 caiga entre (27.1926, 97.1734)

G) Análisis de varianza

1. datos anteriores

2. Ho:β=0

3. H1:β≠0

4. α =0.05

5. Regresión critica

Page 17: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 16

6. Cálculos.

Fuente GL SC MC F P

Regresión 1 1219.4 1219.4 4.66 0.045

Error residual 18 4709.2 261.6

Falta de ajuste 6 1688.5 281.4 1.12 0.408

Error puro 12 3020.7 251.7

Total 19 5928.5

F0.05 (1,18) = 4.41

Como 4.66 (FR) › 4.41 (F0.05 (1,18) con un nivel de significancia de 0.05 se

rechaza la H0 y se concluye que las calificaciones del alumno podrían

depender del examen de ubicación del alumno.

H) Análisis residual

exámen de calificación Ajuste Residuo

Obs ubicación del curso Ajuste SE Residuo estándar

1 50.0 53.00 56.06 3.81 -3.06 -0.19

2 35.0 41.00 48.99 5.75 -7.99 -0.53

3 35.0 61.00 48.99 5.75 12.01 0.79

4 40.0 56.00 51.35 4.95 4.65 0.30

5 55.0 68.00 58.41 3.62 9.59 0.61

6 65.0 36.00 63.13 4.17 -27.13 -1.74

7 35.0 11.00 48.99 5.75 -37.99 -2.51R

8 60.0 70.00 60.77 3.75 9.23 0.59

9 90.0 79.00 74.90 8.35 4.10 0.30

10 35.0 59.00 48.99 5.75 10.01 0.66

11 90.0 54.00 74.90 8.35 -20.90 -1.51

12 80.0 91.00 70.19 6.45 20.81 1.40

13 60.0 48.00 60.77 3.75 -12.77 -0.81

14 60.0 71.00 60.77 3.75 10.23 0.65

15 60.0 71.00 60.77 3.75 10.23 0.65

16 40.0 47.00 51.35 4.95 -4.35 -0.28

Page 18: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 17

17 55.0 53.00 58.41 3.62 -5.41 -0.34

18 50.0 68.00 56.06 3.81 11.94 0.76

19 65.0 57.00 63.13 4.17 -6.13 -0.39

20 50.0 79.00 56.06 3.81 22.94 1.46

Se determina que existe un dato en los residuos que presenta anormalidad

ya que se encuentra alejado de la media del examen de ubicación.

I) Gráficas de residuos

1. Gráfica de normalidad

40200-20-40

99

90

50

10

1

Residuo

Po

rce

nta

je

706050

20

0

-20

-40

Valor ajustado

Re

sid

uo

20100-10-20-30-40

8

6

4

2

0

Residuo

Fre

cu

en

cia

2018161412108642

20

0

-20

-40

Orden de observación

Re

sid

uo

Gráfica de probabilidad normal vs. ajustes

Histograma vs. orden

Gráficas de residuos para calificación del curso

Se concluye que hay normalidad ya que los puntos se encuentran

cerca de la recta.

Page 19: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 18

2. Histograma de residuales 40200-20-40

99

90

50

10

1

Residuo

Por

cent

aje

706050

20

0

-20

-40

Valor ajustado

Res

iduo

20100-10-20-30-40

8

6

4

2

0

Residuo

Frec

uenc

ia

2018161412108642

20

0

-20

-40

Orden de observación

Res

iduo

Gráfica de probabilidad normal vs. ajustes

Histograma vs. orden

Gráficas de residuos para calificación del curso

Como el pico no se encuentra en el centro se concluye que no hay

normalidad

3. Residuales vs valores predichos

40200-20-40

99

90

50

10

1

Residuo

Po

rce

nta

je

706050

20

0

-20

-40

Valor ajustado

Re

sid

uo

20100-10-20-30-40

8

6

4

2

0

Residuo

Fre

cue

nci

a

2018161412108642

20

0

-20

-40

Orden de observación

Re

sid

uo

Gráfica de probabilidad normal vs. ajustes

Histograma vs. orden

Gráficas de residuos para calificación del curso

Como en esta gráfica hay datos que se encuentran bastantes alejados

en el sentido vertical, por lo tanto hay datos anormales. Entonces la

varianza de los errores no es constante a la variable de respuesta.

Page 20: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 19

4. Gráfica residuales vs el índice de la observación

40200-20-40

99

90

50

10

1

Residuo

Po

rce

nta

je

706050

20

0

-20

-40

Valor ajustado

Re

sid

uo

20100-10-20-30-40

8

6

4

2

0

Residuo

Fre

cu

en

cia

2018161412108642

20

0

-20

-40

Orden de observación

Re

sid

uo

Gráfica de probabilidad normal vs. ajustes

Histograma vs. orden

Gráficas de residuos para calificación del curso

Como hay datos residuales más haya de -2 o -20 es considerado un punto

fuera en el sentido vertical. Por lo tanto se considera un dato anormal.

5. Residuales vs variable predictora

90807060504030

30

20

10

0

-10

-20

-30

-40

exámen de ubicación

Re

sid

uo

Residuos vs. exámen de ubicación(la respuesta es calificación del curso)

Se determina que existen un punto que presentan anormalidad en

respecto al valor del promedio del examen de ubicación por lo tanto

podría decirse que la varianza de los errores no es constante con respecto

a la variable predictora.

Debido a que el valor del dato 7 presenta un residuo respecto a la media

es de -37.9932 el cual es muy grande respecto al valor de la media de los

residuos del examen de ubicación.

Page 21: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 20

El departamento de personal de una empresa utilizo a dos individuos en un

estudio para determinar la relación entre su comportamiento hacia el

trabajo (y) y las calificaciones de 1 prueba. Los datos son los siguientes:

No y x y xy

1

2

3

4

5

6

7

8

9

10

11

12

11.2

14.5

17.2

17.8

19.3

24.5

21.2

16.9

14.8

20.0

13.2

22.5

56.5

59.5

69.2

74.5

81.2

88.0

78.2

69.0

58.1

80.5

58.3

84.0

3192.25

3540.25

4788.64

5550.25

6593.44

7744

6115.24

4761

3375.61

6480.25

3398.89

7056

125.44

210.25

295.84

316.84

372.49

600.25

449.44

285.61

219.04

400

174.24

506.25

632.8

862.75

1190.24

1326.1

1567.16

2156

1657.84

1166.1

859.88

1610

769.56

1890

213.1 857 62, 595.82 3, 955.69 15, 688.43

Prom. 17.75833333 71.4166667 5216.31833 329.640833 1, 307.36917

H) Diagrama de Dispersión.

Page 22: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 21

I) Determinar cada uno de los coeficientes de la línea.

La ecuación de regresión es

y = - 6.17 + 0.335 x1

Predictor Coef Coef. de EE T P

Constante -6.167 2.186 -2.82 0.018“a” intersección

x1 0.33466 0.03027 11.06 0.000 “b” pendiente.

- Interpretación de la intersección (a): si tuviéramos unacalificación de

0 su comportamiento promedio sería de

Interpretación de la pendiente (b): El valor de b=.3373758445 indica

que por cada punto que aumenta la calificación, el aumento de

comportamiento hacia el trabajo será en unos .33373758445 puntos.

J) Determinar la correlación.

y = 0.961

- Interpretación: como la correlación tiene un valor de 0.961nos está

indicando una correlación medianamente positiva y nos indica que

cuando aumenta las calificaciones del trabajo se espera que

aumente el trabajo.

Page 23: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 22

K) Determinar coeficiente de determinación.

Estadísticas de la regresión

Coeficiente de correlación múltiple 0.34078049

Coeficiente de determinación R^2 0.11613134

R^2 ajustado 0.02774448

Error típico 3.55518239

Observaciones 12

Interpretación: como el valor del coeficiente de determinación es de .1161 nos

dice que la variabilidad que se tiene de las calificaciones, se explica en un 11.61%

del comportamiento de cada individuo.

Se indica que se puede utilizar dicho modelo para hacer el análisis de predicción.

L) Determinar la inferencia acerca de los coeficientes.

Prueba de Hipótesis

1. Datos

2. Ho:

3. H1:

4.

5. Región Crítica

6. Cálculos Predictor Coef Coef. de EE T P VIF

Constante -6.167 2.186 -2.82 0.018

x1 0.33466 0.03027 11.060.000 1.000

(valor de minitab tr)

S = 1.12928R-cuad. = 92.4%

H

ÁREA RECHAZADA H1

ÁREA RECHAZADA

H0 REGIÓN DE

ACEPTACIÓN.

T= -2.179 T= 2.179 T= 0

Page 24: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 23

Valor P = 0.000

Como el valor de P=0.000 es menor que el nivel de

significancia de 0.05 la H0 se rechaza y por lo tanto el

valor de la pendiente es diferente de CERO

M) Intervalos de confianza para los parámetros de regresión.

- Intervalo de confianza para

Hay una confianza de 95% de que la pendiente de la regresión poblacional del

precio del auto respecto a los años de uso caiga entre:

(-0.29379964,0.9163594)

- Intervalo de confianza para

- Hay una confianza de 95% de que la intercepción de la regresión poblacional del precio del auto respecto a los años de uso caiga entre:

(-10.013644,11.9580201)

- Intervalo de confianza para

Hay una confianza de 95% de que para la respuesta media poblacional para un

valor diferente (X0) se pueden obtener los siguientes límites de confianza para

esta media

(16.5266,17.9918)

Page 25: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 24

Intervalo de predicción para

Hay una confianza del 95% de que un valor futuro de la variable aleatoria caiga

en este rango:

(14.6385 19.8799)

Conclusión: Hay un 95% de confianza de que el valor medio de que las calificaciones de los individuos caigan entre

(16.5266,17.9918)

Hay un 95% de confianza de que el valor de que las calificaciones de los individuos caigan entre

(14.6385 19.8799)

G)

1. datos anteriores

2. Ho:β=0

3. H1:β≠0

4. α =0.05

5. Regresión critica

ACEPTACIÓN

CRÍTICA O RECHAZO

H1 H0

Page 26: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 25

6 CÁLCULOS.

Fuente de

variación

Suma de

cuadrados

Cuadrados

medios

Grados de

libertad

F calculada

Regresión 16.6067818

158.4108917 1 1.313898173

Error 126.393218

1.2978275 10

total 143

11

Interpretación: Como 1.313898173<4.96con un nivel de significancia de 0.05

se acepta la hipótesis nula y concluimos que las fluctuaciones aleatorias

del precio del comportamiento hacia el trabajo depende de las

calificaciones de las pruebas.

h) Análisis residual

Observación Pronóstico

para Y Residuos Residuos estándares

1 4.45852276 -3.458522758 -1.02029344

2 5.48574638 -3.485746376 -1.028324638

3 6.32620206 -3.326202065 -0.981257718

4 6.51297 -2.512969995 -0.741347385

5 6.97988982 -1.979889822 -0.584084229

6 8.59854522 -2.598545221 -0.7665928

7 7.5713216 -0.571321602 -0.168544701

8 6.2328181 1.767181901 0.521333595

9 5.57913034 3.420869658 1.009185458

10 7.19778574 2.802214259 0.826676887

11 5.08108253 5.918917473 1.746130673

12 7.97598545 4.024014548 1.187118297

No hay algún dato en los residuos que presente anormalidad.

Page 27: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 26

i) Gráficas

Gráfica de normalidad: no encontramos dentro de la gráfica datos que se

encuentren muy lejanos.

Gráfica de residuales: En ésta gráfica hay algunos picos más altos

Gráfica de residuales vs valores predictores Al visualizar la gráfica

observamos que algunos puntos si están algo alejados , por lo que hay

algunos datos anormales

Residuales Vs índice de observación

210-1-2

99

90

50

10

1

Residuo

Po

rce

nta

je

2220181614

2

1

0

-1

-2

Valor ajustado

Re

sid

uo

1.51.00.50.0-0.5-1.0-1.5

3

2

1

0

Residuo

Fre

cu

en

cia

121110987654321

2

1

0

-1

-2

Orden de observación

Re

sid

uo

Gráfica de probabilidad normal vs. ajustes

Histograma vs. orden

Gráficas de residuos para y

Page 28: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 27

En un estudio acerca de la cantidad de precipitación pluvial y la cantidad

de contaminación de aire eliminada, se obtuvieron los siguientes datos:

No. Lluvia

diaria, x

(0.01 cm)

Partículas

elim, y mlg

por m3

1

2

3

4

5

6

7

8

9

4.3

4.5

5.9

5.6

6.1

5.2

3.8

2.1

7.5

126

121

116

118

114

118

132

141

108

18.49

20.25

34.81

31.36

37.21

27.04

14.44

4.41

56.25

15876

14641

13456

13924

12996

13924

17424

19881

11664

541.8

544.5

684.4

660.8

695.4

613.6

501.6

296.1

810

45 1094 244.26 133786 5348.2

Prom. 5 121.555556 27.14 14865.1111 594.244444

A) Diagrama de Dispersión.

Page 29: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 28

B) Determinar cada uno de los coeficientes de la línea.

y = 153.2768249 + (-6.34425377)

- Interpretación de la intersección (a)

El valor de (a) indica que la cantidad promedio de precipitación

pluvial en relación con la cantidad de contaminación de aire

eliminada se encuentra en unos 153.175 miligramos por metros

cúbicos.

- Interpretación de la pendiente (b)

El valor de indica que por cada 0.01 cm de Lluvia diaria

adicional, las partículas eliminadas miligramos por metro cúbico

disminuirá en -6.340

Page 30: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 29

C) Determinar la correlación.

- Interpretación: como la correlación tiene un valor de nos está

indicando una correlación fuertemente negativa y por lo tanto la

cantidad de lluvia diaria es negativamente relacionado con las

partículas eliminadas.

D) Determinar coeficiente de determinación.

- Interpretación: como el valor del coeficiente de determinación es

del 95.8%nos indica que la variabilidad que se tiene de las lluvias

diarias esta explicada en un 95.8% por su relación lineal que tiene

con las partículas eliminadas mlg por metro cúbico, por lo tanto

existe una buena asociación para hacer el análisis de predicción.

Page 31: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 30

E) Determinar la inferencia acerca de los coeficientes.

Prueba de Hipótesis

1. Datos

2. Ho:

3. H1:

4.

5. Región Crítica

6. Cálculos

Predictor Coef SE Coef T P VIF

Constante 153.175 2.615 58.58 0.000

Lluvia diaria, x (0.01 cm) -6.3240 0.5019 -12.60 0.000 1.000

(valor de minitab tr)

7. Cálculos

H

ÁREA RECHAZADA H1

ÁREA RECHAZADA

H0 REGIÓN DE

ACEPTACIÓN.

T= -2.385 T= 2.385 T= 0

Page 32: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 31

8. Conclusión

Como Tr = -12.60 y este es menorr a con un nivel de

significancia de 0.05 se rechazala hipótesis nula y se concluye que el

valor de la pendiente difiere de 0.

F) Intervalos de confianza para los parámetros de regresión.

INTERVALO DE CONFIANZA PARA Β (dato tomado de los cálculos hechos

en Excel)

Hay una confianza de 95% de que la pendiente de la regresión

poblacional de la calificación del curso respecto al examen de ubicación

caiga entre:

(0.0126448, 0.92948441)

INTERVALO PARA (dato tomado de los cálculos hechos en Excel)

Hay una confianza de 95% de que la intercepción de la regresión

poblacional de la calificación del curso respecto al examen de ubicación

caiga entre:

(5.95315676, 59.0586722)

Page 33: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 32

INTERVALO PARA EL VALOR MEDIO DE (dato tomado de minitab)

v=n-2

Hay una confianza de 95% de que para la respuesta media poblacional

para un valor diferente (X0) se pueden obtener los siguientes limites de

confianza para esta media: (53.8428 , 70.5232)

INTERVALO DE PREDICCIÓN PARA YO (dato tomado de minitab)

v=n-2

Hay una confianza del 95% de que un valor futuro de la variable aleatoria

caiga en este rango: (27.1926, 97.1734)

Conclusión:

Hay un 95% de confianza de que el valor medio de todas la

calificaciones de 63 caigan entre (53.8428, 70.5232)

Hay un 95% de confianza de que la calificación de un alumno sea

de 63 caiga entre (27.1926, 97.1734)

I) Análisis de varianza

7. datos anteriores

8. Ho:β=0

9. H1:β≠0

10. α =0.05

11. Regresión critica

Page 34: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 33

12. Cálculos.

Fuente GL SC MC F P

Regresión 1 1219.4 1219.4 4.66 0.045

Error residual 18 4709.2 261.6

Falta de ajuste 6 1688.5 281.4 1.12 0.408

Error puro 12 3020.7 251.7

Total 19 5928.5

F0.05 (1,18) = 4.41

Como 4.66 (FR) › 4.41 (F0.05 (1,18) con un nivel de significancia de 0.05 se

rechaza la H0 y se concluye que las calificaciones del alumno podrían

depender del examen de ubicación del alumno.

J) Análisis residual

Lluvia Partículas

diaria, x elim, y EE de Residuo

Obs (0.01 cm) mlg por m3 Ajuste ajuste Residuo estándar

1 4.30 126.000 125.982 0.814 0.018 0.01

2 4.50 121.000 124.718 0.776 -3.718 -1.80

3 5.90 116.000 115.864 0.862 0.136 0.07

4 5.60 118.000 117.761 0.794 0.239 0.12

5 6.10 114.000 114.599 0.919 -0.599 -0.30

6 5.20 118.000 120.291 0.741 -2.291 -1.10

7 3.80 132.000 129.144 0.950 2.856 1.44

8 2.10 141.000 139.895 1.630 1.105 0.75

9 7.50 108.000 105.746 1.454 2.254 1.36

Page 35: Estadistica inferencial 2 Relaciones covarianzas y varianzas

IGE [ESTADISTICA INFERENCIAL II]

ESTADISTICA INFERENCIAL II |EQUIPO 4 34

G) Gráficas

5.02.50.0-2.5-5.0

99

90

50

10

1

Residuo

Po

rce

nta

je

140130120110

2

0

-2

-4

Valor ajustado

Re

sid

uo

3210-1-2-3-4

3

2

1

0

Residuo

Fre

cu

en

cia

987654321

2

0

-2

-4

Orden de observación

Re

sid

uo

Gráfica de probabilidad normal vs. ajustes

Histograma vs. orden

Gráficas de residuos para Partículas elim, y mlg por m3

Gráfica de normalidad: no encontramos dentro de la gráfica datos que se

encuentren muy lejanos.

Gráfica de residuales: En ésta gráfica solo en el intervalo de cero hay una

frecuencia un poco menor de 3

Gráfica de residuos vs ajustes:

Gráfica de residuos vs orden de observación: