analisis de varianzas

108
ANALISIS DE LAS VARIANZAS William Jaime León Velásquez UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS ESTADISTICA INDUSTRIAL FACULTAD DE INGENIERIA INDUSTRIAL SESION 04

Upload: william-leon

Post on 02-Jul-2015

436 views

Category:

Education


1 download

TRANSCRIPT

Page 1: ANALISIS DE VARIANZAS

ANALISIS DE LAS

VARIANZAS

William Jaime

León Velásquez

UNIVERSIDAD NACIONAL MAYOR DE

SAN MARCOS

ESTADISTICA

INDUSTRIAL

FACULTAD DE INGENIERIA INDUSTRIAL

SESION 04

Page 2: ANALISIS DE VARIANZAS
Page 3: ANALISIS DE VARIANZAS

NOTA:

Para

cambiar la

imagen de

esta

dispositiva

,

seleccione

la imagen

y

elimínela.

A

continuaci

ón haga

clic en el

icono

Imágenes

en el

marcador

de

posición e

inserte su

imagen.

Page 4: ANALISIS DE VARIANZAS

Prueba de medias de mas de dos muestras a través de la comparación de dos varianzas poblacionales Otro uso de la distribución F es el análisis de la técnica de la varianza (ANOVA), en la cual se comparan tres o más medias poblacionales para determinar si pueden ser iguales.

Ing. William león Velásquez 4

Page 5: ANALISIS DE VARIANZAS

Suposiciones en el análisis de la varianza (ANOVA)

5

•Para emplear ANOVA se supone lo siguiente:

• Las poblaciones siguen la distribución

normal.

• Las poblaciones tienen desviaciones

estándar iguales (σ).

• Las poblaciones son independientes.

Ing. William león Velásquez

Page 6: ANALISIS DE VARIANZAS

El análisis de la varianza (ANOVA)

6

ANOVA se desarrolló para aplicaciones en agricultura, y aún se emplean muchos de los términos relacionados con ese contexto. En particular, con el término tratamiento se identifican las poblaciones diferentes que se examinan.

• ANOVA permite comparar las medias de tratamiento de forma simultánea y evitar la acumulación del error tipo I.

Ing. William león Velásquez

Page 7: ANALISIS DE VARIANZAS

Se utiliza para determina si una población tiene mas variación que otra, o si es deseable

validar un supuesto respecto a una prueba estadística

Procedimiento:

Primero se establece la hipótesis nula.

Esta hipótesis es que la varianza de una

población normal, σ21 , es igual a la

varianza de otra población σ22 también

normal, …… es igual a la varianza de otra población σ2

i también normal .

Procedimiento

Ing. William león Velásquez 7

Page 8: ANALISIS DE VARIANZAS

La hipótesis alternativa podría ser que las varianzas difieren.

La hipótesis nula y la hipótesis alternativa

son:

Procedimiento

Ing. William león Velásquez 8

iH 2......2212:0

iH 2......2212:1

Page 9: ANALISIS DE VARIANZAS

Procedimiento

•El Valor Estadístico de Prueba para la Comparación de dos Varianzas estará dada por la siguiente relación:

Ing. William león Velásquez 9

mnE

mT

S

SF

2

1

2

Page 10: ANALISIS DE VARIANZAS

EJEMPLO DIDACTICO

10

El gerente de un centro financiero, desea comparar la productividad, medida por el número de clientes atendidos entre tres empleados. Selecciona cuatro días en forma aleatoria y registra el número de clientes atendidos por cada empleado. Los resultados son

Ejemplo:

Ing. William león Velásquez

Walter Willy Kike

Page 11: ANALISIS DE VARIANZAS

11

¿Hay alguna diferencia en el número de clientes atendidos?

En la siguiente gráfica se ilustrará cómo pueden aparecer las poblaciones si hubiera una diferencia en las medias del tratamiento.

Ing. William león Velásquez

EJEMPLO DIDACTICO

Page 12: ANALISIS DE VARIANZAS

12

Observe que las poblaciones en la gráfica de la izquierda siguen la distribución normal y la variación en cada población es la misma. Sin embargo, las medias no son iguales.

Suponer que las poblaciones son iguales es decir que no hay diferencia en las medias (tratamiento). Estos se muestra en la gráfica de la derecha. Observe que las poblaciones siguen la distribución normal y la variación en cada población es la misma.

Ing. William león Velásquez

Kike

Kike

Walter

Walter

Willy

Willy

Servicio al cliente

Servicio al cliente

EJEMPLO DIDACTICO

Page 13: ANALISIS DE VARIANZAS

La prueba ANOVA

13

•Si desea determinar si varias medias muestrales provienen de una sola población o de poblaciones con medias diferentes. Lo que se hace en realidad, es que estas medias muestrales se comparan mediante sus varianzas.

•Una de las suposiciones para aplicar la prueba ANOVA fue que la desviación estándar de las diversas poblaciones normales tenían que ser las mismas. Se aprovecha este requisito en la prueba ANOVA.

Ing. William león Velásquez

Page 14: ANALISIS DE VARIANZAS

La prueba ANOVA

14

•La estrategia es estimar la varianza de la población de dos formas y después determinar la razón de dichos estimados.

•Si esta razón es aproximadamente 1, entonces por lógica los dos estimados son iguales, y se concluye que las medias poblaciones son iguales.

La distribución F sirve como un árbitro al indicar en que instancia la razón de las varianzas muestrales es mucho mayor que 1 para haber ocurrido por casualidad.

Ing. William león Velásquez

Page 15: ANALISIS DE VARIANZAS

La prueba ANOVA

Ing. William león Velásquez 15

VARIACIÓN TOTAL (SS) Suma de las diferencias elevadas al cuadrado entre cada observación y la media global

Se definirá algunos conceptos que nos ayudaran en problemas posteriores, a través del ejemplo planteado

Page 16: ANALISIS DE VARIANZAS

Ing. William león Velásquez 16

58GX

La variación total del ejemplo:

• Se calcula la media global de las 12 observaciones:

• (55+54+59+56+66+76+67+71+47+51+46+48)/12 = 58

EJEMPLO DIDACTICO

Page 17: ANALISIS DE VARIANZAS

•Después, para cada una de las 12 observaciones se encuentra la diferencia entre el valor particular y la media global. Cada una de estas diferencias se eleva al cuadrado y estos cuadrados se suman, este resultado es la variación total,

SS= 1082.

(55-58)2+(54-58)2+(59-58)2+(56-58)2+

(66-58)2+(76-58)2+(67-58)2+(71-58)2+

(47-58)2+(51-58)2+(46-58)2+(48-58)2=

Ing. William león Velásquez 17

EJEMPLO DIDACTICO

Page 18: ANALISIS DE VARIANZAS

•Luego se divide esta variación total en dos componentes: la que se debe a los tratamientos y la que es aleatoria.

Para encontrar estas dos componentes, se determina la media de cada tratamiento.

La primera fuente de variación se debe a los tratamientos.

SS = SST + SSE

Ing. William león Velásquez 18

SS: Suma de cuadrados SST: Suma de cuadrados de los tratamientos SSE: Suma de cuadrados del error

EJEMPLO DIDACTICO

Page 19: ANALISIS DE VARIANZAS

La prueba ANOVA

19

VARIACIÓN DE TRATAMIENTO (SST) Suma de las diferencias elevadas al cuadrado entre la media de cada tratamiento y la media global

Ing. William león Velásquez

Page 20: ANALISIS DE VARIANZAS

20

•En el ejemplo, la variación debida a los tratamientos es la

suma de las diferencias al cuadrado entre la media de cada

empleado y la media global.

•Para calcularlo, primero se encuentra la media de cada uno

de los tres tratamientos.

Ing. William león Velásquez

La media de Walter es 56, determinada por

(55 + 54 + 59 + 56)/4.

La media de Willy es son 70 determinada por:

(66 + 76 + 67 + 71)/4.

La media de Kike es 48 determinada por:

(47 + 51 + 46 + 48)/4.

EJEMPLO DIDACTICO

Page 21: ANALISIS DE VARIANZAS

21

La suma de los cuadrados debida a los tratamientos es:

(56 – 58)2 +(56 – 58)2 + … + (48 – 58)2 =

4(56 – 58)2 + 4(70 – 58)2 + 4(48 – 58)2 = 992

Si existe una variación considerable entre las medias de los tratamientos, es lógico que este término sea grande.

El valor más bajo posible es cero. Esto ocurrirá cuando todas las medias de los tratamientos sean iguales.

SST = 992

Ing. William león Velásquez

EJEMPLO DIDACTICO

Page 22: ANALISIS DE VARIANZAS

La prueba ANOVA

•La otra fuente de variación se le conoce como componente

aleatoria o componente de error.

VARIACIÓN ALEATORIA (SSE) Suma de las diferencias elevadas al cuadrado entre cada observación y su media de tratamiento.

Ing. William león Velásquez 22

Page 23: ANALISIS DE VARIANZAS

• En el ejemplo, este término es la suma de las diferencias al

cuadrado entre cada valor y la media para ese empleado

en particular.

SSE=(55 – 56)2 +(54 – 56)2 + … + (46 – 48)2+(48 – 48)2 = 90

La variación de error es de 90.

SSE = 90

Walter es 56 Willy es 70 Kike es 48

Ing. William león Velásquez 23

EJEMPLO DIDACTICO

Page 24: ANALISIS DE VARIANZAS

•En resumen:

La suma de la diferencia entre el valor particular y la media global elevado al cuadrado es la variación total, y es igual 1082.

La suma de los cuadrados debida a los

tratamientos es 992

La variación de error es de 90.

Por lo tanto:

SS = SST + SSE

1082 = 992 + 90 Ing. William león Velásquez 24

EJEMPLO DIDACTICO

Page 25: ANALISIS DE VARIANZAS

La prueba ANOVA

El estadístico de prueba, que es la razón de los dos estimados de la varianza poblacional, se determina a partir de la siguiente ecuación:

Ing. William león Velásquez 25

Page 26: ANALISIS DE VARIANZAS

La prueba ANOVA

Ing. William león Velásquez 26

Diferencias dentro de cada grupos

Diferencia entre grupos

mnE

mT

S

SF

2

1

2

Page 27: ANALISIS DE VARIANZAS

El primer estimado de la varianza poblacional entre los tratamientos, es decir, de la diferencia entre las medias. Éste es 992/2.

¿Por qué se divide entre 2?

Recuerde que para encontrar una varianza muestral , se divide entre el número de observaciones menos uno (n-1).

En este caso hay 3 tratamientos por lo que se divide entre 2.

El primer estimado poblacional es 992/2.

Ing. William león Velásquez 27

Entre grupos

EJEMPLO DIDACTICO

Page 28: ANALISIS DE VARIANZAS

El estimado de la varianza dentro de los tratamientos es la variación aleatoria dividida entre el número total de observaciones menos el número de tratamientos.

Es decir 90 / (12-3).

De aquí, el segundo estimado de la varianza poblacional es 90/9.

Ing. William león Velásquez 28

Dentro de cada grupos

EJEMPLO DIDACTICO

Page 29: ANALISIS DE VARIANZAS

Por tanto

Ing. William león Velásquez 29

Entre grupos

Dentro de cada grupos

mnE

mT

S

SF

2

1

2

EJEMPLO DIDACTICO

Page 30: ANALISIS DE VARIANZAS

Como esta razón es muy distinta a 1, se concluye que las medias de los tratamientos no son iguales.

Por lo tanto hay una diferencia en el número medio de clientes atendidos por los tres empleados.

Al igual que en la prueba de hipótesis de dos muestras y una muestra se sigue la regla de los cinco pasos.

Ing. William león Velásquez 30

EJEMPLO DIDACTICO

Page 31: ANALISIS DE VARIANZAS

Comparación de varias medias

Análisis de Varianza (ANOVA)

Es la relación entre una variable cualitativa (con más de 2 categorías) y una variable cuantitativa

Ing. William león Velásquez 31

Page 32: ANALISIS DE VARIANZAS

El problema

•Se tiene varias medias muestrales y se desea saber si realmente son evidencia de una diferencia entre los diferentes grupos

•Existe una variable cuanlitativa X que podría explicar los cambios en una variable cuantitativa Y

Ing. William león Velásquez 32

Page 33: ANALISIS DE VARIANZAS

Esquema ANOVA

Variable Independiente o Explicativa

Cualitativa

Variable dependiente o Respuesta

Cuantitativa

FACTOR que incluye varios posibles

tratamientos que pueden influir en la

respuesta

Medición que puede RESPONDER a los

varios posibles tratamientos del factor estudiado

X Y

Ing. William león Velásquez 33

Page 34: ANALISIS DE VARIANZAS

La Hipótesis

Ho: No hay relación entre X e Y

Ho: Las medias de Y en los diferentes grupos son iguales

Ha: Si hay relación entre X e Y

Ha: Por lo menos una media de Y es diferente en los grupos definidos por la variable X

Ing. William león Velásquez 34

Page 35: ANALISIS DE VARIANZAS

Ilustración mediante un ejemplo

La muestra seleccionada permite ver que hay diferencias, pero sólo en la muestra

Se tiene los datos de las compras de limpiadores que

efectúan las familias consumidoras, por nivel de

educación del jefe de familia

Total Primaria Secundaria Superior

Compra promedio

(onzas)

15.5 11.1 15.9 22.7

Desviación estándar (onzas)

10.4 5.6 6.2 5.9

Base n 589 244 206 139

Ing. William león Velásquez 35

Page 36: ANALISIS DE VARIANZAS

Si se asume que Ho es cierta (No hay relación)

En la población las medias deberían ser

iguales (Este es el supuesto de Ho)

Primaria Secundaria Superior Total

Compra

promedio

15.5 15.5 15.5 15.5

Base (n) 244 206 139 589

Ing. William león Velásquez 36

Page 37: ANALISIS DE VARIANZAS

Modelo de ANOVA de un factor

Y=

Media general

Efecto del tratamiento en el factor analizado

Error aleatorio

Ing. William león Velásquez 37

Page 38: ANALISIS DE VARIANZAS

En el ejemplo

Y es la cantidad comprada

X es el factor analizado es la variable cualitativa: educación

El factor educación tiene 3 tratamientos: Primaria, Secundaria, Superior

El efecto sobre la cantidad comprada de cada tratamiento (nivel específico de educación) no tiene que ser el mismo.

La hipótesis nula dice que por menos uno de los tratamientos (un nivel específico de educación) tiene efecto sobre la cantidad comprada

Ing. William león Velásquez 38

Page 39: ANALISIS DE VARIANZAS

Resultados de ANOVA

Ing. William león Velásquez 39

En este caso, p es muy pequeño Con lo cual podríamos rechazar la hipótesis de

igualdad de medias

Page 40: ANALISIS DE VARIANZAS

Supuestos de ANOVA

• La dispersión debe ser la misma en cada grupo o categoría (igualdad de varianza)

• La distribución de las observaciones en cada grupo debe ser normal

ANOVA es más sensible al primer supuesto que la segundo En casos extremos hay que considerar alternativas no paramétricas

Ing. William león Velásquez 40

Page 41: ANALISIS DE VARIANZAS

Ejemplo 1

• En una ciudad está dividida en cuatro distritos. El jefe de policía quiere determinar si hay alguna diferencia en el número promedio de delitos cometidos en cada distrito.

• Se registró el número de infracciones reportados en cada distrito en una muestra de seis días.

• Al nivel de significancia 0,05; puede el funcionario concluir que hay diferencia en el número promedio de infracciones?

Distrito 01

Distrito 02

Distrito 03

Distrito 04

Ing. William león Velásquez 41

Page 42: ANALISIS DE VARIANZAS

Ejemplo 1

Ing. William león Velásquez 42

Page 43: ANALISIS DE VARIANZAS

Ejemplo 1

c) El valor estadístico de la prueba:

Distrito 01 x2

Distrito 02 x2

Distrito 03 x2

Distrito 04 x2 total

13 169 21 441 12 144 16 256 15 225 13 169 14 196 17 289 14 196 18 324 15 225 18 324 15 225 19 361 13 169 15 225 14 196 18 324 12 144 20 400 15 225 19 361 15 225 18 324

Tc (X) 86 108 81 104 379 nc 6 6 6 6 x2 1236 1980 1103 1818 6137

Ing. William león Velásquez 43

Page 44: ANALISIS DE VARIANZAS

SST =

Ejemplo 1

SST = (86)2 (108)2 (81)2 (104)2 (379)2

------ + ------ + ------ + -------- - --------

6 6 6 6 24

1232.67 + 1944.00 + 1093.50 + 1802.67 - 5985.04 = 87.79

Ing. William león Velásquez 44

Page 45: ANALISIS DE VARIANZAS

Ejemplo 1

Ing. William león Velásquez 45

d) Criterio de decisión Se rechaza la Ho debido a que el valor calculado es 9.118 que es mayor al valor crítico de 3.10 y se concluye de que no hay diferencia en el número promedio de infracciones entre las citadas ciudades

Page 46: ANALISIS DE VARIANZAS

Ejemplo 2

Al nivel de significancia de 0,05; existe alguna diferencia entre las cuatro empresas, en el número medio de meses antes de recibir un aumento de sueldo?

• Una egresada de ingeniería industrial tiene ofertas de trabajo de cuatro empresas. Para examinar un poco más las propuestas, solicitó a una muestra de personas recién ingresadas, que le indiquen cuántos meses trabajaron cada una para su compañía, antes de recibir un aumento de sueldo.

• La información muestral fueron lo siguiente:

Ing. William león Velásquez 46

Empresa1 Empresa2

Empresa3

Empresa4

12 14 18 12

10 12 12 14

14 10 16 16

12 10

Page 47: ANALISIS DE VARIANZAS

Ejemplo 2

Ing. William león Velásquez 47

Page 48: ANALISIS DE VARIANZAS

Ejemplo 2

Empresa 01

Empresa 02

Empresa 03

Empresa 04

X2 X2 X2 X2 Total

Ing. William león Velásquez 48

Page 49: ANALISIS DE VARIANZAS

Ejemplo 2

Ing. William león Velásquez 49

n

XXSStotal

22

n

X

nTSST

c

c

22

Page 50: ANALISIS DE VARIANZAS

Ejemplo 2

Ing. William león Velásquez 50

Page 51: ANALISIS DE VARIANZAS

Ejemplo 3

Los miembros de un equipo ciclista se dividen al azar en tres grupos que entrenan con métodos diferentes.

El primer grupo realiza largos recorridos a ritmo pausado, el segundo grupo realiza series cortas de alta intensidad y el tercero trabaja en el gimnasio con pesas y se ejercita en el pedaleo de alta frecuencia.

Después de un mes de entrenamiento se realiza un test de rendimiento consistente en un recorrido cronometrado de 9 Km.

Ing. William león Velásquez 51

Page 52: ANALISIS DE VARIANZAS

Ejemplo 3

Los tiempos empleados fueron los siguientes

A un nivel de confianza del 95% ¿Puede considerarse que los tres métodos producen resultados equivalentes? O por el contrario ¿Hay algún método superior a los demás?

Ing. William león Velásquez 52

Método I Método II Método III

15 14 13

16 13 12

14 15 11

15 16 14

17 14 11

Page 53: ANALISIS DE VARIANZAS

Ejemplo 3

Ing. William león Velásquez 53

Se calcula los totales y los cuadrados de los totales divididos por el numero de observaciones

Page 54: ANALISIS DE VARIANZAS

Ejemplo 3

A partir de estas cantidades básicas calculamos las Sumas de Cuadrados:

SC(total) = 2984 - 2940 = 44 SC(entre) = 2966,8 – 2940 = 26,8 SC(intra) = 2984 – 2966,8 = 17,2 Ing. William león Velásquez 54

SS = SST + SSE SST = SS -SSE

n

XXSStotal

22

n

X

nTSST

c

c

22

29842X

2940

2

n

X

Page 55: ANALISIS DE VARIANZAS

Ejemplo 3

Los cuadrados medios serán:

CM(entre) = 26,8/2 = 13,4 CM(intra) = 17,2/12 = 1,43

Ing. William león Velásquez 55

mnE

mT

S

SF

2

1

2

Por consiguiente el estadístico de contraste vale: F = 13,4/ 1,43 = 9,37

Page 56: ANALISIS DE VARIANZAS

Ejemplo 3

El valor de la F teórica con 2 y 12 grados de libertad, a un nivel de confianza del 95% es 3,89. Por consiguiente se rechaza la hipótesis nula y Se concluye que los tres métodos de entrenamiento producen diferencias significativas.

Ing. William león Velásquez 56

Page 57: ANALISIS DE VARIANZAS

Ejemplo 4

Un estudio muestra en la pantalla de cuatro computadores una lista de palabras sin sentido con procedimientos diferentes, asignados aleatoriamente a un grupo de personas. Luego se les realiza una prueba de memoria de dichas palabras, obteniéndose los siguientes resultados:

Ing. William león Velásquez 57

Page 58: ANALISIS DE VARIANZAS

Ejemplo 4

¿Qué conclusiones pueden obtenerse acerca de las cuatro formas de presentación, con un nivel de significación del 5%? Solución: Calcular los totales y los cuadrados de los totales divididos por el número de observaciones:

Ing. William león Velásquez 58

Page 59: ANALISIS DE VARIANZAS

Ejemplo 4

Luego calcular los cuadrados de las observaciones y su total

Ing. William león Velásquez 59

Page 60: ANALISIS DE VARIANZAS

Ejemplo 4

A partir de estas cantidades básicas calcular las Sumas de Cuadrados: SC(total) = 988 – 819,8 = 168,2 SC(entre) = 902 – 819,8 = 82,2 SC(intra) = 988 – 902 = 86 Los cuadrados medios serán: CM(entre) = 82,2/3 = 27,4 CM(intra) = 86/22 = 3,9

Ing. William león Velásquez 60

Page 61: ANALISIS DE VARIANZAS

Ejemplo 4

Por lo tanto el estadístico de contraste será: F = 27,4/ 3,9 = 7,03 El valor de la F teórica con 3 y 22 grados de libertad, a un nivel de confianza del 95% es 3,05. Por consiguiente se rechaza la hipótesis nula y se concluye que los cuatro procedimientos de presentación producen diferencias significativas.

Ing. William león Velásquez 61

Page 62: ANALISIS DE VARIANZAS

NOTA:

Para

cambiar la

imagen de

esta

dispositiva

,

seleccione

la imagen

y

elimínela.

A

continuaci

ón haga

clic en el

icono

Imágenes

en el

marcador

de

posición e

inserte su

imagen.

Page 63: ANALISIS DE VARIANZAS

ANOVA de dos factores

◦ Se consideran los efectos de dos factores simultáneamente

• Diseño de bloques aleatorios

◦ Cuando una característica puede afectar la medición de la variable dependiente, se trata de controlar o bloquear esta variable, de tal manera que se pueda comparar mejor la influencia de un determinado tratamiento

Ing. William león Velásquez 63

Page 64: ANALISIS DE VARIANZAS

ANOVA de dos factores

Y=

Media general

Efecto del tratamiento específico del primer factor

Efecto del tratamiento específico del segundo factor

Efecto de la interacción entre tratamientos

Error aleatorio Ing. William león Velásquez 64

Page 65: ANALISIS DE VARIANZAS

Diseño de Bloques aleatorios

Y=

Media general

Efecto del tratamiento específico del primer factor

Efecto del bloque

Error aleatorio

Ing. William león Velásquez 65

Page 66: ANALISIS DE VARIANZAS

ANOVA – P.H. para probar la igualdad de medias de varias poblaciones con dos factores

66

Se trata de probar si el efecto de un factor o

Tratamiento en la respuesta de un proceso o sistema es

significativo, al realizar experimentos variando los

niveles de ese factor (Temp.1, Temp.2, etc.)

POR FILAS

Y Considerando los niveles de otro factor que se piensa

que tiene influencia en la prueba – FACTOR DE

BLOQUEO

POR COLUMNA

Ing. William león Velásquez

Page 67: ANALISIS DE VARIANZAS

ANOVA – P.H. para probar la igualdad de medias de varias poblaciones con dos factores

67

diferentessonsunasAHa

Ho a

..'.lg:

.........: 321

diferentessonsunasAHa

Ho a

..'.lg:

'.........''': 321

Para el tratamiento – en filas

Para el factor de bloqueo – en columnas

Ing. William león Velásquez

Page 68: ANALISIS DE VARIANZAS

ANOVA 2 Factores - Ejemplo

68

Experiencia en años de los operadores

Maquinas 1 2 3 4 5

Maq 1 27 31 42 38 45

Maq 2 21 33 39 41 46

Maq 3 25 35 39 37 45

Ing. William león Velásquez

Page 69: ANALISIS DE VARIANZAS

ANOVA – Dos factores o direcciones

69

•La SCTot y SCTr (filas) se determina de la misma forma que para la ANOVA de una dirección o factor

•En forma adicional se determina la suma de cuadrados del factor de bloqueo (columnas) de forma similar a la de las filas

•La SCE = SCT – SCTr - SCBl

Ing. William león Velásquez

Page 70: ANALISIS DE VARIANZAS

ANOVA de 2 factores – Suma de cuadrados, gl. y Cuadrado medio para el factor de bloqueo (en cols)

70

)1/(

1.

)( 2

1

bSCBlCMBl

bSCBlgl

XXaSCBl j

b

j

Ing. William león Velásquez

Page 71: ANALISIS DE VARIANZAS

ANOVA de 2 factores – Suma de cuadrados, gl. y Cuadrado medio para el error

71

))(/(

))((.

bnanSCBlCME

bnanSCEgl

SCBlSCTrSCTSCE

Ing. William león Velásquez

Page 72: ANALISIS DE VARIANZAS

ANOVA – Cálculo del estadístico Fc y Ftabla

72

SCEglSCTrglALFAFFtabla

MCE

MCTrFc

.,.,

Ing. William león Velásquez

Page 73: ANALISIS DE VARIANZAS

ANOVA de 2 factores – Cálculo del estadístico Fcbl y Ftabla bloques (columnas)

73

SCEglSCBlglALFAFFtabla

MCE

MCBlFc

.,.,

Ing. William león Velásquez

Page 74: ANALISIS DE VARIANZAS

Tabla final ANOVA 2 Factores

74

FUENTE DE VARIACIÓN SUMA DE GRADOS DE CUADRADO VALOR F

CUADRADOS LIBERTAD MEDIO

Entre muestras (tratam.) SCTR a-1 CMTR CMTR/CME

Entre Bloques (Factor Bl) SCBl b-1 CMBL CMBL/CME

Dentro de muestras (error) SCE (a-1)(b-1) CME

Variación total SCT n-1 CMT

Regla: No rechazar si la F de la muestra es menor que la F de tabla para una cierta alfa

Ing. William león Velásquez

Page 75: ANALISIS DE VARIANZAS

ANOVA – 2 F. Toma de decisión

75

Ftabla

Fc: Tr o Bl

Alfa

Zona de rechazo

De Ho o aceptar Ha

Zona de no rechazo de Ho

O de no aceptar Ha

Distribución F

Ing. William león Velásquez

Page 76: ANALISIS DE VARIANZAS

ANOVA – 2 F. Toma de decisión

76

Si Fc (Tr o Bl) es mayor que Ftabla se

rechaza Ho Aceptando Ha donde las

medias son diferentes

O si el valor de p correspondiente a Fc

(Tr o Bl) es menor de Alfa se rechaza Ho

Ing. William león Velásquez

Page 77: ANALISIS DE VARIANZAS

Ejemplo 1

•Se ha diseñado una prueba de vocabulario para detectar la afinidad hacia la mecánica.

•La prueba consiste en un cierto número de palabras tomadas de una lista de términos alusivos a la mecánica y a la maquinaria; y que la calificación que una persona puede obtener en esa prueba es, simplemente, el número de palabras que puede definir correctamente.

•Supongamos que se quiere probar si hay diferencias relativas a dos características, sexo y lugar donde viven, y también si se presentan diferencias atribuibles a la combinación de ambas.

Ing. William león Velásquez 77

Page 78: ANALISIS DE VARIANZAS

Ejemplo 1

•Las calificaciones de los sujetos clasificadas de acuerdo a estas dos variables fueron las siguientes:

Urbano Rural

Hombre Mujer Hombre Mujer

4 1 3 4

9 4 7 4

9 5 7 4

10 6 7 8

Ing. William león Velásquez 78

Page 79: ANALISIS DE VARIANZAS

Ejemplo 1

• Sería posible, por supuesto, llevar a efecto un análisis de varianza de una sola clasificación con estos cuatro grupos de sujetos, sin embargo, si se encuentra una diferencia significativa entre estos cuatro grupos,

• ¿Como saber si esas diferencias deben atribuirse al sexo o al lugar donde viven o a una combinación de ambos?

• Para estos casos se utiliza el método de análisis de varianza de doble clasificación, este método consta de varios pasos.

Ing. William león Velásquez 79

Page 80: ANALISIS DE VARIANZAS

Pasos

1.- Establecer Hipótesis

Se tiene que establecer hipótesis para cada uno de los tratamientos y para la interacción de ambos:

a) Respecto al primer tratamiento:

Ho: “Los hombres no tienen más afinidad hacia la mecánica que las mujeres”

Ha: “Los hombres tienen más afinidad hacia la mecánica que las mujeres”

Ing. William león Velásquez 80

Page 81: ANALISIS DE VARIANZAS

Ejemplo 1

1.- Establecer Hipótesis

b) Respecto al segundo tratamiento:

Ho:”Los residentes de zonas urbanas no tienen más afinidad hacia la mecánica que los residentes de zonas rurales”

Ha:”Los residentes de zonas urbanas tienen más afinidad hacia la mecánica que los residentes de zonas rurales”

Ing. William león Velásquez 81

Page 82: ANALISIS DE VARIANZAS

Ejemplo 1

1.- Establecer Hipótesis

• c) Respecto a la interacción de los dos tratamientos

Ho:” La combinación de las circunstancias sexo y lugar de residencia no afecta de manera significativa el tener más afinidad hacia la mecánica”

Ha:”La combinación de las circunstancias sexo y lugar de residencia afecta de manera significativa el tener más afinidad hacia la mecánica”

Ing. William león Velásquez 82

Page 83: ANALISIS DE VARIANZAS

Ejemplo 1

2.- Establecer el Criterio de Contraste

a=2 b=2 n=16

gl T1 a-1 1

gl T2 b-1 1

gl Iter (a-1)(b-1) 1

gl Tot n-1 15

gl SCE glTot-gl T1 +gl T2 - gl Iter 12

Gl T1 =1 Gl SCE= 12 F= 4 .75

Gl T2 =1 Gl SCE= 12 F= 4 .75

Gl Iter =1 Gl SCE= 12 F= 4 .75

Ing. William león Velásquez 83

Page 84: ANALISIS DE VARIANZAS

Ejemplo 1

3.- Calcular el Estadístico de Prueba

Urbano Rural

Hombre x2 Mujer x2 Hombre x2 Mujer x2

4 16 1 1 3 9 4 16

9 81 4 16 7 49 4 16

9 81 5 25 7 49 4 16

10 100 6 36 7 49 8 64 ΣΣ

ΣX = 32 16 24 20 92

ΣX² = 278 78 156 112 624

n 4 4 4 4 16

Ing. William león Velásquez 84

Sumatoria de los totales

Page 85: ANALISIS DE VARIANZAS

Ejemplo 1

•Cálculo del Factor de corrección:

Ing. William león Velásquez 85

529

16

922

FC

n

XFC

2)(

Page 86: ANALISIS DE VARIANZAS

Ejemplo 1

•Cálculo de la Suma Total de Cuadrados

SCTotal = X 2 - FC

= ( 278 + 78 + 156 + 112) - 529 = 95

= 624 - 529 = 95

Ing. William león Velásquez 86

Page 87: ANALISIS DE VARIANZAS

Ejemplo 1

•Calcular la suma de cuadrados por cada tipo de tratamiento

•SCT1 (por el lugar donde viven)

Ing. William león Velásquez 87

Page 88: ANALISIS DE VARIANZAS

Ejemplo 1

•Calcular la suma de cuadrados por cada tipo de tratamiento

•SCT2 (por sexo)

Ing. William león Velásquez 88

Hombre Mujer

Page 89: ANALISIS DE VARIANZAS

Ejemplo 1

•Calcular la suma de cuadrados por grupos

•*Este valor nos servirá para calcular el SCI y SCE

Ing. William león Velásquez 89

Page 90: ANALISIS DE VARIANZAS

Ejemplo 1

• Calcular la suma de cuadrados de la interacción de los dos tratamientos

SCI = SCG – SCT1 – SCT2 =

= 35 – 1 – 25 = 9

• Calcular la suma de cuadrados del error

SCE = SCTOT – SCG =

= 95 – 35 = 60

Ing. William león Velásquez 90

Page 91: ANALISIS DE VARIANZAS

Ejemplo 1

•Construir la Tabla ANOVA

FUENTE SC GL MC F

TRATAMIENTO 1 1.0 1 1 0.2

TRATAMIENTO 2 25.0 1 25 5

POR GRUPOS 35

INTERACCION 9.0 1 9 1.8

ERROR 60 12 5

TOTAL 95 15

Ing. William león Velásquez 91

Page 92: ANALISIS DE VARIANZAS

Ejemplo 1

4.- Tomar Decisión y Conclusión Decisión Como los Estadísticos de Prueba, en los casos de las variables de localidad (F*1 = 0.2) y la combinación de sexo y localidad (F*i =1.8) son mas pequeños que sus respectivos criterios de contraste (F = 4.75), en estos casos se no rechaza la hipótesis nula, Mientras que en el caso del sexo el Estadístico de Prueba (F*2 = 5.0) es mas grande que el Criterio de Contraste (F = 4.75), entonces por lógica inferimos que F* queda dentro de la zona crítica y por lo tanto se rechaza la hipótesis nula por lo tanto aceptamos la hipótesis alterna,

Ing. William león Velásquez

92

Page 93: ANALISIS DE VARIANZAS

Ejemplo 1

y la conclusión :

“Hay evidencia suficiente, con un nivel de significancia de .05, para afirmar que en promedio de la afinidad hacia la mecánica de los hombres es mayor que el de las mujeres,

mientras que no la hay para afirmar que los residentes de zonas urbanas tengan más afinidad hacia la mecánica que los residentes de zonas rurales,

ni tampoco podemos afirmar que la combinación de ambas circunstancias influya en la afinidad hacia la mecánica de los individuos”.

Ing. William león Velásquez 93

Page 94: ANALISIS DE VARIANZAS

Ejemplo 02

• El departamento de nutrición de cierta universidad lleva a cabo un estudio para determinar si hay diferencia o no en el contenido de ácido ascórbico entre tres diferentes marcas de concentrado de jugo de naranja. Se hacen cuatro pruebas de los tres tipos de concentrado de jugo de naranja que fue congelado durante tres periodos de tiempo diferentes (en días)

Ing. William león Velásquez 94

Page 95: ANALISIS DE VARIANZAS

Ejemplo 02

• Los resultados, en miligramos de ácido ascórbico por litro, son los siguientes:

Ing. William león Velásquez 95

MARCA

TIEMPO ( DÍAS )

0 3 7

RICA 52.6 54.2 49.4 49.2 42.7 48.8

49.8 46.5 42.8 53.2 40.4 47.6

BUENA 56.0 48.0 48.8 44.0 49.2 44.0

49.6 48.4 44.0 42.4 42.0 43.2

BARATA 52.5 52.0 48.0 47.0 48.5 43.3

51.8 53.6 48.2 49.6 45.2 47.6

Page 96: ANALISIS DE VARIANZAS

Ejemplo 02

• Utilice un nivel de significancia de .05 para probar la hipótesis de que:

• Los contenidos de ácido ascórbico por marca de jugo son diferentes

• Los contenidos de ácido ascórbico por tiempo de congelamiento son diferentes

• Los contenidos de ácido ascórbico son diferentes debido a la interacción de las dos variables.

Ing. William león Velásquez 96

Page 97: ANALISIS DE VARIANZAS

Ejemplo 2

2.- Establecer el Criterio de Contraste

Gl T1 =2 Gl SCE= 27 F=3.35

Gl T2 =2 Gl SCE= 27 F= 3.35

Gl Iter =4 Gl SCE= 27 F=2.73

a b n

3 3 36

gl T1 a-1 2

gl T2 b-1 2

gl Iter (a-1)(b-1) 4

gl Tot n-1 35

gl SCE glTot-gl T1 +gl T2 - gl Iter 27

Ing. William león Velásquez 97

3.35

3.35

2.73

Page 98: ANALISIS DE VARIANZAS

Ejemplo 02

• Elaborar la tabla ANOVA

Ing. William león Velásquez 98

n

0

3

7

RICA 52.6 54.2 49.4 49.2 42.7 48.8 12 577.2

49.8 46.5 42.8 53.2 40.4 47.6

BUENA 56 48 48.8 44 49.2 44 12 559.6

49.6 48.4 44 42.4 42 43.2

BARATA

52.5 52 48 47 48.5 43.3 12 587.3

51.8 53.6 48.2 49.6 45.2 47.6

1724.1

Tratamientos 615 566.6 542.5 1724.1

n 12 12 12 36

Page 99: ANALISIS DE VARIANZAS

Ejemplo 02

• 1- Cálculo del Factor de corrección

Ing. William león Velásquez 99

2972520.81

FC = ---------------- = 82570.0225

36

FC

= 82570

81.2972520)1.1724( 22X

n

XFC

2)(

Page 100: ANALISIS DE VARIANZAS

Ejemplo 02

• 2- Cálculo de la Suma cuadrado de totales

Ing. William león Velásquez 100

83102.01 - 82570 = 531.9875 SCTotales=

FCXSCTotales 2

Page 101: ANALISIS DE VARIANZAS

Ejemplo 02

• 3- Cálculos de los tratamientos

101

TIEMPO SCT1 = 31518.75 + 26752.96 + 24525.52

ΣX²/ n0 ΣX²/ n3 ΣX²/ n7

82797.23 - 82570.02 = 227.212 SCT1=

82570.02 -

FCn

XSCT

2

1

FCSCT 12

5.542

12

6.566

12

615 222

1

23.82797

2

n

X

Page 102: ANALISIS DE VARIANZAS

Ejemplo 02

• 3- Cálculos de los tratamientos

Ing. William león Velásquez

MARCA SCT2 = 27763.32 + 26096.01 + 28743.44

ΣX²/ nRICA ΣX²/ nBUENA ΣX²/ nBARATA

82602.77 - 82570.02 = 32.752 SCT2=

- FC

82570.02 -

FCSCT 12

3.587

12

66.559

12

2.577 222

2

FCn

XSCT

2

2

77.82602

2

n

X

Page 103: ANALISIS DE VARIANZAS

Ejemplo 02

4- Calcular la suma de cuadrados por bloques

103

0 3 7

RICA 203.1 194.6 179.5

BUENA 202 179.2 178.4

BARATA 209.9 192.8 184.6

SCG = 10312.40 + 9467.29 + 8055.06 +

+ 10201 + 8028.16 + 7956.64 +

+ 11014.50 + 9292.96 + 8519.29 - 82570.02 = 277.29

Ing. William león Velásquez

n=4

FC

n

XSGG

2

4.10312

4

41249.61

4

1.20322

n

X

X

Page 104: ANALISIS DE VARIANZAS

Ejemplo 02

• 5- Calcular la suma de cuadrados de la interacción de los dos tratamientos

104

Ing. William león Velásquez

SCI = SCG – SCT1 – SCT2 =

SCI = 277.29 - 227.212 - 32.752

= 17.322

Page 105: ANALISIS DE VARIANZAS

Ejemplo 02

• 6- Calcular la suma de cuadrados del error

105

Ing. William león Velásquez

SCE = SCTOT – SCG

SCE = 531.9875 - 277.29 = 254.703

Page 106: ANALISIS DE VARIANZAS

Ejemplo 02

•Construir la Tabla ANOVA

FUENTE SC GL MC F

TRATAMIENTO 1 227.21 2 113.606 12.0429

TRATAMIENTO 2 32.75 2 16.376 1.7359

POR GRUPOS 277.29

INTERACCION 17.32 4 4.330 0.4591

ERROR 254.70 27 9.433

TOTAL 531.99 35

Ing. William león Velásquez 106

Page 107: ANALISIS DE VARIANZAS

Ejemplo 02

Ing. William león Velásquez 107

FCRITICO

FT1= 4 .75

FT2= 4 .75

FINT= 4 .75

FDATOS

12.0429

1.7359

0.4591

Conclusión

Se rechaza la Ho

No se rechaza la Ho

No se rechaza la Ho

•Conclusión

FCrítico

Page 108: ANALISIS DE VARIANZAS

FIN [email protected]