anova 1 factor
TRANSCRIPT
-
8/16/2019 Anova 1 Factor
1/31
Biometría 22015
Anova de 1 factor: supuestos,tabla de anova, comparaciones,
magnitud del efecto e IC.
-
8/16/2019 Anova 1 Factor
2/31
Problema 4
Segregación de aa
Anemia
¿La segregación de ciertos aa produce anemia?
TP 2. Diseños y ANOVA
-
8/16/2019 Anova 1 Factor
3/31
-
8/16/2019 Anova 1 Factor
4/31
GRUPO I GRUPO II GRUPO III GRUPO IV 20 mmol
prolina
mezcla aa –
pro
mezcla aa +
pro
Suero fisio
6.47
5.42
6.09
5.83
6.27 5.95
6.04
6.35
5.60
5.80
6.09
5.94
5.75
5.51
6.34 5.65
6.42
6.04
5.51
5.44
5.61
5.40
5.26
4.99
5.44 5.13
5.21
5.52
4.79
4.92
7.35
7.11
6.99
6.72
7.16 6.85
6.94
7.25
6.51
6.65
Modelo Lineal:
ijiij y
# de glóbulos rojos de la rata j sometida
al tratamiento i
# de glóbulos rojos promedio de la población
de ratas wistar
efecto del tratamiento “i” sobre el # de
glóbulos rojos promedio
“error”: variabilidad natural entre
ratas, errores de medición, etc.
Yij =
µ =
α i =
Єij =
¿subíndices? i= j=
TP 2. Diseños y ANOVA
Diseño utilizado: DCA
-
8/16/2019 Anova 1 Factor
5/31
Ho: μI = μII = μ III = μ IV = μ Ha: Alguna μi ≠ μ
Ho: αi = 0
Ha: Algún αi ≠ 0
ANOVA DE 1 FACTOR
Hipótesis
Hipótesis
TP 2. Diseños y ANOVA
¿La segregación de ciertos aa produce anemia?
-
8/16/2019 Anova 1 Factor
6/31
Descripción Gráfica y analítica de los datos
Medidas resumen
grupo Variable n Media D.E. Var(n-1) CV Mín Máx
G_I GR 10 5,98 0,33 0,11 5,55 5,42 6,47
G_II GR 10 5,87 0,35 0,12 5,99 5,44 6,42
G_III GR 10 5,23 0,27 0,07 5,18 4,79 5,61
G_IV GR 10 6,95 0,27 0,07 3,92 6,51 7,35
G_I G_II G_III G_IV
grupo
0,00
1,87
3,74
5,61
7,48
G R
G_I G_II G_III G_IV
grupo
0,00
1,78
3,57
5,35
7,13
G R
Presencia
de datos
atípicos?
TP 2. Diseños y ANOVA
-
8/16/2019 Anova 1 Factor
7/31
Supuestos para la validez del modelo
ij independientes ~ N (0, σ)
u.e. Independientes - Muestreo aleatorio
- Asignación aleatoria de u.e.
Distribución Normal de la v.a para cada subpoblación
Homogeneidad de varianzas de las subpoblaciones.
TP 2. Diseños y ANOVA
-
8/16/2019 Anova 1 Factor
8/31
ANOVA: SUPUESTOS
u.e. Independientes - Muestreo aleatorio- Asignación aleatoria de u.e.
Suponemos que las ratas fueron extraídas
al azar y que la asignación de las ratas a
cada tratamiento se hizo al azar.
TP 2. Diseños y ANOVA
-
8/16/2019 Anova 1 Factor
9/31
ANOVA: SUPUESTOS
• Para probar los supuestos necesitamoscalcular los
RESIDUOS (RDUO)
RESIDUOS ESTUDENTIZADOS (RE)
RESIDUOS ABSOLUTOS (RABS)
VALORES PREDICHOS (PRED)
TP 2. Diseños y ANOVA
* Formula descrita en el manual de
InfoStat
-
8/16/2019 Anova 1 Factor
10/31
Residuos … un ejemplo para repasar el cálculo
• Calcule el residuo para la 3ra. observación del grupo II
e 23 = 5.75 – 5.87 = -0.12 milGR/mm3
GRUPO I GRUPO II GRUPO III GRUPO IV
20 mmol
prolina
mezcla aa –
pro
mezcla aa +
pro
Suero fisio
6.47 6.09 5.61 7.355.42 5.94 5.40 7.11
6.09 5.75 5.26 6.99
5.83 5.51 4.99 6.72
6.27 6.34 5.44 7.16
5.95 5.65 5.13 6.85
6.04 6.42 5.21 6.94
6.35 6.04 5.52 7.25
5.60 5.51 4.79 6.51
5.80 5.44 4.92 6.65 y..
yi. 5.98 5.87 5.23 6.95 6.01
n 10 10 10 10
TP 2. Diseños y ANOVA
-
8/16/2019 Anova 1 Factor
11/31
Distribución Normal de la v.a. para cada subpoblación
Es equivalente a decir que los errores aleatorios se distribuyen normalmente
Método gráfico
4,52 5,26 6,01 6,75 7,50
Cuantiles de una Normal(6,0077,0,47848)
4,52
5,26
6,01
6,75
7,50
C u a n t i l e s o b s e r v a d o s ( G R )
n= 40 r= 0,988 (GR)
TP 2. Diseños y ANOVA
-
8/16/2019 Anova 1 Factor
12/31
Distribución Normal de la v.a. para cada subpoblación
Método analítico: Prueba de Shapiro-Wilks
Ho: los errores del modelo ajustan a una distribución normal
H1:los errores del modelo NO ajustan a una distribución normal
NO RECHAZO Ho. No encontramos evidencias en contra de la normalidad
(corriendo el riesgo de cometer un error de Tipo II)
TP 2. Diseños y ANOVA
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
RDUO_HEMATOCRITO 40 0.00 0.30 0.95 0.2193
-
8/16/2019 Anova 1 Factor
13/31
Homogeneidad de varianzas de las subpoblaciones.
Método gráfico
5,14 5,62 6,09 6,56 7,04
PRED_GR
-0,62
-0,31
-0,01
0,30
0,61
R D U O_
G R
G_IIIG_I
G_II G_IV
• La dispersión
dentro de cada
grupo tiene que
ser similar
TP 2. Diseños y ANOVA
-
8/16/2019 Anova 1 Factor
14/31
Homogeneidad de varianzas de las subpoblaciones.
Método AnalíticoHo: las varianzas de las 4 subpoblaciones son homogéneas con respecto a la
cantidad de glóbulos rojos. σ2 i. = σ2
Ha: las varianzas de las 4 subpoblaciones NO son homogéneas con respecto a la
cantidad de globulos rojos. Alguna σ2 i. ≠ σ2
NO RECHAZO Ho. Podemos suponer que la variabilidad de las 4 subpoblaciones
no difiere (corriendo el riesgo de cometer un error de Tipo II)
TP 2. Diseños y ANOVA
-
8/16/2019 Anova 1 Factor
15/31
Análisis de la varianza
Variable N R² R² Aj CV
GR 40 0,816 0,801 5,139
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo 15,230 3 5,077 53,269
-
8/16/2019 Anova 1 Factor
16/31
¿Cómo decidimos si nos quedamos con Ho ó con Ha?
Resolución del ANOVA• Comparamos la variabilidad que observamos ENTRE
tratamientos con la observada DENTRO de los tratamientos
GRUPO I GRUPO II GRUPO III GRUPO IV
20 mmol
prolina
mezcla aa –
pro
mezcla aa +
pro
Suero fisio
6.47 6.09 5.61 7.35
5.42 5.94 5.40 7.11
6.09 5.75 5.26 6.99
5.83 5.51 4.99 6.72
6.27 6.34 5.44 7.16
5.95 5.65 5.13 6.85
6.04 6.42 5.21 6.94
6.35 6.04 5.52 7.25
5.60 5.51 4.79 6.51
5.80 5.44 4.92 6.65 y..
yi. 5.98 5.87 5.23 6.95 6.01
n 10 10 10 10
Variabilidad
DENTRO de lostratamientos
Variabilidad
ENTRE tratamientos
Var. ENTRE = Var. DENTRO => No rechazo Ho
Var. ENTRE > Var. DENTRO => Rechazo Ho
TP 2. Diseños y ANOVA
-
8/16/2019 Anova 1 Factor
17/31
Fuente deVariación
Suma deCuadrados
Grados delibertad
CuadradosMedios
F p-valor
Grupo )( y yiin
2 a-1 SC / GL CMgruposCMerror
Error )( iij y y 2
n –
a SC / GL
Total )( y y ji
2 n - 1
TP 2. Diseños y ANOVA
10x[(5.98-6.01) 2 +(5.87-6.01) 2 +(5.23-6.01) 2 +(6.95-6.01) 2] =
10x[(-0.03) 2 +(-0.14) 2 +(-0.78) 2 +(0.94) 2] = 15.125
Construcción de la Tabla de ANOVA.
Práctica de cálculo de SC a mano
-
8/16/2019 Anova 1 Factor
18/31
• Conclusión biológica:
• Conclusión estadística: Conclusiones
G_I G_II G_III G_IV
grupo
0,00
1,87
3,74
5,61
7,48
G R
• ¿Todos los tratamientos difieren
entre si o solo algunos?
COMPARACIONES
Rechazo Ho con una probabilidad de cometer error tipo I de 5%.Algún αi ≠ 0
La concentración media de glóbulos rojos de ratas Wistar es afectada por
alguno de los tratamientos aplicados (nivel de significación de 0,05).
TP 2. Diseños y ANOVA
-
8/16/2019 Anova 1 Factor
19/31
Comparaciones
• A priori conocimientos previos del investigador. Pueden
detectar diferencias que el ANOVA no detecte.
Contrastes ortogonales
Bonferroni
• A posteriori sólo si el ANOVA dio significativo:
Tukey
Dunnet
TP 2. Diseños y ANOVA
-
8/16/2019 Anova 1 Factor
20/31
Contrastes ortogonales Tabla ANOVA propia
Bonferroni
Tukey
Dunnet
TP 2. Diseños y ANOVA
Se calcula una DMS que se compara conel valor obtenido del contraste
-
8/16/2019 Anova 1 Factor
21/31
Bonferroni
Tukey
TP 2. Diseños y ANOVA
in
CMerror Q DMS GLerror ,
-
8/16/2019 Anova 1 Factor
22/31
Métodos a priori
• Contrastes Ortogonales (un ejemplo)¿Los tratamientos con “prolina” difieren del resto?
¿El tratamiento con “prolina” sóla, difiere del de “aa+prolina”?
Ho1: µ GI + µ GIII = µ GII + µ GIV
Ho2: µ GI = µ GIII
1 f 2
f =1µGI + 1µGIII- 1µGII -1µGIV=0
=1µGI - 1µGIII=0
TP 2. Diseños y ANOVA
-
8/16/2019 Anova 1 Factor
23/31
• Contrastes Ortogonales
TP 2. Diseños y ANOVA
-
8/16/2019 Anova 1 Factor
24/31
Conclusiones
• Los tratamientos con prolina difieren de la mezcla de aa
sin prolina y el suero (Contraste 1)
• Los tratamientos con prolina y mezcla aa + prolina
difieren entre si (Contraste 2)
=> La prolina sola no sería la responsable de la anemiaobservada
Contrastes Ortogonales
TP 2. Diseños y ANOVA
-
8/16/2019 Anova 1 Factor
25/31
Métodos a posteriori
• Método de TukeySe comparan todos los pares de medias posibles
En este caso:
Ho1: µ GI = µ GII
Ho2: µ GI = µ GIII
Ho3: µ GI = µ GIV
Ho4: µ GII = µ GIII
Ho5: µ GII = µ GIV
Ho6: µ GIII = µ GIV 6
5
4
3
2
1
f
f
f
f
f
f
0
0
0
0
0
0
GIV GIII
GIV GII
GIII GII
GIV GI
GIII GI
GII GI
TP 2. Diseños y ANOVA
-
8/16/2019 Anova 1 Factor
26/31
G_III G_II G_I G_IV
grupo
0,00
1,79
3,57
5,36
7,14
G R
A
B B
C
A
B B
C
Métodos a posteriori
Método de Tukey
Test:Tukey Alfa=0,05 DMS=0,37Error: 0,0953 gl: 36
grupo Medias n E.E.
G_III 5,23 10 0,10 A
G_II 5,87 10 0,10 B
G_I 5,98 10 0,10 B
G_IV 6,95 10 0,10 C
Letras distintas indican diferencias significativas(p
-
8/16/2019 Anova 1 Factor
27/31
TP 2. Diseños y ANOVA
• Estimación de la varianza residual
Se estima a partir del CMerror
Recordar que CM error: Variación natural o no
controlada, estima σ 2
• Coeficiente de variación (CV)
01,6
09.0
.. y
CMerror
-
8/16/2019 Anova 1 Factor
28/31
Estimación de la magnitud del efecto: Estimación puntual
• Estimación del efecto del tratamiento III
El tratamiento de “mezcla de aa + pro” disminuye la cantidadde glóbulos rojos en sangre de ratas Wistar respecto al suero
fisiológico en promedio 24,78 %.
El tratamiento de “mezcla de aa + pro” disminuye la cantidad
de glóbulos rojos en sangre de ratas Wistar respecto al suero
fisiológico en promedio en 1,726 millonesGR/mm3 sangre.
TP 2. Diseños y ANOVA
78,24100*953,6
953,623,5100*
GIV
GIV GIII
y
y y
726,1953,6227,5 GIV GIII y y
-
8/16/2019 Anova 1 Factor
29/31
EE VC x x *21
¿Cómo construimos un IC para la diferencia de medias?
En el caso de nuestro problema ….
TP 2. Diseños y ANOVA
-
8/16/2019 Anova 1 Factor
30/31
• IC para la magnitud del máximo efecto (Tratamiento III )
ialfaGLerror nCMerror Q /*726.1 ,
La adición de “aa+pro” en suero de ratas Wistar produceuna disminución promedio entre 1,37 y 2,79 millones de
GR/mm3 respecto al suero fisiológico con una confianza
del 95%.
TP 2. Diseños y ANOVA
DMS= 0,353
37.1;79.2%95 IC
-
8/16/2019 Anova 1 Factor
31/31
Redacción de Materiales y Métodos
estadísticos
TP 2. Diseños y ANOVA
Los datos fueron analizados mediante un ANOVA de una vía,
con el tipo de suero administrado como único factor con 4 niveles
(grupos I a IV descritos anteriormente). Se realizaron
comparaciones a posteriores utilizando el método de tukey, con una
tasa de error global del 5%. Todos los análisis fueron realizados
con el programa InfoStat (citar).