6 semana analisis multivariante parte i
Post on 04-Jun-2015
2.277 Views
Preview:
TRANSCRIPT
UNIVERSIDAD NACIONAL UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOSMAYOR DE SAN MARCOS
Universidad del Perú, DECANA DE AMERICAUniversidad del Perú, DECANA DE AMERICA
Mg. María Estela Ponce AruneriMg. María Estela Ponce Aruneri
ESCUELAESCUELA ACADÉMICO PROFESIONAL DE ESTADÍSTICA ACADÉMICO PROFESIONAL DE ESTADÍSTICA
ANÁLISIS MULTIVARIANTEANÁLISIS MULTIVARIANTE
SEMESTRE ACADÉMÍCO 2009-IISEMESTRE ACADÉMÍCO 2009-II
2
3
1.INTRODUCCIÓNEl procedimiento MLG Medidas repetidas proporciona un análisis de varianza cuando se toma la misma medida varias veces a cada sujeto o caso. Si se especifican factores inter-sujetos, éstos dividen la población en grupos. Utilizando este procedimiento de modelo lineal general, puede contrastar hipótesis nulas sobre los efectos tanto de los factores inter-sujetos como de los factores intra-sujetos. Asimismo puede investigar las interacciones entre los factores y también los efectos individuales de los factores. También se pueden incluir los efectos de covariables constantes y de las interacciones de las covariables con los factores inter-sujetos.
4
Ejemplo caso univariado:
Se investiga si los cambios de trabajo respiratorio de un grupo de pacientes que se recuperaban de insuficiencia respiratoria aguda, está o no relacionado con el efecto de un broncodilatador, para tal efecto se obtienen datos de los pacientes bajo estudio antes y después de inhalar el broncodilatador.
5
Ejemplo caso general:
Sí se investiga si los cambios de trabajo respiratorio de un grupo de pacientes que se recuperaban de insuficiencia respiratoria aguda, está o no relacionado con el efecto de un broncodilatador, para tal efecto se obtienen datos de los pacientes bajo estudio antes y después del primer, segundo y tercer día de inhalar el broncodilatador.
6
2. OBJETIVOS
Comparar más de dos tratamientos que se refieren a una sola variable de respuesta.
3. SUPUESTOS
•Cada sujeto o unidad experimental recibe tratamiento sobre períodos sucesivos de tiempo
11 1
1
q
n nq
x x
x x
X
xij: respuesta de la i-ésima unidad y j-ésimo tratamiento; i=1,2,…,n; j=1,2,……,q
xij tiene distribución N(µ,)
7
1 2 1
1 3 2
1
1 1 0 . 0
1 0 1 . 0
. .. . . . .
. .. . . . .
1 0 0 . 1q q
1μ C μ
•Para comparar se tiene:
2 1 1
3 2 2
2
1
1 1 0 . 0
0 1 1 . 0
. .. . . . .
. .. . . . .
0 0 . 1 1q q q
μ C μ
O:
2 1C μ C μ 0
8
C1 y C2 : las matrices de contrastes con “q-1” filas linealmente independientes.
4. Análisis de medidas repetidas
Cuando la media de los tratamientos son iguales se tiene que:
La prueba para igualdad de tratamientos en diseños de medidas repetidas, está dada por:
Hipótesis:
Ho: Cµ = 0
H1: Cµ ≠0
9
Estadística para la prueba:
2 1( ) (*)
1, 1
( 1)( 1)
( 1)( ) '( ') ( )
q n q
n qF
n qT n
Cx CSC Cx
Rechazamos la hipótesis nula a un nivel de significación “” si se cumple (*)
Ejemplo:
A un grupo de 16 pacientes con Esclerosis Múltiple (EM) definida, tratados con Interferón Beta (IF-b), que son seguidos prospectivamente durante un periodo de tres años. El objetivo del estudio sería evaluar los cambios que se producen durante este tiempo en el volumen de las lesiones hiperintensas
10
Estadísticos
16 16 16
.8406 .8844 .9288
.8000 .8350 .8700
.42284 .42068 .41779
.25 .27 .34
1.75 1.79 1.81
.5450 .5875 .6475
.8000 .8350 .8700
1.0725 1.1550 1.1825
n
Media
Mediana
Desv. típ.
Mínimo
Máximo
25
50
75
Percentiles
Volumenlesiones1º año
Volumenlesiones2º año
Volumenlesiones3º año
11
12
Prueba de rachas
.80 .84 .87
8 8 8
8 8 8
16 16 16
4 4 4
-2.329 -2.329 -2.329
.020 .020 .020
Valor de pruebaa
Casos < Valor de prueba
Casos >= Valor deprueba
Casos en total
Número de rachas
Z
Sig. asintót. (bilateral)
Volumenlesiones1º año
Volumenlesiones2º año
Volumenlesiones3º año
Medianaa.
Interprete los resultados
13
Hipótesis:
Ho: Cµ = 0
H1: Cµ ≠0
Prueba de Kolmogorov-Smirnov para una muestra
16 16 16
.8406 .8844 .9288
.42284 .42068 .41779
.130 .124 .121
.130 .124 .121
-.081 -.081 -.087
.521 .494 .484
.949 .967 .973
n
Media
Desviación típica
Parámetros normales a,b
Absoluta
Positiva
Negativa
Diferencias másextremas
Z de Kolmogorov-Smirnov
Sig. asintót. (bilateral)
Volumenlesiones1º año
Volumenlesiones2º año
Volumenlesiones3º año
La distribución de contraste es la Normal.a.
Se han calculado a partir de los datos.b.
Contrastes multivariadosb
.792 26.706a 2.000 14.000 .000
.208 26.706a 2.000 14.000 .000
3.815 26.706a 2.000 14.000 .000
3.815 26.706a 2.000 14.000 .000
Traza de Pillai
Lambda de Wilks
Traza de Hotelling
Raíz mayor de Roy
Efectovolum
Valor FGl de lahipótesis Gl del error Significación
Estadístico exactoa.
Diseño: Intersección Diseño intra sujetos: volum
b.
14
Podemos rechazar la hipótesis nula de igualdad de medias y concluir que los cambios que se producen en el volumen de las lesiones hiperintensas no son iguales durante los tres años.
Prueba de esfericidad de Bartletta
.000
137.006
5
.000
Razón de v erosimilitudes
Chi-cuadrado aprox.
gl
Signif icación
Contrasta la hipótesis nula de que la matriz de covarianzaresidual es proporcional a una matriz identidad.
Diseño: Intersección Diseño intra sujetos: volum
a.
Observación:Cuando se utiliza la prueba de Bartlett se incumple el supuesto de esfericidad.
15
Prueba de esfericidad de Mauchlyb
Medida: MEASURE_1
.607 6.998 2 .030 .718 .773 .500Efecto intra-sujetosvolum
W de MauchlyChi-cuadrado
aprox. gl SignificaciónGreenhouse-Geisser Huynh-Feldt Límite-inferior
Epsilona
Contrasta la hipótesis nula de que la matriz de covarianza error de las variables dependientes transformadas es proporcional auna matriz identidad.
Puede usarse para corregir los grados de libertad en las pruebas de significación promediadas. Las pruebas corregidasse muestran en la tabla Pruebas de los efectos inter-sujetos.
a.
Diseño: Intersección Diseño intra sujetos: volum
b.
En los modelos de medidas repetidas, se supone que las varianzas de las diferencias entre cada dos niveles del factor son iguales.
16
En nuestro ejemplo, tenemos: 1-2; 1-3; 2-3, 3 pares de combinaciones, calculando la diferencia entre estos pares, se tiene 3 nuevas variables, y suponemos que las varianzas de estas variables son iguales. Es decir que la matriz de varianzas-covarianzas es circular o esférica.La prueba de esfericidad no se rechaza al 1%.
Observación:
Si se rechazará la prueba de esfericidad, optamos por: 1° Utilizar los contrastes multivariados, puesto que no se afectan por la falta de esfericidad.
2°Utilizar el estadístico F univariado, que se muestra en la siguiente tabla:
17
Observación:Si no se incumple el supuesto de esfericidad es preferible utilizar la aproximación univariada (esfericidad asumida); puesto que en este caso la estadística F es más potente que las pruebas multivariadas, sobre todo cuando las muestras son pequeñas.
Pruebas de efectos intra-sujetos.
Medida: MEASURE_1
.062 2 .031 34.596 .000
.062 1.435 .043 34.596 .000
.062 1.546 .040 34.596 .000
.062 1.000 .062 34.596 .000
.027 30 .001
.027 21.530 .001
.027 23.184 .001
.027 15.000 .002
Esf ericidad asumida
Greenhouse-Geisser
Huynh-Feldt
Límite-inf erior
Esf ericidad asumida
Greenhouse-Geisser
Huynh-Feldt
Límite-inf erior
Fuentevolum
Error(volum)
Suma decuadrados
tipo III glMedia
cuadrática F Signif icación
18
La tabla anterior (F) también rechaza la hipótesis nula y concluimos que los cambios que se producen en el volumen de las lesiones hiperintensas no es el mismo durante los tres años.
Para probar :
Ho: µ = 0
H1: µ ≠0
Utilizamos:
19
Pruebas de los efectos inter-sujetos
Medida: MEASURE_1
Variable transf ormada: Promedio
12.520 1 12.520 71.066 .000
2.643 15 .176
FuenteIntersección
Error
Suma decuadrados
tipo III glMedia
cuadrática F Signif icación
Se rechaza que el volumen promedio de las lesiones hiperintensas, sea cero.
El gráfico de perfil, muestra que el comportamiento de los volúmenes promedios de las lesiones hiperintensas durante los tres años se ajusta a una función lineal.
20
Interprete los resultados.
21
¿Será necesario evaluar las siguientes hipótesis?:
Comparaciones por pares
Medida: MEASURE_1
-.044* .011 .004 -.073 -.014
-.088* .013 .000 -.123 -.053
.044* .011 .004 .014 .073
-.044* .007 .000 -.063 -.026
.088* .013 .000 .053 .123
.044* .007 .000 .026 .063
(J) v olum2
3
1
3
1
2
(I) volum1
2
3
Diferenciaentre
medias (I-J) Error típ. Signif icacióna
Límite inf eriorLímite
superior
Interv alo de conf ianza al 95% para la dif erencia
a
Basadas en las medias marginales estimadas.
La diferencia de las medias es signif icativa al nivel .05.*.
Ajuste para comparaciones múltiples: Bonferroni.a.
22
¿Qué conclusiones puede obtener de los gráficos?
23Interprete los gráficos
24
TAREA
¿SI NO SE CUMPLEN LOS SUPUESTOS, EXISTE OTRO TIPO DE HIPÓTESIS PARA PROBAR:
Ho: Cµ = 0
H1: Cµ ≠0 ?
25
Ventajas:
son básicamente dos:
1º Se requieren menos sujetos experimentales, ya que la prueba tiene mayor potencia estadística, es decir, capacidad para detectar diferencias si es que existen.
2º Conseguimos mejor control de las diferencias entre los sujetos (variabilidad no sistemática) ya que la misma persona es valorada en dos o más momentos o situaciones y, en buena lógica, serán pocas las características del individuo (excluida la variabilidad sistemática de la variable resultado debida al factor que estamos evaluando) que hayan cambiado entre las mediciones; desde luego, habrá menos diferencias de las que deben presentarse entre dos sujetos distintos.
26
BIBLIOGRAFÍA
1. URIEL, EZEQUIEL, ALDAS JOAQUIN. 2005 Análisis Multivariante Aplicado. Editorial Thompson Editores. España
2. DALLAS E. JOHNSON. 2000. Métodos Multivariados Aplicados al Análisis de Datos. International Thomson Editores.
3. HAIR J., ANDERSON R., TATHAM R., BLACK W. 2001. Análisis Multivariante. Prentice Hall.
4. JOHNSON, R.; WICHERN, D. 1982. Applied Multivariate Statistical Analysis. Editorial Prentice – Hall Inc.Englewood Cliffs. New Jersey.
top related