Dra. Adela Del Carpio Rivera
Doctor En Medicina
Análisis Estadístico
ANTE LA GRAN CANTIDAD DE
INFORMACIÓN
Debemos saber discernir entre:
Cuál es la información que necesitamos
Si el estudio tiene real validez
Saber interpretar correctamente la metodología
estadística.
ANALISIS ESTADÍSTICO
El análisis estadístico se divide en tres grandes tipos:
Univariado
Bivariado
Multivariado
ANÁLISIS UNIVARIADO
Univariado
Se describen las características de una variable por vez
También se le conoce como Estadística Descriptiva
ANÁLISIS ESTADÍSTICO UNIVARIADO TABLA Nº 1 FRECUENCIA DE TBC PULMONAR POR ÓRGANO AFECTADO
TIPOS DE TBC Nº PORCENTAJE PORCENTAJE
ACUMULADO
PULMONAR 67 58.27% 58.27%
RENAL 12 10.43% 68.69%
MENÍNGEA 20 17.39% 86.08%
GENITAL 16 13.91% 100%
TOTAL 115 100%
ANÁLISIS BIVARIADO
Se investiga la influencia de la variable Independiente,
por vez, con respecto a la variable Dependiente
ANÁLISIS BIVARIADO
Variable Independiente
Factor de Riesgo:
Beber Agua no potable
Variable Dependiente
Enfermedad:
Cólera
Enfermo
A
g
u
a
+ -
+ 20 40
- 97 59
ANÁLISIS BIVARIADO
Variable Independiente
Factor de Riesgo:
Peso al Nacer
variable dependiente
Enfermedad:
hipertensión sistólica
ANÁLISIS MULTIVARIADO
Se investiga la influencia
de dos o más
Variables Independientes,
junto o no a una o más variables asociadas
(covariables o cofactores)
sobre una o más
Variables Dependientes
ANALISIS MULTIVARIADO: REGRESIÓN LOGÍSTICA
TABLA 1 CONTROL PRENATAL, PARIDAD, EDAD MATERNA
_cons -.2162597 .3206778 -0.67 0.500 -.8454924 .412973uso_ACmode~o .2520376 .056576 4.45 0.000 .1410243 .3630508prob_perso~f -.0940079 .0499524 -1.88 0.060 -.1920242 .0040085 _EESS_pob .066815 .025233 2.65 0.008 .017303 .116327 _ISREGION_5 -.430737 .0963304 -4.47 0.000 -.6197562 -.2417179 _ISREGION_4 -.3908881 .1310198 -2.98 0.003 -.6479745 -.1338016 _ISREGION_3 -.5599627 .0885707 -6.32 0.000 -.7337559 -.3861695 NSE .2683731 .0302954 8.86 0.000 .2089275 .3278187 decision_p -.139124 .0516724 -2.69 0.007 -.2405154 -.0377326 agri -.3392816 .0696039 -4.87 0.000 -.4758581 -.2027051 educ .055531 .0074086 7.50 0.000 .0409939 .0700682 edadnac_2 .0020827 .0004262 4.89 0.000 .0012465 .0029189 edad_nacHV -.0914881 .0236497 -3.87 0.000 -.1378934 -.0450829 n_hijos -.1109933 .0171813 -6.46 0.000 -.1447065 -.0772801 labor_prol .2370946 .0512 4.63 0.000 .1366301 .3375591 multiple 1.173797 .2535498 4.63 0.000 .6762824 1.671311 told_comp .1378946 .0559186 2.47 0.014 .0281713 .2476179 CPci2 -.0067207 .0012622 -5.32 0.000 -.0091973 -.004244 CPci .1713693 .0199854 8.57 0.000 .1321539 .2105846 PS Coef. Std. Err. t P>|t| [95% Conf. Interval] Linearized
Prob > F = 0.0000 F( 18, 1047) = 65.41 Design df = 1064Number of PSUs = 1113 Population size = 6917.9088Number of strata = 49 Number of obs = 8417
La determinación de la presencia o ausencia de un
suceso en dos grupos diferentes es una situación
habitual en los estudios clínicos.
Los resultados se muestran en una tabla de
contingencia 2 x 2.
SIGNIFICADO ESTADÍSTICO
• La lectura de una OR, un RR es idéntica y basta
con aplicar las palabras “veces más” o “por cada 1”
EJEMPLO
• Por ejemplo si una droga con respecto al placebo produce
una OR de 1,3, significa que la droga es 1,3 veces mejor que
el placebo.
• Si se tratara de un estudio sobre el riesgo de un evento sobre
otro, el RR indicaría que el riesgo de eventos terminales que
se podrían esperar de la droga durante el tiempo de
seguimiento es 1.3 veces más alta que el placebo.
El riesgo del grupo control es 1, por lo que un riesgo 1 supone
que no hay diferencias entre la droga y el placebo.
Este tipo de resultados se suele acompañar del intervalo de
confianza (IC)
Que es la expresión de lo que la variabilidad debida al azar
puede hacerlo oscilar en la población real (expresa los límites
que con una cierta seguridad contendrán ese verdadero valor)
• Generalmente los IC se calculan con una seguridad del 95%
• Solo deja una probabilidad de 5% (0.05) de que el verdadero
valor del OR no se halle en ese intervalo;
• Por lo tanto, el IC nos proporciona la misma información
cualitativa que el valor de la p.
COMO SABEMOS SI ES
ESTADÍSTICAMENTE SIGNIFICATIVO?
Si en lugar de OR 1,3 el resultado hubiese sido menor de 1,
como por Ej. 0,2, significa que la droga cura 0,2 y el placebo
sigue con el valor 1, por lo tanto es menos efectiva que el
placebo.
Si el IC del 95% entre 0,1-0,5 sería distinto de la igualdad (p
< 0,05) puesto que este IC no contiene el 1;
Pero si los límites estuvieran entre 0,06 y 1,2 no existiría
significación pues el 1 cae dentro del intervalo
EJEMPLO
En un estudio de casos y controles se quiere determinar si el
consumo de fibra es o no un factor de protección para el
cáncer de colon
1 Calcule un estimador del riesgo asociado a la variable
independiente consumo de fibra.
2. ¿Qué significa este resultado?
CASOS CONTROLES
GRUPO DE
EXPUESTOS
92 160
NO EXPUESTOS 108 140
200 300
OR = (92x140)/(160x108) = 0.75 o 75%
OR menor de 1 significa que el consumo de fibra es un factor
de protección
EJEMPLO
En un estudio de pacientes hipertensos se pretende investigar
la posible asociación entre la probabilidad de padecer un
infarto y el grado de control de la hipertensión.
Para ello se analiza una muestra aleatoria de 728 pacientes,
observándose los siguientes resultados
RESULTADOS
MAL CONTROL BUEN
CONTROL
INFARTO 10 07 17
NO INFARTO 250 461 711
260 468 728
El procedimiento estadístico habitual para contrastar la
presencia de asociación es utilizar la prueba del chi² o la
prueba exacta de Fisher, cuando las frecuencias de las
celdas son pequeñas.
El valor del chi² para esa tabla es de 3.1 que corresponde a un
nivel de probabilidad de 0.08.
De acuerdo con los datos de este ejemplo:
El riesgo de infarto en el grupo de mal control es
10 / 260 = 0.04,
mientras que el riesgo en el grupo de buen control es de
7 / 468 = 0.015.
Existen diferentes procedimientos para cuantificar la
importancia de la asociación:
Cuando se utiliza el cociente de esos dos riesgos
0.04 / 0.015 = 2.6
Nos indica cuánto más probable es que ocurra el suceso en el
primer grupo frente al segundo.
Es lo que se conoce como Riesgo Relativo (RR).
Actualmente otra medida muy utilizada es la que se
denomina "odds ratio" (OR), para la que no hay un
término en castellano que sea bien aceptado.
El odds (ventaja) es otra forma de representar un riesgo,
mediante el cociente entre el número de veces que ocurre el
suceso frente a cuántas veces no ocurre.
Así un odds de 3 indica que 3 personas sufrirán el suceso
frente a 1 que no lo hará.
En la tabla anterior el odds de infarto en el grupo de Mal
Control es 10 / 250 = 1 / 25 = 0.04, es decir que ocurre 1
vez por 25 veces que no ocurre.
En el grupo de buen control el odds es 7 / 461 = 0.015.
El cociente de los odds de los dos grupos es lo que se
denomina odds ratio y constituye otra forma de cuantificar la
asociación entre dos variables dicotómicas. En la tabla
anterior el valor del odds ratio es aproximadamente 2.6
Así un odds de 3 indica que 3 personas sufrirán el suceso
frente a 1 que no lo hará.
En la tabla anterior el odds de infarto en el grupo de Mal
Control es 10 / 250 = 1 / 25 = 0.04, es decir que ocurre 1
vez por 25 veces que no ocurre.
El cálculo del odds ratio a partir de los datos de
frecuencia de una tabla 2 x 2 es muy sencillo:
cb
daOR
a b
c d
)(
)(
db
b
ca
a
Grupo A Grupo B
Suceso a b
No suceso c d
El riesgo relativo de aparición del suceso del grupo
A frente al grupo B se calcula como:
Razones para utilizar el odds ratio
Está claro que la interpretación del riesgo relativo es más
intuitiva que la del odds ratio
¿Por qué entonces se usa tanto el odds ratio. Hay varias
razones:
. En primer lugar puede ser calculado en cualquier tabla 2 x 2
Mientras que el riesgo relativo no se puede calcular en los
estudios caso-control.
Permite examinar el efecto que otras variables pueden causar
en esa asociación (como podrían ser por ejemplo la edad, el
sexo, etc).
Otra propiedad interesante del odds ratio es que no varía
aunque se cambie el orden de las categorías en cualquiera de
las variables, lo que no ocurre con el riesgo relativo.
Cuando los riesgos (o los odds) en ambos grupos son
pequeños (inferiores al 20 %) el odds ratio se aproxima
bastante al riesgo relativo pudiendo considerarse como una
buena aproximación de éste.
La valoración estadística de las asociaciones encontradas debe
realizarse mediante el cálculo de los correspondientes
intervalos de confianza.
EL ODDS RATIO PERMITE
1. Reconocer la naturaleza como factor de riesgo o de
protección de una exposición.
2. Identificar la magnitud o fuerza de la asociación, lo que
permite hacer comparaciones.
3. Su valor es independiente de la incidencia de la condición
en estudio.
4. De gran utilidad en estudios de casos y controles
5. Su valor suele ser semejante al del RR.
Interpretación del valor de OR
calculado
Estrictamente hablando el odds ratio indica la magnitud de
asociación entre exposición y resultado (en otras palabras el
riesgo de haber estado expuesto dada la enfermedad).
Si el cociente calculado determina un valor de 1, esto
significa que no hay asociación entre las variables analizadas
(la exposición positiva o negativa no hace diferencia respecto
al riesgo de enfermar).
Un valor mayor que 1 indica una mayor frecuencia de
exposición de la variable independiente entre los enfermos
(casos). Por tanto, el factor estudiado se asocia con un mayor
riesgo de enfermar.
Si el valor del OR calculado es inferior a 1, esto indica mayor
frecuencia de exposición entre los sujetos sanos (controles).
En este caso, la presencia del factor estudiado reduce el
riesgo de enfermar (actuando como un factor de protección).
INTERPRETACION DEL ODDSVALOR ODDS
RATIO
Intervalo de
confianza
inferior
Intervalo de
confianza
superior
Tipo de
asociacion
1 No evidencia de
asociación
Mayor de 1 >1 >1 Significativa, riesgo
Mayor de 1 < 1 >1 No significativa
Menor de 1 < de 1 < de 1 Significativa,
protección
Menor de 1 < de 1 > de 1 No significativa
Resumen
ANALISIS DE DATOS CUANTITATIVOS
PROGRAMAS COMPUTACIONALES
ESTADÍSTICA:
Descriptiva
Inferencial
ANALISIS DE DATOS CUANTITATIVOS
PROGRAMAS
COMPUTACIONALES
SPSS
MINITAB
SAS
STATS
Paquetes estadísticos
Conjunto de programas y subprogramas informáticos
conectados
Para el análisis estadístico de datos
Que permite resolver problemas de estadística descriptiva,
inferencial o ambas.
ANALISIS DE DATOS CUANTITATIVOS
ESTADISTICA
1. DESCRIPTIVA
Distribución
De Frecuencias
Medidas de
Tendencia central
Medidas de
Variabilidad
Gráficas
Puntuaciones Z
Media
Mediana
Moda
Rango
Desviación estándar
Varianza
ANALISIS DE DATOS CUANTITATIVOS
ESTADISTICA
2 INFERENCIAL
Estimar
Parámetros
Probar
Hipótesis
Distribución
muestral
Coeficientes
de correlación
Prueba t
Prueba de la
Diferencia de
proporciones.
Análisis de
varianza.
que sirva
para
y
Se basa
en
Análisis
Paramétricos
Análisis no
Paramétricos
Chi cuadrado
Coeficientes de
Spearman y
Kendall.
Coeficientes para
tabulaciones
cruzadascomo
como
PRUEBAS DE HIPOTESIS
1. Pruebas Paramétricas
Variables que tienen distribución normal
Ejm. t student, Análisis de Varianza unidireccional,
Coeficiente Correlación de Pearson, Diferencia
de Proporciones, Regresión Lineal.
2. Pruebas No Paramétricas
Chi Cuadrado,
Coeficiente para tabulaciones cruzadas
Coeficiente de Spearman
Coeficiente de Kendall