tema 11. ejemplos de contraste de hipotesis en una y dos poblaciones independientes

19
Maitane Ferrer, Gaizka Gutiérrez e Iciar Martín 20,22 y 23-04-2015 EJEMPLOS DE CONTRASTE DE HIPOTESIS *CUANDO APAREZCA EL SÍMBOLO SIGNIFICA QUE ES UN COMANDO DE STATA. A. CONTRASTE DE HIPÓTESIS EN UNA POBLACIÓN Vamos a trabajar, en un primer momento con la base de datos INMA. Vamos a ver como se plantean los intervalos de confianza y los test de hipótesis. EJEMPLO 1: ¿Qué población objetivo tendrá la base de datos INMA? Los recién nacidos en Gipuzkoa. De esta población objetivo, no conocemos ningún parámetro: ni la media, ni la desviación estándar... son desconocidas. Como hemos dicho, los distintos parámetros son desconocidos, por tanto, para poder conocer la media u otros valores, escogeremos una muestra, en este caso de 250 individuos (n=250, es el tamaño muestral). Para cada uno de los recién nacidos tenemos diferentes variables. Dentro de esta base de datos, tenemos distintas variables cada una con su distribución. En este caso, vamos a estudiar la variable peso, la cual es una variable continua, medida en escala de razón. Aunque también estudiaremos otras variables, como el género, que es una variable cualitativa, en este caso medida en escala nominal. Escala de razón: Existe un 0 absoluto Las diferencias tienen sentido (1000 g es más que 400 g) Las razones tienen sentido(3000g es el triple de 1000g) Es imprescindible conocer el tipo de variable con la que vamos a trabajar para utilizar los métodos adecuados de cada distribución. STATA: Para estimar de la población objetivo, basándonos en la media muestral, hay que introducir el siguiente comando: mean peso o ci peso (sale con las dos)

Upload: antonio-paquito

Post on 22-Sep-2015

17 views

Category:

Documents


3 download

DESCRIPTION

Comi

TRANSCRIPT

  • Maitane Ferrer, Gaizka Gutirrez e Iciar Martn 20,22 y 23-04-2015

    EJEMPLOS DE CONTRASTE DE HIPOTESIS

    *CUANDO APAREZCA EL SMBOLO SIGNIFICA QUE ES UN COMANDO DE STATA.

    A. CONTRASTE DE HIPTESIS EN UNA POBLACIN Vamos a trabajar, en un primer momento con la base de datos INMA. Vamos a ver como se plantean los intervalos de confianza y los test de hiptesis. EJEMPLO 1: Qu poblacin objetivo tendr la base de datos INMA? Los recin nacidos en Gipuzkoa. De esta poblacin objetivo, no conocemos ningn parmetro: ni la media, ni la desviacin estndar... son desconocidas. Como hemos dicho, los distintos parmetros son desconocidos, por tanto, para poder conocer la media u otros valores, escogeremos una muestra, en este caso de 250 individuos (n=250, es el tamao muestral). Para cada uno de los recin nacidos tenemos diferentes variables. Dentro de esta base de datos, tenemos distintas variables cada una con su distribucin. En este caso, vamos a estudiar la variable peso, la cual es una variable continua, medida en escala de razn. Aunque tambin estudiaremos otras variables, como el gnero, que es una variable cualitativa, en este caso medida en escala nominal.

    Escala de razn:

    Existe un 0 absoluto

    Las diferencias tienen sentido (1000 g es ms que 400 g)

    Las razones tienen sentido(3000g es el triple de 1000g)

    Es imprescindible conocer el tipo de variable con la que vamos a trabajar para utilizar los mtodos adecuados de cada distribucin. STATA: Para estimar de la poblacin objetivo, basndonos en la media muestral, hay que introducir el siguiente comando:

    mean peso o ci peso (sale con las dos)

  • Los distintos resultados sern la media, el error estndar y el intervalo de confianza. La media nos da como resultado 3301.948g. Este valor es una estimacin puntual, basada en una muestra de 250 individuos (n=250). Si hubisemos cogido otro muestra distinta (con otro tamao muestral y otros individuos), habramos obtenido otro valor diferente, por tanto, es un ESTADSTICO MUESTRAL. Este valor no tiene porqu coincidir con la media de la poblacin objetivo, por ello, es necesario realizar un INTERVALO DE CONFIANZApara asegurarnos de que la media se encuentre entre el lmite superior (3355.74) e inferior(3248.156) del intervalo. En este caso el nivel de confianza establecido ser del 95%. El valor obtenido tiene una probabilidad del 95% de encontrarse entre los lmites anteriormente dichos. As conoceremos el valor de 100-95=5% ( = 0.05). Para poder cambiar el nivel de confianza, tendremos dos formas de hacerlo:

    1. Statistics / Summaries, tables and tests / Summary and descriptive statistics / Confidence intervals.

    Ah introduciremos la variable peso y en confidencelevel seleccionamos el intervalo de confianza deseado. *Lo podremos hacer con variables continuas o discretas(solo si tienen clases de 0 y 1). 2. Statistics / Summaries, tables and tests / Summary and descriptive statistics / Means

    Introducimos la variable peso, y en la pestaa de reporting, cambiamos el nivel de confianza.

    Una vez fijado el nivel de confianza(en este caso 95%), tendremos un intervalo de valores. Cuanto ms grande sea la confianza, ms amplio ser el intervalo. Mientras que cuanto ms pequea sea el nivel de confianza, el intervalo ser menor. Es decir, el intervalo es ms amplio cuando fijamos un nivel de confianza del 99%, y ms pequeo cuando lo fijamos del 95%. Ahora realizaremos un TEST DE HIPTESIS. Por cada valor de la media de peso, podramos hacer un test de hiptesis diferente. En este caso, escogeremos como media 2900g (aunque podramos escoger cualquier otro valor). Para ello, formularemos un hiptesis nula(H0),que es el valor que pensamos que tiene la media en la poblacin. Por otro lado, la hiptesis alternativa (H1) para contrastarla con la hiptesis nula. Est podremos fijarla libremente, y segn la hiptesis alternativa, obtendremos distintos tipos de test:

  • STATA: FORMULAR HIPTESIS En este caso, escogemos el test de hiptesis de dos lados, es decir, que sea diferente a 2900(media esperada de peso en la poblacin objetivo). Para realizar el test de hiptesis, introduciremos el siguiente comando:

    ttest peso=2900

    Este test es One-sample o de una muestra, ya que nada mas estamos considerando una muestra de una poblacin objetivo.

    N=250(nmero de observaciones, tamao muestral)

    Media de peso

    Error estndar:

    Desviacin estndar

    Para calcular el lmite superior del intervalo de confianza al 95%:

    di Lim sup CI 95%= media + (error estndar * 1.96) di "Lim sup CI 95%= 3301.94 + (27.31 *1.96)=3355.48

    Para calcular el lmite inferior del intervalo de confianza al 95%:

    di Lim inf CI 95%= 3301.948 (27.31 * 1.96)= 3248.416 *Para calcular los lmites superior e inferior, necesitamos el error aleatorio, que se calcula multiplicando el error estndar por una constante. K, que vara segn el intervalo de confianza. En el caso del intervalo de confianza al 95%, K=1,96. El intervalo de confianza resultante nos indica que tenemos una probabilidad o confianza del 95% de encontrar el parmetro x(la media de peso en la poblacin objetivo) entre 3248.416 (lmite inferior) y 3355.48 (lmite superior).

  • Hiptesis alternativa de un lado con cola a la izquierda.

    *Probabilidad de que la t de student tome valores menores o iguales que el valor t=14.7168

    Hiptesis alternativa con cola a ambos lados.

    Hiptesis alternativa con cola a la derecha.

    Explicacin de las grficas:

    Hemos calculado la media muestral,, con la siguiente frmula: Este parmetro sigue una distribucin, al menos,aproximadamente normal, de

    media y de desviacin estndar /.~ (,

    ).

    La distribucin, si la hiptesis nula es verdadera, estar centrada en 2900. Sin embargo, a nosotros nos ha salido un valor de la media muestral de 3301, que estara a la derecha. Esta distribucin(la de la hiptesis nula), hay que estandarizarla mediante la siguiente frmula:

    Ha: mean < 2900 Pr(T < t) = 1.0000*

    Ha: mean !=2900 Pr(|T| > |t|) = 0.0000

    Ha: mean > 2900 Pr(T > t) = 0.0000

  • Como es desconocida,vamos a calcular la desviacin estndar en la muestra. Cuando ocurra esto, la distribucin normal pasar a ser t de student con n-1 grados de libertad. En este caso, como el tamao muestral es 250, tendr 249 grados de libertad. Como el tamao muestral es mayor de 35, la t de student se convierte en una normal N(0,1)

    di t= (3301.948-2900)/27.31=14.717979 La resta de 3301.948- 2900, y lo dividimos entre el error estndar, obtendremos 14.7178 = t , que ser como se separa la media si Ho es cierta. Se resta: la media- la media si Ho es cierta/ error estndar.

    El valor de la media muestral en la distribucin estandarizada es 14.717979. Si de verdad fuera cierto que el peso en la poblacin objetivo es 2900, la probabilidad de observar un valor tan distante como el que hemos observado de la media, el 3301, o todava mas raro; sera lo que queda a la derecha del valor p (vase en el dibujo).

    Esa probabilidad sera la que queda en la t de student y en la estandarizada, es decir, de 3301y 14,717979, a la derecha (es la misma). Esa probabilidad es el valor p para un test con cola a la derecha. Este valor es prcticamente 0, por eso es menor que 0.0001, ya que nunca se puede poner 0.0000, es decir p

  • EJEMPLO 2: En este caso vamos a realizar un test de hiptesis, cuando la media en la poblacin objetivo es 3260g.

    o Ho: = 3260 o H1: 3260

    Statistics/ Summaries, tables and tests / Classical tests of hypotheses /One-sample

    mean comparison tests En variable ponemos peso y al 95% de nivel de confianza. En este caso tambin es One-sample porque solo tenemos una muestra de una poblacin objetivo.

    Como podemos observar, solo ha cambiado la hiptesis, pero ni el valor de la media, ni el de la desviacin estndar, etc. ha cambiado. Tambin cambia el valor de t. Si la media es de 3260, la probabilidad de observar 3301 ser la p del test de cola a la derecha, ya que ese valor est ms a la derecha que 3260(la media), es decir 0.0629: Para el test de los dos lados, sera ese valor multiplicado por dos es decir: *Como es de dos colas, cogemos el valor del de una cola y lo multiplicamos por dos. En este caso, por tanto, la p=0.0629> que (0.05). Por tanto si p> NO RECHAZAMOS LA HIPTESIS NULA, ya que los datos que tenemos no contienen suficientes evidencias como para rechazarla, es decir, NO SON ESTADSTICAMENTE SIGNIFICATIVOS. En este nuevo ejercicio, comparndolo con el anterior, no ha cambiado ninguno de los parmetros en la muestra, solo el valor de la media en la poblacin objetivo. Por tanto, ha cambiado el valor de p.

    Ha: mean > 3260 Pr(T > t) = 0.0629

    Ha: mean != 3260 Pr(|T| > |t|) = 0.1258*

  • Otra forma de saber si rechazar a hiptesis nula o no es :

    Si el intervalo de confianza abarca el valor que creemos que es la media(Ho)ESTADSTICAMENTE NO SIGNIFICATIVO.

    Si el intervalo de confianza no abarca el valor que creemos que es la media, es decir, el 3260)ESTADSTICAMENTE SIGNIFICATIVO.

    *Esto solo podremos utilizarlo cuando el test sea de dos colas. valorp=NIVEL DE SIGNIFICACIN DE LOS DATOS

    B. CONTRASTE DE HIPTESIS EN DOS POBLACIONES INDEPENDIENTES

    EJEMPLO 3: En este caso el ejemplo, lo haremos con 2 poblaciones objetivo (son independientes):

    Poblacin objetivo tratada con tratamiento A.

    Poblacin objetivo tratada con tratamiento B.

    Nios(A) cada uno con su media y su desviacin estndar. Nias(B) con otra media y desviacin estndar.

    La hiptesis que vamos a realizar ahora ser para saber si la media de nios y nias va a ser la misma:

    o Ho: = o H1=

    Ho significa que la media de peso de los nios y nias es igual.Por tanto, si fuese cierta no habra asociacin entre el gnero y el peso de los recin nacidos.

    H1 significa que las medias de pesos de nios y nias son diferentes, por tanto habra asociacin entre el peso y el gnero. Como vimos, las asociaciones en medicina son de gran inters.

    Statistics/Summaries, tables and tests/ Classical tests of hyphoteses / Two group

    mean comparison

    *Ah introducimos la variable peso y la variable gnero. Escogemos tambin el nivel de confianza(de ah, obtendremos ).

    *Escogemos Two-group mean comparison test cuando tenemos en una variable todos los pesos juntos y en otra variable el gnero *Escogeremos Two sample cuando en una variable tengamos las nias con sus pesos y en otra los nios con sus pesos. Es decir, cuando estn separados por gnero.

    nivel de significacin del contraste

  • La variable a medir es el peso, una variable cuantitativa numrica en escala de razn. Vamos a contrastar y comparar las medidas poblaciones diferentes (nios y nias). Los datos se diferencian en el gnero. Las variables que vamos a introducir son el peso y genero, escogiendo un nivel de confianza de 95. Al elegir un nivel de confianza del 95%, ser el 5%, es decir, 005.

    Como podemos observar, la tabla identifica dos grupos, nios y nias, siendo 122 nias y 128 nios. Nos da la media, error estndar, desviacin estndar y el intervalo de confianza. El error estndar que aparece, se calcula

    .

    El intervalo de confianza del 95% se calcula a partir del error aleatorio()(1.96 x error estndar

    Estimacin puntual para a: se mira debajo de la media

    A(nios): 3354.273 B(nias):3247.049

    Estimacin por intervalos de confianza (95%)

    A: 3174.411 3319.688 B: 3275.371 3433.176

    Combinated: nos da valores para toda la poblacin si diferenciar por genero.

    Diff: estima la diferencia.

    Media: es -107.2243, lo que significa que hay 107 gramos de diferencia. La diferencia de media nos muestra cuanto ms pesan los nios respecto a las nias. En este caso, nos sale negativo por restarle al peso de las nias el peso medio de los nios.

    La diferencia se calcula tambin de la desviacin y del intervalo de confianza (cuanto mas puede pesar un nio que una nia, los valores que pueden coger la diferencia de medias). El intervalo de confianza(95%) para la diferencia de medias se calcula como(la diferencia de medias +/- el error estndar) *1.96

  • El intervalo de confianza de la diferencias de media no contiene al 0, ya que los nios solo pueden pesar entre 214 g y 0.226g.

    Las hiptesis de inters sern:

    Las medias son iguales (media nias igual a media nios, o la diferencia de ellos es iguala 0)

    Las medias no son iguales.

    o Ho: = ; = 0 o H1: ; 0

    Cuando p(0.0495) es menor que alfa, RECHAZBAMOS LA HIPTESIS NULA, que en este caso es que la media de los nios es la misma que la de las nias.

    0.0495 es la probabilidad de si Ho es cierta, de observar esos valores. Por qu la p de cola al lado derecho es tan grande? Esto es debido a que nosotros hacemos la media restando nias menos nios. Por eso sale negativo, ya que las nias tienen una media menor que los nios. Entonces, como se observa una diferencia de -107, es decir, valor negativo. As que la probabilidad de observar un valor de -107 o ms raro, ser la probabilidad de 1-p. Por ello, la p con cola al lado derecho es tan grande. Ambas tienen distribucin normal, por ello la diferencia entre dos normales, tambin dar una normal.Sin embargo, si lo que restsemos fuese nios menos nias, ese valor de p tan alto nos saldra en el lado contrario, es decir, a la izquierda. La probabilidad de encontrar valores mayores de 107 es 1-P (T0.0495)

    Utilidad para el seminario: media de tiempo haciendo deporte es lo mismo en chicas que en chicos.

    APLICACIN A LA MEDICINA Caso, ejercicio 1 Supongamos que se selecciona una muestra aleatoria de ocho mujeres que toman anticonceptivos orales (AO) en el grupo de edad de 35 a 39 aos, resultando una media de presin sistlica de 132'66 mmHgy una desviacin estndar de 15'34 mmHg. Otra muestra aleatoria de 21 mujeres en el mismo grupo de edad, que no toman AO, tiene una media de presin sistlica de 127'44 mmHgy desviacin estndar de 18'23 mmHg.

  • a) Con estos datos, puede decirse que la toma de AO en mujeres de 35-39 aos afecta a la presin sistlica?

    La pregunta es una hiptesis en forma de pregunta. Es la forma de estudiar la asociacin entre la toma de AO y la presin arterial de las mujeres.

    Hipotesis:

    La media de la presin arterial de las mujeres que toman AO es igual a la presin arterial de las mujeres que no lo toman. Si fuese cierta la hiptesis nula, la toma de AO no afectara a la presin arterial(la media de las dos poblaciones sera la misma)

    Los datos estn dados, no se debe calcular nada. Nos dan la desviacin estndar, por lo que podemos calcular la varianza elevndolo al cuadrado.

    a = N (, ) / b = N (, )

    Sa= estimacin puntual de Sb= estimacin puntual de

    Para que te sirve calcular la varianza? Distribuciones de la media muestral de la presin arterial de las mujeres que toman AO sera aproximadamente normal. Vamo sa hacer la siguiente suposicin: Nos interesa comparar las medias, pero pueden ser diferentes por lo que tambin puedo hacer contraste de varianzas (siempre que tengamos una varianza conjunta comn). En este caso, nos centramos en el contraste de medias, aunque podemos hacerlo con una varianza comn o con diferentes varianzas. Podremos hacer tanto contraste de varianzas como de medias. Como no hemos hecho contraste de varianzas, buscaremos la varianza comn y nos centraremos en la diferencia de medias. Si suponemos que las varianzas son iguales, sacamos una varianza comn mediante la siguiente formula:

    = =

  • Nb-1 son los grados de libertad en la segunda muestra y na-1 son los grados de libertad en la primera muestra. 1-FORMULAR LA HIPTESIS

    2-SELECCIN DEL ESTADSTICO DE CONTRASTE Estadstico de contraste: error estndar para la diferencia de medias si considero que las varianzas son diferentes. Pero puede ocurrir que las varianzas sean iguales. Para ello utilizaremos la segunda ecuacin, cogiendo solo un sigma comn (sin pinchar el cuadro de STATA donde pone unequal variance). -Para varianzas diferentes:

    -Para varianzas iguales:

  • 3-NIVEL DE SIGNIFICACIN DE LOS DATOS P (TEST DE DOS COLAS): Nivel de significacin de los datos p: si las varianzas son diferentes ser 0.779 y si las varianzas son iguales ser 0.6934. -Para varianzas diferentes:

    -Para varianzas iguales:

    Haremos este proceso utilizando STATA: Para utilizar STATA no se necesita tener ninguna variable.

    Classical test of hypothesis/Two-sample mean-comparison calculator

  • Como podemos observar en la imagen superior, en este caso no seleccionamos la casilla de unequal variance, ya que suponemos que las varianzas son iguales, es decir, hay una varianza comn. Pero si quisiramos hacerlo con varianzas diferentes seleccionaramos la casilla.

    Como en nuestro caso, p = 0.4763 (test de dos colas) y es 0.05 (95% de nivel de confianza):p > nuestros datos NO CONTIENEN SUFICIENTE EVIDENCIA COMO PARA RECHAZAR LA HIPTESIS NULA, ya que NO RESULTA ESTADSTICAMENTE SIGNIFICATIVO(no se rechaza). Nos encontramos ante un ensayo clnico, es decir, una serie de pruebas que se hacen sobre personas para probar un tratamiento. Para ello, se pide el consentimiento de todos ellos. La media de xa sigue una distribucin aproximadamente normal, al igual que xb. Podemos tener dos situaciones:

    Suponer las desviaciones estndar diferentes: Desviacin estndar comn, por lo que solo se diferenciaran en el nivel de las medias.

    Sample 1 (AO) Sample 2 ( )

    Size: 8 Mean: 132.66

    Desviacin estndar: 15.34

    Size: 21 Mean: 127.44

    Desviacin estndar: 18.23

  • Es muy importante saber que vamos a comparar varios tratamientos para saber cual es el mejor. En este caso solo tenemos mujeres que toman AO o no, pero podemos tener ms de un tratamiento. Nos encontramos ante un ensayo clnico, es decir, una serie de pruebas que se hacen sobre personas para probar un tratamiento. Para ello, se pide el consentimiento de todos ellos. Es un tipo de diseo epidemiolgico. SEGUIMOS CON EL EJEMPLO DE AO: ESTE ES EL CASO DE LAS VARIABLES CONTINUAS La media de xa sigue una distribucin aproximadamente normal, al igual que xb. Es la distribucin en la poblacin objetivo. Podemos tener dos situaciones:

    Suponer las desviaciones estndar diferentes. Desviacin estndar comn, por lo que solo se diferenciaran en el nivel de las medias,

    no en la dispersin de la variable. Es muy importante saber que vamos a comparar varios tratamientos para saber cul es el mejor. En este caso solo tenemos mujeres que toman AO o no, pero podemos tener ms de un tratamiento. La hiptesis que vamos a utilizar es la siguiente:

    Si las medias son iguales, los AO no afectan a la presin arterial sistlica (PAS). Despus de fijar la hiptesis, se selecciona el estadstico de contraste. La diferencia entre los estadsticos de contraste es el denominador, ya que consideramos las varianzas iguales o no. En STATA lo representamos seleccionando el cuadro o nounequal variances (varianzas diferentes).

    Como se calcula el valor de p, el nivel de significacin de los datos considerando que

    las varianzas son distintas. (El 0 del numerador es la diferencia entre medias, al ser iguales dar 0, siguiendo la hiptesis nula). Si las desviaciones tpicas son iguales se cambiar el denominador.

    Utilizamos la opcin de two-sample, para estudiar una dos muestras de dos poblaciones objetivo cada una. Selecciones el cuadrado porque suponemos que las varianzas son diferentes.

  • Statistics Summary Classical Two-sample comparison calculator. Como podemos ver, X corresponde a la presin arterial de las mujeres que toman anticonceptivos orales y tiene una media muestral de 132.66. El error estndar (): es la desviacin entre la raz cuadrada del tamao muestral y se calcula: desviacin estndar entre la raz cuadrada del tamao muestral. El error mximo es la diferencia entre el mximo del intervalo y el mnimo, es el doble de psilon (error estndar).

    Intervalo de confianza: la media de presin arterial va a estar entre los dos valores, entre los lmites superior e inferior del intervalo, con un nivel de confianza del 95%. Si no consideramos quien toma AO o no, tenemos toda la poblacin de mujeres, (combined) y la media de presin arterial se encuentra entre 122 y 135, con un nivel de confianza del 95%.

    t es el mismo valor que tiene el estadstico test cuando suponemos diferencia de varianzas. Hiptesis nula: las medias son iguales. Tenemos tres hiptesis alternativas:

    Diferencia es menor que 0 (cola a la izquierda:0.7751) Diferencia de medias es diferente a 0 (test de dos lados: 0.4497) Diferencia es mayor que 0 (cola a la derecha: 0.224)

    El valor del estadstico test en mi muestra ha cado en el 5,22 (diferencia de medias

    muestrales, ). Si hacemos la resta de medias alrevs, nos habra salido el signo negativo, siendo el de dos colas igual pero cambiando los extremos. Si observamos ahora la t de student con 27 grados de libertad, el 5.22 equivale a 0.7761. Por qu utilizamos 27 de libertad? Los grados de libertad son n-1. Tenemos diferentes valores de presiones arteriales en cada muestra.

  • Por ejemplo, en la primera muestra tenemos X1 que es la presin arterial de la primera mujer, X2 la presin arterial de otra mujer, X3 Y as hasta 8. Si sumo todos y los divido entre 8 obtenemos la media muestral (137.66). EN este ejemplo, el grado de libertad sera 7 (n-1).

    Nosotros podemos fijar n-1 de los valores libremente a cualquier valor (por ejemplo 3046), pero si quiero que la media se conserve el ltimo valor debe quedarse fijo.

    El n de la primera muestra es 21 y el de la segunda 8, por lo que el grado de libertad es 27. (N total = 29 n-2 = 27)Cuando se consideran varianzas diferentes, no se utiliza el 27, sino que se utiliza otro grado de libertad que se hace mediante una aproximacin, que en este caso como consideramos varianzas diferentes sern 15.032 (como aparece en la tabla).

    En la t de student con 27 grados de libertad, el 5.22 equivale a 0.67. En el test de dos lados, como p = 0.4497 > 0.05 podemos decir que los datos que tenemos NO CONTIENEN SUFICIENTE EVIDENCIA COMO PARA RECHAZAR LA HIPTESIS NULA. No hay asociacin entre AO y la presin arterial sistlica. Ahora volvemos a hacer el test pero suponiendo varianzas iguales: no seleccionamos unequal variances. Como vemos el grado de libertad es 27, porque consideramos las varianzas iguales. Adems,

    como p < 0.4796 podemos decir que los datos que tenemos NO CONTIENEN SUFICIENTE EVIDENCIA COMO PARA RECHAZAR LA HIPTESIS NULA. No hay asociacin entre AO y la presin arterial sistlica. Hay una relacin entre el intervalo de confianza y el resultado del test de hiptesis de 2 lados. Si nos fijamos en el intervalo de confianza para la diferencia de medias, va desde -9 hasta 20 y dentro de ese intervalo esta contenido el valor 0, que es la hiptesis nula. Si nos aparece un intervalo de confianza donde se encuentre la diferencia de medias, diremos que el resultado del test va a ser NO SIGNIFICATIVO. Si el intervalo de confianza fuese del 9 al 20, no contendra el 0, y el resultado del test sera SIGNIFICATIVO.

  • OTRO ENSAYO CLNICO EJERCICIO 3. AHORA ESTAMOS CON PROPORCIONES SA. Peterson y colaboradores publican en el New England Journal of Medicine 297:341-45, 1977, que:

    Para determinar si un rgimen con grandes dosis de anticido es efectivo, en relacion con la curacin de la ulcera duodenal, se realizo un ensayo clinico incluyendo 74 pacientes con ulcera demostrada. A dichos pacientes se les asocio, al azar, un tratamiento anticido o un placebo inerte.

    Al cabo de 28 dias, 28 pacientes de los 36 que recibieron el tratamiento anticido estaban completamente curados, comparado con 17 de los 38 pacientes que recibieron el placebo (p < 0.005).

    Tenemos placebo y anticido para tratar una enfermedad y vamos a asignar el tratamiento al azar, por una tabla de nmeros aleatorios. Todos los individuos tendrn mismos valores en todas las variables salvo en uno, el tratamiento.

    Utilizamos en ambas muestras una variable binomial. En este caso, vamos a trabajar con proporciones de curaciones ^p (proporcin muestral). No voy a utilizar las 28 curaciones, sino que utilizo la proporcin de curacin (se han curado 28/36) es decir, la proporcin muestral es 0.78 en la primera muestra. Por otro lado, la proporcin de curaciones en la segunda muestra ser del 0.45, es decir, 45% de curaciones, ya que de 38 individuos, se han curado 17 (17/38). Esto quiere decir que, tambin los mdicos tienen efecto placebo sobre el paciente, un efecto placebo. Hiptesis:

    Igualdad de proporciones Diferencia de proporciones (antes diferencia de media) que sigue una aproximacin a

    la normal Ho: = / = 0

    H1: / 00

  • Como ambas son binomiales, al estandarizarlas conseguiremos una distribucin aproximadamente normal, por tanto, la diferencia entre dos normales (diferencia de proporciones) nos dar una distribucin aproximadamente NORMAL.

    Statistics / Summaries, tables and tests /Classicaltests of hyphoteses /Two-sample proportion test calculator

    Nos pedir los siguientes datos:

    Tamao de la muestra: 36 (en la primera muestra) y 28 (en la segunda muestra)

    Proporcin: 0.78 (en la primera) y 0.45 (en la segunda)

    Debemos recordar que en este test estamos trabajando con proporciones.

    Como en este ejemplo es un test de dos colas (ya que es que sea distinto, no mayor o menor), el valor de p ser 0.0036 Entonces si p < 0.05 (valor de )RECHAZAMOS LA HIPTESIS NULA, SON ESTADSTICAMENTE SIGNIFICATIVOS.

    Ha: diff != 0 Pr(|Z| < |z|) = 0.0036

  • Error estndar:

    Desviacin estndar()/ Error aleatorio():

    Error estndar * K=(/)* 1.96 Error aleatorio mximo: Es la diferencia entre el lmite superior e inferior=2*