4)intervalos de confianza - test de hipóstesis

Upload: pbchanta

Post on 27-Feb-2018

218 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/25/2019 4)Intervalos de Confianza - Test de Hipstesis

    1/24

  • 7/25/2019 4)Intervalos de Confianza - Test de Hipstesis

    2/24

    INTRODUCCINLos objetivos de esta unidad son:

    streo.

    Conocer cmo utilizamos la curva de distribucin normal en la distribucin de muestreo.

    s el intervalo de confianza y cmo lo utilizamos para inferir cuan bientra muestra a la poblacin.

    REPlmente

    les pod

    no de los principales propsitos del anlisis estadstico es usar la informacin obtenida deuna muestra de individuos para realizar inferencias de lo que ocurre en la poblacin.

    dsticainferen

    Recordemos lo que resumimo

    Las investigaciones trabajan con muestras.

    s

    En nuestras investigaciones siempre trabajamos con muestras. Sines saber qu pasa en la

    Conocer la distribucin de probabilidad terica de mue

    Entender el Teorema del Lmite Central y su utilidad.

    Interpretar qu es el error estndar y cmo se calcula a partir de los datos de unamuestra.

    Entender qu erepresenta nues

    ASANDO!!Ac retomaremos algunas de los conceptos que vimos en la unidad de Azar. Eventuara ser til releerla!!!

    embargo el propsito de nuestra investigacin nomuestra, si no extrapolar esos hallazgos a toda la poblacin de individuossimilares a la muestra.

    U

    En otros casos, lo que se pretende es tomar decisiones, y aqu tambin la estacial nos lo permite, siempre con un margen controlado de error.

    A pesar del enorme numero de problemas mdicos que se intentaninvestigar y del gran nmero de soluciones estadsticas, hay dos formas

    inferencia o estimacin y el

    s en la unidad de azar:

    Resumen la experiencia con algunos individuos con la intencin de generalizar la

    conclusiones.

    MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS 22

    bsicas de realizar anlisis estadstico: Latesteo de hiptesis o test de hiptesis.

  • 7/25/2019 4)Intervalos de Confianza - Test de Hipstesis

    3/24

    En la mayora de los casos no se conocen los parmetros reales de la poblacin.

    a, forman la

    ue hicieron en la unidad de Azar. Tomaron diferentes muestras de

    e las muestras igual a las otras? Fue el resultado de alguna de las

    muestras igual a la media y DS de la poblacin? La respuesta seguramente es NO!!!.

    cuencias relativas de cada uno de losvalores posibles de la variable.

    or lo tanto, se puede construir una distribucin de probabilidad de todas las mediasposibles de las muestras de una poblacin. Los estadsticos la conocen como distribucin de

    de estimacin e intervalos de confianza, para ellorepasa

    Recordemos tambin que una distribucin de probabilidad (y, por tanto, cualquierdistribucin de muestreo) poda ser descripta parcialmente por dos parmetros: su media ydesviacin est st de

    Veamos todo esto con un ejemplo:Recuerdan el ejercicio o ionaron 10 muestras de n= 10 y

    calcularon las medias? Bueno utilizaremos todas esas muestras para este ejemplo.Obtuvimos en ( e 10). Tomaremos esas

    medias como si fueran valores y calcularemos la media de esas medias, y el desvo estndar delas medias conocido c

    os al tomar todas las muestras de un tamaodado, constituye una distribucin terica de muestreo.

    Intentamos describir sus caractersticas utilizando la informacin de una muestra.

    El conjunto de mtodos que nos permiten cuantificar la incertidumbre en cuanto alas conclusiones acerca de la poblacin de la que se extrajo la muestrinferencia estadstica, que tiene dos partes: Estimacin y el Test de hiptesis.

    Recordemos el ejercicio q

    una poblacin y calcularon la media y el desvo estndar de cada una de las muestras. Fue el

    resultado de cada una d

    Recordemos tambin de la clase de distribucin normal lo que es una distribucin de

    probabilidades.Una distribucin de probabilidades grafica las fre

    P

    muestreo de la media.

    La distribucin de muestreo que obtendramEn casi todos los casos, slo tomamos

    una muestra de la poblacin, y calculamos estadsticas para esa muestra y de esas estadsticasda la poblacin.

    ESTIMACINComenzaremos con los conceptosremos primero la distribucin de muestreo

    Distribucin de muestreo

    ndar o desvo e ndar o svo tpico.

    de la unidad de azar, d nde selecc

    total 340 medias es decir 340 mu stras de tamao

    omo.... ERROR ESTANDARD

    MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS 33

    inferimos algo sobre los parmetros de to

  • 7/25/2019 4)Intervalos de Confianza - Test de Hipstesis

    4/24

    Observaciones Total MMEEDDIIAAVarianzaDesviacin tpica

    o desvoestndar

    340 16822.200049.4771 10.0436 3.1692

    Mnimo 25% Mediana 75% Mximo Moda

    40.7000 47.4000 49.3000 51.5000 57.4000 51.5000

    cin: A continuacin estn los

    Info y el otro con otro programa que dibuja por arriba la

    ndar sobre los datos, las curvas no son idnti

    ad que tomo cada programa son diferentes)

    Podemos ver cmo es su distribu grficos de su distribucin

    (Uno realizado con Epi curva de

    probabilidad normal est cas por que como pueden

    ver en el eje de las x los intervalos de ed

    30

    0

    10

    20

    40

    Frequency

    40 45 50 55 60Media

    MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS 44

    Qu distribucin tiene esta curva??? S, correcto! Es una distribucin (bastante!!)

    normal!!

  • 7/25/2019 4)Intervalos de Confianza - Test de Hipstesis

    5/24

    Como dijimos, a esta curv que son:

    la media y

    el desvo estndar.En este caso la media ser la media de medias (recordemos que cada una era una media

    de una as: cmo lo llamaremos??Correcto!! Lo llamaremos: Error estndar.

    Los resultados de estos dos estadsticos son:

    MMEEDDIIAA

    a de distribucin la definen dos parmetros

    muestra de tamao 10!!!) y el DS es el DS de la media de medi

    Desviacin tpica

    49.4771 3.1692

    Recuerdan cules eran los parmetros de la poblacin?:

    Media 49.42

    Desvo Estndar 10.10

    Concepto de error estndarn lugar de decir "el desv muestra" para

    describi a dispersin de una distribucin de medias muestrales, decimos error estndar de la media.a realidad es que la desviacin estndar de la media de muestras es un valor hipottico,

    ya que n la stra, por eso le damos un nombre diferente:Error estndar de ndar se utiliza porque da a entender unsignific do proviene de un error demuestreodebido al azar. Es decir, hay diferencias entre cada muestra y la poblacin, y entre lasdiversa mu tos que decidimos escoger para las muestras.

    l error estndar indica no slo el tamao del error de azar que se ha cometido, sino tambin laprobabl

    sea el tamao de la muestra ms chico ser el error

    E iacin estndar de la distribucin de las medias de lar l

    Le prctica nosotros tomamos una sola mue

    la media. El trmino error esta especfico. La variabilidad en las estadsticas de muestras

    s estras, debido nicamente a los elemenEe precisin que obtendremos si utilizamos un estadstico de una muestra para estimar un

    parmetro de poblacin.

    Esto quiere decir que cuanto mayorestndar (dividimos un por un nmero ms grande!!).

    MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS 55

    Recuerden la formula del error estndar:

    Donde: es el desvo estndar de los datos de mi muestranes el tamao de mi muestra

  • 7/25/2019 4)Intervalos de Confianza - Test de Hipstesis

    6/24

    Nuestra muestra y la distribucin de muestreon la terminologa estadstica, la distribucin de muestreo que obtendramos al tomar todas

    las muestras de un tamao dado constituye una distribucin terica de muestreo. En laprctica cotidiana nunca seleccionamos muchas muestras de tamao dado de una poblacin, sinembargo, al entender las propiedadesde la distribucin terica demedias de muestreo, nos

    permit acer inferenciasbasados en una SOLAmuestra de tamao n.Estas propiedades son conocidas como Teorema del Lmite Central!!!

    Teorema del Lmite Centralmedias de muestreo de tamao n tiene las siguientes tres

    propiedades:

    ica.Nos asegura que la distribucin de muestreo de la media se aproxima a la normal al

    incrementarse el tamao de la muestra.Una muestra no tiene que ser muy grande para que la distribucin de muestreo de la

    media se acerque a la normal. Los estadsticos utilizan la distribucin normal como unaaproximacin a la distribucin de de30, per o de lamitad d

    usarde nuestra muestra para hacer inferencias con respecto a los

    E

    ir h

    La distribucin terica de

    El teorema del lmite central es tal vez el ms importante de toda la inferencia estadst

    muestreo siempre que el tamao de la muestra sea al menoso la distribucin de muestreo de la media puede ser casi normal con muestras incluse ese tamao.

    muestra.

    La importancia del teorema del lmite central es que nos permiteestadsticasparmetros de poblacin sin saber nada sobre la forma de la distribucinde frecuencias de esa poblacin ms que lo que podamos obtener de la

    1- La media de medias es igual a la media de la poblacin (en nuestro ejemplo:media de medias =49,47 y media de la poblacin 49,42).

    2- La desviacin estndar de la media de medias es igual a DS/n. Este valor esconocido como el error estndar de la media (luego veremos los ejemplos).

    3- Si la distribucin de la variable en estudio es normal, la distribucin demuestreo ser normal, pero mas aun!!! aunque la distribucin de la variableen estudio no sea normal, si la muestra es suficientemente grande ladistribucin de muestreo ser normal. En otras palabras: Al incrementarse eltamao de la muestra, la distribucin de muestreo de la media se acercar ala normalidad, sin importar la forma de la distribucin de la poblacin.

    MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS 66

  • 7/25/2019 4)Intervalos de Confianza - Test de Hipstesis

    7/24

    El teorema del lmite central nos permite utilizar las propiedades de la

    Del Teorema del Lmite Central a la inferencia con mi muestra!Como en un proceso de inferencia un parmetro desconoci extraer una muestra

    en particular y calcular la me , este e Eldesvo estndar de la media de nuestra muestra es el mejor estimador que tenemos del desvoestndar de la media de la poblacin.

    Ahora utilizaremos

    1- de la curva de dist2- de la distribucin teric

    ntonces podemos, utilizando el desvo estndar de nuestra muestra, calcular el errorestndar.vamos po

    y DS de las muestras de tamao 10 queustedes obtuvieron de la poblacin de 600 personas en el ejercicio de azar. Vamos a elegir paraeste ej

    Error

    ess el mejor estimador que tenemos de ese parmetro.

    do, aldia

    todo lo que hemos aprendido:

    ribucin normal, y

    a de muestreo.

    E

    Vol r un minuto a nuestro ejemplo.En la tabla siguiente vern 100 de las medias

    emplo slo una de esas muestras: Por qu no la nmero 5 (por no decir la 1!!!):

    Muestra Media DS estndar

    5 46.9 10.80586263.41711379

    a poblacin es encuentra entre +

    Podemos saber qu porcentaje de l 1DS, 2DS, etc.

    eamos las curvas.

    muestreo seana amplia variedad de pruebas

    distribucin normal. El hecho de que la distribucin deaproximadamente normal es la base de uestadsticas diferentes.

    Calculemos el error estndar:

    Utilizando la curva normal estndar, ya que sabemos que ladistribucin de muestreo es normal.

    V

    MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS 77

  • 7/25/2019 4)Intervalos de Confianza - Test de Hipstesis

    8/24

    ntonces sabemos que entre 43,5 y 50,3 estarn el 68,26% de la poblacin, entre 40,6 y53,7 estarn el 95,44 % de la poblacin.

    1- De la poblacin de 600 personas de donde sali la muestra?2- De la poblacin de posibles medias de muestras de esa poblacin de 600

    personas?espuesta 1:__________________________________

    ste

    Intervalo de confianza

    e llama as rvalo en el que sabemos que est un parmetro, con un nivel deconfian a especfico

    ero qu ?

    olvamos a nuestro ejemplo.

    i yo quisiera tene poblacin.(Recor emos aqu q amao 10del tot de personas

    E

    PERO CUIDADO AC: DE QU POBLACIN ESTAMOS HABLANDO?

    RE es un buen momento para introducir el concepto de intervalo de confianza!

    Sz

    a un inte.

    P es un NIVEL DE CONFIANZA especfico

    Es la probabilidad de que el parmetro a estimar se encuentre en el intervalo deco ianza. Los mas utilizados son el 95% o en 99%.nf

    El concepto es que el intervalo de confianza cubre una amplia proporcin de ladistribucin de muestreo del estadstico que estamos investigando.

    V

    S r en la curva de distribucin normal el 95% de laue la poblacin de la que hablamos es la de posibles medias de t!)

    dal

    MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS 88

    46,9 50,343,5

  • 7/25/2019 4)Intervalos de Confianza - Test de Hipstesis

    9/24

    e la poblacin.

    lvamos a ese ejemplo:

    Esto quiere decir que yo tengo un 95% de confianza que el valor real (parmetro) de lamedia de edad de esta poblacin est entre 40,2 y 53,6 aos. O dicho de otro modo: siseleccionamos 100 muestras (en este caso de tamao 10) al azar de la poblacin y usamos esasmuestra para calcular 100 diferentes intervalos de confianza para u (media de la poblacin:

    Muestra Media DS

    Error

    estndar

    Por lo tanto, sabemos que 1,96 DS por arriba y por abajo esta el 95% d

    Vo

    Queremos entonces saber entre qu valores estar el 95% de las medias si tomamosmuestras de tamao 10 de esa poblacin.

    La formula nuevamente es muy sencilla y la pueden deducir ustedes!Claro no hay ms que sumarle 1,96 DS para arriba y 1,96 DS para debajo de la media.Entonces sera:

    5 46.9 10.80586263.41711379

    Cuntos DS para arriba y cuantos para debajo de la media debo ir?S: correcto!! 1,96 (es una regla de 3 simple!).

    95,44% = 295 = x.Entonces: x = 95 x 2/95,44=1,96

    (La diferen est po ec

    Si:

    cia r los d imales)

    Ahora recordemos que cuando hablamos de distribucinde muestreo el DS de la media de medias lo llambamos errorestndar. Tambin recordemos quesabiendo la media, ni el DS de la poblacin

    habamos dicho que noutilizamos como sus

    mejores estimadores el DS de la muestra, y entonces calculamosel error estndar utilizando el DS de nuestra muestra comohicimos con la muestra 5.

    Recuerdan?

    Limite inferior = X (1,96 x ES)

    = 46,9 (1,96 x 3,42) = 40,20Limite superior= X + (1,96 x ES)= 4

    MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS 99

    6,9 + (1,96 x 3,42) =53,6

  • 7/25/2019 4)Intervalos de Confianza - Test de Hipstesis

    10/24

    parmetro) 95 de esos intervalos cubrirn el valor verdadero de la media de la poblacin (5 no lo

    rvalo de confianza tiene una probabilidad del 95 % de incluir u antes de to

    Veamos si esto se cumple en nuestro ejercicio.

    En el archivo: base de datos de medias de las muestras enviadas ejercicio azar

    harn).El inte mar la

    muestra.

    (ver archivo subido alcampus debajo de la clase) encontrarn la tabla con las 10 muestras que eligi al azar cada uno de los alumnosdel curso.

    Son capaces de descubrir cuntas muestras de las 100 no han incluido en sus IC del 95%el valor de la media (parmetro) de la poblacin?

    Respuesta 2:________________

    ras 95

    muestras s l

    Podemos ver que cada una de estas muestras no contiene el 49,42 que es el valor de lamedia de la poblacin, en su intervalo de confianza del 95%. Sin embargo, las ot

    o contienen!Veamos esto en un grafico:

    70

    60

    30

    40

    50

    Media

    0 20 40 60 80 100

    Muestra

    e animan a encontrar las muestras cuyos Intervalos de confianza no contienen el valor real de lamedia de la poblacin??

    espuesta 3:___Confirmamos lo que venamos diciendo!!

    S

    R

    MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS 1100

  • 7/25/2019 4)Intervalos de Confianza - Test de Hipstesis

    11/24

    Qu es lo que NO significa el intervalo de confianza!

    Nosignifica que u sea una variable aleatoria que asume un valor dentro del intervalo95 % de las veces.

    Nosignifica que el 95 % de los valores de la poblacin estn dentro de esos lmites.

    Ahora

    Como y losintervalos calc la alo o no lo est (Nunca lo sabremos!). Eneste caso, si j tutilizamos inic lnuestro interv osabemos es quecasos!

    MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS 1111

    otro concepto importante:

    tiene un valor real, una vez que la muestra fue tomadau dos est dentro del intervus o nuestra muestra era la nmero 7 por ejemplo, (en lugar de la 5 queia mente), el valor real de la media de la poblacin no hubiera estado enal de confianza del 95% (y nosotros no lo sabramos). Pero lo que s

    esto puede estar ocurriendo! Y que realmente ocurre en el 5% de los

  • 7/25/2019 4)Intervalos de Confianza - Test de Hipstesis

    12/24

    Resumiendo lo aprendido sobre estimacin.

    Hemos aprendido la distribucin de probabilidad terica de muestreo.

    ma Central del Lmite.

    atos de una muestra.

    El Teore

    Qu es el error estndar y cmo se calcula a partir de los d

    Cmo utilizamos la curva de distribucin normal en la distribucin de muestreo.

    Qu es el intervalo de confianza y cmo lo utilizamos para inferir cuan bienrepresenta nuestra muestra a la poblacin.

    Prcticamente, qu es lo que sabemos?

    Trabajamos con muestras: no conocemos los valores reales (parmetros de lapoblacin).

    calcular el error estndar (es decir,

    Utilizando el error estndar calculado a partir de nuestra muestra, calculamos elintervalo de confianza del 95% de nuestra muestra.

    % deque NO-, que el valor real de la media de la poblacin se

    Nunca sabremos si eso es verdad o no, a menos que conozcamos el parmetro

    Nuestros mejores estimadores de la media y DS de la poblacin son la media yDS de nuestra muestra.

    Utilizamos el DS de nuestra muestra paracomo estimador del DS de la media de medias).

    Ese intervalo de confianza del 95% nos est diciendo que existe un 95probabilidad, -y un 5%encuentre entre esos valores!

    MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS 1122

    de la poblacin!

  • 7/25/2019 4)Intervalos de Confianza - Test de Hipstesis

    13/24

    TES

    ta el cientfico o el experimentador no serefiere blacional como se indic en lo que vimos hasta

    omar una decisin basadaiento cientfico. Es decir,

    involuc

    pacientes con artritisreumat neral? El valor numrico correspondiente a esa comparacinque no onocido como el efecto, esto lo utilizaremos ms adelante.

    ca detra

    tanto, se puede aceptar (o no) la hiptesis formulada.Una hiptesis es una suposicin sobre la naturaleza de una poblacin. Las hiptesis

    inos de parmetros poblacionales.

    La hip eHo. Es snos esaltern te la hiptesis que nosotros estamos, comoinvesti acin!

    Volvien teriores:a hiptesis nula seria que la droga A es igual de efectiva que la droga B (efecto=0), o que

    hay ig al frecuencia de eventos coronarios en la poblacin de pacientes con AR que en lapoblacin general (efecto=0), las hiptesis alternativas seran que la droga A es ms efectiva yque hay ms eventos coronarios en los pacientes con AR que en la poblacin generalrespectivamente.

    Operacin de decidir si los datos tomados de una muestra apoyan o no apoyanuna determinada hiptesis.

    El noapoyan esa hiptesis.

    T DE HIPTESISRecordemos que habamos dicho que las dos grandes formas de realizar estadstica

    inferencial eran:

    la estimacin y

    el test de hiptesis o testeo de hiptesis o contraste de hiptesis.Ahora nos dedicaremos a este ltimo mtodo.

    frenCon frecuencia, los problemas a los que se enn slo a la estimacin de un parmetro po

    ahora, sino, (y muchas veces es an ms frecuente) que se tenga que ten los datos que conduzcan a una conclusin acerca de algn planteam

    ra la comparacin entre dos o ms grupos.Por ejemplo: Es la droga A ms efectiva que la droga B para bajar la presin en los

    hipertensos? Es la frecuencia de eventos coronarios mayor en losoidea que en la poblacin ges interesa es habitualmente c

    Podemos entonces definir un contraste o test de hiptesis como una tcni

    inferencia estadstica que permite comprobar si la informacin que proporciona una muesobservada concuerda (o no) con la hiptesis formulada sobre el modelo de probabilidad en estudioy, por

    generalmente estn expresadas en trm

    Podemos definir test de hiptesis como:

    tesis que se va a testear o contrastar se conoce como hiptesis nulay se escribta es la hiptesis de no diferencia (nula), y suele ser la hiptesis contraria a lo que nosotrotamos planteando como investigadores. El contrario de la hiptesis nula es la hiptesisativa que se escribe: H . Es generalmenAgadores, persiguiendo, la hiptesis de nuestra investig

    do a los ejemplosanLu

    MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS 1133

    resultado de testear una hiptesis es determinar si los datos apoyan o

  • 7/25/2019 4)Intervalos de Confianza - Test de Hipstesis

    14/24

    La pregunta del milln es: Por qu si nosotros queremos comprobar una hiptesis (comodijimos generalmente la hiptesis de diferencia), lo que contrastamos o testeamos es la hiptesisnula no diferencia)?(hiptesis de

    Paraefectefect

    , qu valor de efectopond lculo estadstico para cada valor de efecto quequisi co prctico!!

    Pasos en el desarrollo de un Test de hiptesisos pasos a seguir en el desarrollo de un Test de hiptesis son los siguientes:

    1) Definir la hiptesis nula y la alternativa: Debo definir la hiptesis nula: Ho y lahiptes

    d Trial. S Figar, C Galarza, E Petrlik, L Hornstein, G RodrguezLoria, Gl Waisman, M Rada, E R Soriano, and F Gonzlez Bernaldo de Quirs. AJH 2006; 19:737743)

    s desarrollar las hiptesis nulas y alternativas

    testear o contrastar una hiptesis estadsticamente debemos conocer el valor delo (lo mencionamos ms arriba). Cuando testeamos la hiptesis nula, cul es el valor delo? S, correcto: es 0!

    Sin embargo, si quisiramos testear la hiptesis alternativaramos? Tendramos que realizar un cramos contrastar, y esto sera muy po

    Volveremos sobre esto, no desesperen!

    L

    is alternativa: HA. Ambas hiptesis deben ser excluyentes entre s.Veamos algunos ejemplos:

    Queremos realizar una investigacin para determinar si un determinado modelo de taller deeducacin (enpowerment) para enfermedades crnicas es superior a un modelo clsico deeducacin en la reduccin de la TA (Effect of Education on Blood Pressure Control in ElderlyPersons, A Randomized Controlle

    Hiptesis nulaHo: (TA taller A) (TA taller B) = 0

    Hiptesis alternativa HA: (TA taller A) (TA taller B) 0.

    Intenten ustedede los siguientes ejemplos!

    Ejemplo 1

    Un fabricante de lmparas elctricas sostiene que la duracin media de lasen promedio de 1.300 h. Se toma una muestra de 17 lmparas

    endo el resultado de la media de 1100 h.Cul es la hiptesis nula y cul la alternativa?

    mismas (horas) essi

    Respuesta 4:_____

    MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS 1144

  • 7/25/2019 4)Intervalos de Confianza - Test de Hipstesis

    15/24

    do es t a d s t i c o d e l t e s t . Este nmero refleja la diferencia entre los datos de lamuestr . Este es el dato que compararemos con el valor esperado si lahiptes

    bviamente, esta es una formula gene que tiene variaciones en cada estadstico que

    veamo pero conceptualmente ayuda much comprender qu es lo que hacemos cuandohacemos los clculos para el test de hip

    extremo si la hiptesis nula escorrecta. Cuanto mayor sea el estadstico, ms alejadas estn nuestros resultados de la hiptesisnula.

    E

    Un millero publicita que el peso promedio de una espiga de una cierta variedad es de18

    , decide por lo tanto conducir un experimento. El propsito del

    jemplo 2

    se0 gramos con un desvo estndar de 30 gramos. Un productor de avanzada sospecha que el

    peso es distinto de 180 gramos

    2) Clculo del estadstico. Luego de enunciar las hiptesis, sigue el clculo de unnmero llama

    a y la hiptesis nulais nula fuera verdadera. La forma general de este estadstico puede expresarse en relacin

    al valor observado en la muestra de la variable de inters y el valor que esperaramos si lahiptesis nula fuera verdadera.

    O ralo as,

    tesis.

    Cmo sera la frmula??Respuesta 7:_____

    3) Hallar el p-valorLo que este estadstico nos dir es que probabilidad hay de haberencontrado ese valor (o esa diferencia) o un valor an mas

    mismo es ver si el peso de 180 gramos es incorrecto. Por lo tantoCul es la hiptesis nula de inters?Cul es la hiptesis alternativa?Cul es la hiptesis nula y cul la alternativa?

    Respuesta 5:_____

    Estadstico del test = valor observado - valor esperadoError estndar del valor observado

    Veamos unejemplo.

    ul la hiptesis alternativa?

    Supongamos que sabemos que el colesterol promedio de la poblacin entre 20 y 74aos es de 211 mg %. Queremos saber si los pacientes hombres hipertensos tienen el mismocolesterol. Seleccionamos una muestra al azar de 12 hombres de esta poblacin y lesmedimos su colesterol. Encontramos que el valor promedio es de 217 mg % y DS: 46 mg %

    Cul es la hiptesis nula? C

    MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS 1155

    Respuesta 6:_____

  • 7/25/2019 4)Intervalos de Confianza - Test de Hipstesis

    16/24

    Los estadsticos tienen una distribucin de probabilidades conocida, segn vimos en laparte anterior de esta unidad.

    Qu probabilidad a de tamao 10 cuyamedia sea de 56,4 y su DS: 9,13?

    Si buscan en la t ules el valor queencuentran?

    Respuesta 8:_____

    A la derecha de ese valor solo queda 1 0,9980 = 0,002 = 0,2 % de probabilidad deobtener ese valor o un valor mayor por azar tomando muestras de tamao 10 de esa poblacin!!!.(sin embarg

    establece el nivel de significacin que es laprobab

    l de significacin es la cantidad de error que nos podemos permitir,y su eleccin depende en cada caso de la persona que realiza el test. Los ms usuales son 5% y aveces 1 %.

    is. Tenemos que decidir con qu valor de prechazaremos la hiptesis nula y con qu valor la aceptaremos. Luego realizaremos los clculospara obtener el valor de p, que nos est indicando qu probabilidad hay de haber obtenido esevalor (o uno ms extremo), por azar del muestreo.

    ara que se entienda, pero se debe establecer antes derealiza

    urva aceptaremos como compatible con la hiptesis nula y enqu r

    Recuerdan el ejercicio con nuestras muestras al azar? Volvamos por un minuto a ellas.

    tenemos de sacar de esa poblacin, una muestr

    abla de probabilidades de la clase de curva normal: C

    Veamos:

    o alguno de Uds. lo obtuvo!!!).

    4) Decidir el nivel de significancia: se

    Adivinen qu?

    Esta probabilidad es el famosovalor de p!!!

    ilidad de que rechacemos la hiptesis nula, siendo en realidad cierta. Utilizaremos la letra para denominarlo. Este nive

    Ya hemos establecido nuestra hiptes

    Esto lo pusimos como ltimo punto pr los clculos, no despus!En realidad, si esto lo llevamos a la curva de distribucin normal, lo que estamos

    estableciendo es qu rea de la ceas (si el valor cae ah), rechazaremos la hiptesis nula.

    MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS 1166

    0

    p-valor!!

  • 7/25/2019 4)Intervalos de Confianza - Test de Hipstesis

    17/24

    Veamos el grfico:

    os hecho un test de hiptesis y establecido la significancia o en el 5%, hubiramos

    concluirealidad, s

    Cmotremos a los nuestros si la

    hiptes

    Qu pasa si el p valor es bajo?El p-valor hallado en la muestra 12 fue de: 0,002 (2 por mil).Esto indica que la probabilidad de encontrar valores como los de nuestra muestra, si la

    hiptesis nula es cierta, es baja.Si es verdad que las personas de la poblacin tienen un valor promedio de edad de 49,42

    aos, de cada 1000 muestras que hubiera podido elegir, 2 hubieran arrojado mis resultados omayores. Es decir, es muy poco probable que mis pacientes tengan la misma edad que lapoblacin general (H0) a la luz de los hallazgos de mi muestra.

    s la probabilidad de rechazar la hiptesis nula

    det

    Este nivel de significancia ecuando la hiptesis nula es verdadera. Este valor es independiente del valor de pobtenido y lo fija el investigador, as como el valor de corte de la glucemia para

    erminar hiperglucemia es independiente del valor de la glucemia.

    Podemos obtener un valor de p=0,0025; p= 0,015; p=0,0000001, etc, y en todos loscasos el valor de estar fijado por ejemplo en 0,05.

    Es lo que nos ocurri con nuestras 5 muestras del ejercicio anterior, recuerdan? Sihubiram

    do que esas muestras no pertenecan a la poblacin de 600 personas de donde, enalieron y nos hubiramos equivocado!

    interpretamos el p-valor?El p valor es la probabilidad de obtener datos iguales o ms exis nula es verdadera.

    El p v

    MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS 1177

    alor es la probabilidad de obtener datos iguales o ms extremos a losnuestros si la hiptesis nula es verdadera.

  • 7/25/2019 4)Intervalos de Confianza - Test de Hipstesis

    18/24

    Esto dich la probabilidad is pacientes tengan la mismao de otra manera sera: de que medad que la poblacin z de lo que encontr en mi muestra, es muy baja.general a la lu

    Si digo que mis pacientes son ms viejos que la poblacin general, tengo muy pocaprobabilidad de equi Puedo equivoc la probabilida es de 2 por 1000.vocarme. arme, pero d de error

    Qu pasa si el p valor es alto?Supongamo estro ejemp un p valor de 0%).La probabilidad de encontrar valores como los de nuestra muestra, si la hiptesis nula es

    cierta, es alta. La hiptesis nula es bastante probable a la luz de los hallazgos de mi muestra.

    ilidad de que mis pacientes tengan la misma

    s que en nu lo obtengamos 0,5 (5

    Esto dicho de otra manera sera: la probabedad a la luz de lo que med en la muestra es alta. Si digo que mis pacientes son ms viejos,tengo mucha probabilidad de equivocarme.

    Tipos d

    cometer:

    1 Err nula es verdadera:probabilidad de cometer este tipo de error es justamente . Por eso, a este error se lo

    error.y

    2- rror de tipo II conocido como err r la hiptesis nulacuando la hiptesis nula es falsa. es la probabilidad de cometer un error de tipo II.

    Veamos esto con un ejemplo msde un jurado, donde se presenta un acusado por asesinato. Hay sola verdad: el sujeto esculpable o es inocente: cometi o no co

    El jurado llega a un veredicto: y pu tro c el siguientecuadro:

    e error en el test de hiptesisCuando nosotros realizamos un test de hiptesis hay dos tipos de errores que podemos

    or de tipo I: que es rechazar la hiptesis nula cuando la hiptesisladenomina muchas veces

    : or de aceptacin o error : acepta

    grfico!!!. Supongamos que nosotros somos miembrosuna

    meti el asesinato.eden ocurrir cua osas que se grafican en

    1- El acusado era inocente y el jurado lo declaro inocente: OK esta todo bien: buentrabajo: el tipo sale libre y no hay problema.

    2- El acusado era culpable (el muy o la ma (muy astutosdesgraciad t!!), y el juradoellos!!), lo declaran culpable: cadena perpetua: y todo OK(merecido se lo tena!!).

    Pero el jurado puede cometer dos tipos de errores:

    3- Que declare al acusado culpable y el pobre tipo era inocente!!!: Error de tipo I,4- Que el jurado declare al acusado inocente y el muy desgraciado era culpable: Error de

    tipo II

    MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS 1188

  • 7/25/2019 4)Intervalos de Confianza - Test de Hipstesis

    19/24

    MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS 1199

    AcusadoVeredicto del

    Jurado Inocente Culpable

    Inocente O.K Error tipo II

    Culpable Error tipo I O.K

    Volviendo a la estadstica, ocurre lo mismo:

    contrado ese valor por azar eslor de corte . que nos habamos impuesto):

    a alto: diremos que la probabilidad de haber encontrado ese valorlas

    diferencias encontradas no eran estadsticamente significativas: si nos equivocamos (ySI haba diferencias): estaremos cometiendo un error de tipo II.

    Verdad de la naturaleza

    aber enSi el valor de p nos da que la probabilidad de hmuy baja (ms baja que el varechazaremos la hiptesis nula: diremos que la diferencia es estadsticamentesignificativa: si nos equivocamos estaremos cometiendo un error de tipo I.

    Si el valor de p nos dpor azar es alta. Por lo tanto, aceptaremos la hiptesis nula: diremos que

    =Resultado deltest

    0

    verdadera

    0

    Hiptesis nula Hiptesis nula

    falsa (hiptesisalternativaverdadera)

    Acepta Ho O.K Error tipo II

    Rechaza Ho Error tipo I O.K

    chaza la hiptesis nula,icamente significativas.

    Es obvio que si aceptamos Ho no podemos cometer el error de rechazarla.

    El error de tipo Islo puede cometerse cuando se rees decir, cuando se concluye que las diferencias son estadst

  • 7/25/2019 4)Intervalos de Confianza - Test de Hipstesis

    20/24

    Poder o potencia de una prueba estadstical poder es igual a 1-y es la probabilidad de rechazar la hiptesis nula (Ho) cuando la

    iptesis nula es falsa. En otras palabras es la probabilidad de evitar un error de tipo b.

    n valor de a y un n determinado sea capaz de encontrar una diferencia estadsticamenteignificativa, SIla diferencia realmente existe.

    Hay dos formas de aumentar el poder de un estudio:1)Aumentar el tamao de la muestra.2)Aumentar el valor de significancia de .Al aumentar a dejamos fuera de la curva de

    distribucin una porcin ms grande, por lo tanto b se vuelve ms pequea, y 1- ms grande,or lo que el poder aumenta. Sin embargo, al hacer ms grande aumentamos las probabilidades

    de cometer un error de tipo I.El balance entre los dos tipos de errores vara segn el estudio, la moda, los tiempos.

    Qu tipo de error estaba favoreciendo?

    Qu valor estara probablemente ponindole a ?Respuesta 9:_____

    Interpretacin de la significacin estadstica

    e p: nunca podemos estar seguros decontar con la verdad. La estadstica es solamente un instrumento de anlisis de los datos aplicadaa un trabajo de investigacin. Haber obtenido p< 0,000001 solamente nos indica que la

    ificativas. Es obvio que sire

    El error de tipo IIslo puede cometerse cuando se acepta Ho, es decir, cuandose concluye que las diferencias son estadsticamente no sign

    chazamos Ho el error de aceptarla no se puede cometer.

    Eh

    Dicho de una forma que se entienda: es la probabilidad de que un determinado estudio conus

    p

    S i gn i f i c a c i n e s t a d s t i c a y v e r d ad :

    Es imprescindible tener siempre en cuenta el principio de incertidumbre:probabilidadimplica incertidumbre. Por ms pequeo que sea el valor d

    Benjamn Franklin deca:Es preferible que 100 personas culpables queden sueltas a que una

    ersona inocente sufra en prisin!

    Resumiendo:

    verdaderaHrechazarHP 00=

    falsaHHnorechazarP 00=

    falsaHrechazarHPPoder 00=

    MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS 2200

  • 7/25/2019 4)Intervalos de Confianza - Test de Hipstesis

    21/24

    probab

    :

    Relacin entre el p valor y los intervalos de confianzaComo vimos en la primera parte de esta clase, el intervalo de confianza del 95 % es que

    tengo una probabilidad del 95% que el valor real (parmetro) de la poblacin esta entre losvalores obtenidos. Cuando yo elijo un valor de a del 0,05 (5%), si encuentro un valor que est porfuera del Intervalo de confianza obtenido, estoy seguro que tiene una probabilidad de pertenecer

    a la poblacin < al 0,05, y por lo tanto, la p ser significativa para ese valor de corte.

    Dos colas o a una sola cola?Si bien esto no lo dijimos expresamente, el valor de p es la probabilidad de obtener un

    resultado igual a ms extremo al obtenido si la hiptesis nula es verdadera. Los resultadosextremos pueden ocurrir por azar en una u otra direccin.

    ilidad de que Ho sea cierta es mnima, pero jams ser nula! Cul es la probabilidad desacarse la lotera? Sin embargo, muchas veces alguien la saca!!

    S i gn i f i c a c i n e s t ad s t i c a y r e l e v an c i a c ln i c a :

    Estadsticamente significativo no es sinnimo de clnicamente importante. Sepueden encontrar cuatro situaciones

    Resultado estadsticamentesignificat treleva

    ivo y clnnte.

    icamen e !Esta es la situacin ideal

    En este caso blemente oder ha sidorepeti o con una

    tra mayo que si los resultadosrecen importantes desde el punto de

    proba el pinsuficiente: es necesario

    mues

    r el estudi

    bien

    R

    n

    esultad tad en

    o signif o p

    o es

    icativ

    sticam

    ero

    te

    r, yaobtenidos paclnicamente relevante.vista clnico, no puedo descartar que hayanocurrido por azar de muestreo.

    Esto generalmente ocurre con los megatrials,

    les daramos ninguna importancia resultanestadsticamente significativas. Se debe da

    donde pequeas diferencias a las que en la clnicano

    Resultado estadsticamentesignificativo pero sin

    rrelevancia clnica.prioridad a la valoracin clnica.

    Resultadono significarelevancia clnica.

    Habr que revisar el poder del estudio para decidirsi vale la pena repetirlo.

    MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS 2211

    estadsticamentetivo y sin

  • 7/25/2019 4)Intervalos de Confianza - Test de Hipstesis

    22/24

    Volvamos a nuestro ejemplo de muestras al azar y vemos que las muestras 7, 21 y 92, y que las muestras 12 y 82 estn a la

    os de qu lado puede ser la diferencia, es que en general calculamos

    estn a la izquierda del parmetro de la poblacin (49,42)derecha del parmetro de la poblacin.

    Como no sabemvalores de p a dos colas, considerando como significativo tanto si queda por arriba como pordebajo del valor de a determinado.

    En algunas raras ocasiones, puede calcularse el valor de p a una sola cola. Esto debedecidirse antes del anlisis, no debe depender de nuestros resultados!

    Resumiendo pre s st d tesis:En todos los trabajos leemos que el resultado fue o que el efecto es real porque el

    valor de p es men 0,05 to e adstica significa abemos ahora quees lo que esto quiere decir. No es nada ms ni nada menos que concluir que la probabilidad deque esa diferencia haya sido por azar de muestreo es muy baja, y por lo tanto rechazamos lahiptes diferencia y concluimos que hay un efecto.

    rechazarla. El granproble

    lo a ndido obre te e hippositivomenteor a y por lo tan s est tivo. S

    is nula de noSe puede cometer errores tanto al aceptar la hiptesis nula como al

    ma es que nunca sabremos la verdad!!!

    Muestra Media DS Error estndar Mnimo IC 95% Mximo IC 95%

    7 41.8 8.47 2.68 36.55 47.05

    12 56.4 9.13 2.89 50.74 62.06

    21 44.2 .07 4 2.23 39.84 48.56

    82 56.4 .19 3 2.89 50.74 62.06

    92 42.4 .48 4 2.67 37.17 47.63

    La estadstica es una ciencia que demuestra que

    si mi vecino tiene dos coches y yo ninguno, losdos tenemos uno

    George Bernard Shaw (1856-1950)

    Escritor irlands.

    MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS 2222

  • 7/25/2019 4)Intervalos de Confianza - Test de Hipstesis

    23/24

    RES

    espuesta 1:

    estar el 95,44% de las medias

    espuesta 2:________________s:

    PUESTAS A LOS EJERCICIOS

    RS, efectivamente!!

    Lo que estamos diciendo es que entre 40,6 y 53,7 van ade todas las muestras de tamao 10 que podamos sacar de esa poblacin!!

    RS! Las muestra

    Muestra Media DSError

    estndarMnimo IC

    95%Mximo IC

    95%

    7 41.8 8.47 2.68 36.55 47.05

    12 56.4 9.13 2.89 50.74 62.06

    21 44.2 7.04 2.23 39.84 48.56

    82 56.4 9.13 2.89 50.74 62.06

    92 42.4 8.44 2.67 37.17 47.63

    Respuesta 3:

    60

    50

    70

    Media

    40

    30

    0 20 40 60 80 100Muestra

    Respuesta 4:Ho: media de la muestra media del fabricante= 0HA: media de la muestra media del fabricante 0

    MDULO: ESTADSTICA INFERENCIAL UNIDAD TEMTICA: INTERVALOS DE CONFIANZA (ESTIMACIN) Y TEST DE HIPTESIS 2233

  • 7/25/2019 4)Intervalos de Confianza - Test de Hipstesis

    24/24

    Respuesta 5:Ho: peso de la muestra 180 g = 0HBA: Bpeso de la muestra 180 g BB0

    Respuesta 6: Hiptesis nula: Ho= media de la poblacin = media de hombres

    hipertensos= 211 mg %, o puesto de otro modo: 217 211 = 0.La hiptesis alternativa: HBAB: media de la poblacin media hombres hipertensos; o220 211 0.

    Respuesta 7:

    Respuesta 8:S, correcto: 0,9980.

    Respuesta 9: Si, correcto: favorece cometer un error de tipo II: declarar inocente a unculpable, es decir, aceptar la hiptesis nula cuando la hiptesis nula es falsa. Probablementeelegira un valor muy alto de (tal vez 0,001), de forma tal que slo rechazara la hiptesis nula(declarara a alguien culpable), cuando la probabilidad de que ese valor no pertenezca a lapoblacin sea muy baja.