trabajo colaboriativo 1

Upload: ruben-rendon

Post on 05-Apr-2018

226 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/1/2019 Trabajo colaboriativo 1

    1/13

    Trabajo colaborativo 1

    Inferencia Estadstica

    Presentado por:

    Presentado a:

    Diego Fernando Pulecio

    Grupo: 100403-138

    Universidad Nacional Abierta y a DistanciaUNAD

    Colombia Abril de 2011

  • 8/1/2019 Trabajo colaboriativo 1

    2/13

    Introduccin

    Por medio de la resolucin de problemas planteados, se pretende mostrar en este trabajo la aprehensinde los temas guiados en el transcurso de la unidad uno de este curso de Inferencia Estadstica; en grupo

    colaborativo, se hace entrega de este trabajo que contiene los datos necesarios para la comprensin deldesarrollo de los asuntos propuestos en la gua de actividades.

  • 8/1/2019 Trabajo colaboriativo 1

    3/13

    Objetivos

    Con el desarrollo de problemas acordes a los tpicos vistos en la primera unidad de este curso, se

    espera la prctica, la aclaracin de dudas y comprensin de puntos inciertos por parte de los integrantesdel grupo colaborativo que participen con disciplina en la entrega de este trabajo.

    *Asentar conocimientos vistos sobre los principios del muestreo en las operaciones estadsticas deinvestigacin.

    *Manejar con propiedad los intervalos de confianza que hacen parte de los problemas de los cuales se

    solicita respuesta.

    *Alcanzar los requisitos mnimos para la aprobacin del curso de Inferencia Estadstica.

    *Hacer parte de un desarrollo de trabajo en grupo colaborativo, demostrando las capacidades deinteraccin y resolucin de problemas con un grupo de personas del mismo curso.

  • 8/1/2019 Trabajo colaboriativo 1

    4/13

    1. Explique la diferencia entre cada par de trminos:

    Diferencias entre muestreo por conglomerados y muestreo estratificado:

    En el muestreo por conglomerados se elige tan solo una subpoblacion para el muestreo, por el contrarioen el estratificado se toman todas para muestreos posteriores. Y en el muestreo por conglomerados se

    busca heterogeneidad en los elementos cuando en el estratificado lo que se busca es homogeneidad enlos mismos.

    Diferencias entre error muestral y error no muestral:

    El error muestral est en el diseo del muestreo, en el tamao especificado y en la heterogeneidad de lamuestra, por el contrario el error no muestral se basa en el poco cuidado con el diseo definido a la

    hora de llevar a cabo el muestreo y en la tasa de respuesta de los elementos de la poblacin.

    Diferencias entre muestreo simple y muestreo sistemtico:

    El muestreo simple es totalmente aleatorio donde cada elemento de la poblacin tiene la mismaposibilidad de ser elegido, en cambio en el muestre sistemtico se lleva una formula en la que los

    elementos van siendo elegidos, dejando de por medio la misma cantidad de elementos libres.

    Diferencias entre muestra aleatoria y muestra no aleatoria:

    En las muestras aleatorias todos los elementos tienen la misma posibilidad de caer en la muestra,mientras que en la aleatoria no, ya que son elegidos por medio de otros procedimientos en los que son

    discriminados algunos elementos por distintas razones que sean determinadas en el proceso.

    2. La estimacin se puede hacer a su vez por dos procedimientos cules son? Qu ventajastiene cada uno?

    Procedimientos de la estimacin

    La estimacin se conoce como el valor especifico de un estimador, por lo que asigna uno o varios

    valores numricos a un parmetro de una poblacin sobre los bases de datos de muestra.

    TIPOS DE ESTIMACION:

    ESTIMACION PUNTUAL: consiste en un solo estadstico muestral que se usa para estimar elvalor verdadero de un parmetro de una poblacin que es desconocido. Por ejemplo, la media muestral

    es un estimador puntual de la media poblacional y la proporcin muestral es un estimador puntual de

    la verdadera proporcin poblacionalp.

    Cuando usamos una estimacin puntual, sabemos que aunque usemos un mtodo bueno de estimacin

    es prcticamente improbable que el valor de la estimacin coincida con el verdadero valor delparmetro, as que sera conveniente acompaar nuestra estimacin con alguna medida que nos

  • 8/1/2019 Trabajo colaboriativo 1

    5/13

    permitiera expresar la cercana del estimador al parmetro. Una solucin a ello no los brindan losestimadores por Intervalos de Confianza.

    ESTIMACION POR INTERVARLOS: es la estimacin de un parmetro de la poblacindado por dos nmeros que forman un intervalo que contiene al parmetro con una cierta probabilidad .

    3. A qu se refiere el margen de error en un intervalo de confianza.

    - El margen de error proviene de dos fuentes: de una parte, la imprecisin inherente a todas las

    mediciones (las reglas no son muy exactas y la gente no necesariamente responde la verdad en

    las encuestas) y por otra parte, del carcter muestral de las mediciones. Con esto me refiero a

    que para obtener un resultado casi siempre no consultas a todos los individuos sino a unospocos "representativos". Estos ltimos te pueden hacer obtener una conclusin (de hecho lo ms

    probable es que sea as) distinta de la "verdadera" de todos los individuos.

    - El grado de inexactitud de la respuesta muestral que obtienes se mide a travs del margen deerror, que es el rango en el cual se encuentra la respuesta correcta para toda la poblacin que

    ests investigando.

    4. Explique cules son los criterios que debe cumplir una muestra seleccionada de poblacin

    para considerarla representativa de dicha poblacin.

    Se debe tener en cuenta los siguientes criterios para garantizar que la muestra de la poblacin esrepresentativa:

    - Naturaleza Destructiva: existen casos donde se requiere destruir los elementos de la muestra

    para medir la caracterstica. Ejemplo: medir la resistencia de un material.

    - Imposibilidad Fsica de Medir Todos los Elementos de la Poblacin: se sabe que existen

    poblaciones muy grandes, consideradas infinitas y es casi imposible conocer todos loselementos de la misma.

    - Costos: Estudiar todos los elementos de la poblacin es muy costoso, tanto en tiempo como endinero, por lo que es ms rentable hacer un estudio Muestral.

    - Confiabilidad del Estudio Muestral: Est demostrado con soporte matemtico que una muestra

    representativa arroja resultados que permiten inferir sobre la poblacin con una confiabilidad

    muy alta.

  • 8/1/2019 Trabajo colaboriativo 1

    6/13

    5. Explique el tipo de relacin directa o inversamente proporcional de cada uno de losfactores involucrados en el clculo del tamao de la muestra de una poblacin finita, paraestimar la media de la poblacin.

    Para calcular el tamao de una muestra hay que tomar en cuenta tres factores:

    1.El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia lapoblacin total.

    2. El porcentaje de error que se pretende aceptar al momento de hacer la generalizacin.

    3. El nivel de variabilidad que se calcula para comprobar la hiptesis.

    La confianza o el porcentaje de confianza es el porcentaje que nos permite estimar cualquierparmetro de la poblacin por medio de un estadstico. Es decir, si se quiere estimar que la confianza

    sea del 100% esto significa que no hay ninguna duda de los resultados obtenidos pero esto no esto en

    muchos casos puede resultar imposible debido al tamao de la poblacin y a los altos costos del estudioestadstico, por tal motivo; se suele utilizar una confianza del 95% o una ms precisa del 99%.

    El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hiptesis que seafalsa como si fuera verdadera, o la inversa, al igual que la confianza si no se desea tener error alguno es

    decir del 0% entonces la muestra tendra que ser del mismo tamao de la poblacin por lo que es msconveniente correr un riesgo bajo de equivocarse, comnmente se aceptan del 4% y 6% de error.

    La variabilidad es el porcentaje o probabilidad con el que se acept o rechaz una hiptesis, es decirsi el porcentaje nos indica que la hiptesis se acepta se denomina variabilidad positiva y se denota por

    la letra p, por el contrario si el porcentaje nos indica que la hiptesis se rechaza se denomina

    variabilidad negativa y se denota por la letra q.La varianza de una poblacin de una manera uniforme, con distribucin finita de poblacin con tamao

    N est dada por la media poblacional y esta es simplemente un caso especial de la definicin general dela varianza que est dada por la distribucin de la probabilidad en intervalos de la poblacin, que estn

    en relacin directa de proporcionalidad del tamao de los intervalos.

    6. Una de las formas de realizar inferencia estadstica, es por medio de estimacin deparmetros de una poblacin. explique las ventajas y desventajas de este mtodo parainferir las caractersticas de una poblacin.

    La estimacin de parmetros consiste en el clculo aproximado del valor de un parmetro en

    la poblacin, utilizando la inferencia estadstica, a partir de los valores observados en la muestraestudiada. Para el clculo del tamao de la muestra en una estimacin de parmetros son necesarios losconceptos de Intervalo de confianza, variabilidad del parmetro, error, nivel de confianza, valor crtico

    y valor .

    VENTAJA.

    -El objetivo de la estimacin de parmetros es usar una muestra para obtener nmeros que en algnsentido, sean los que mejor representan a los verdaderos valores de los parmetros.

    http://es.wikipedia.org/wiki/Estimaci%C3%B3nhttp://es.wikipedia.org/wiki/Poblaci%C3%B3n_estad%C3%ADsticahttp://es.wikipedia.org/wiki/Poblaci%C3%B3n_estad%C3%ADsticahttp://es.wikipedia.org/wiki/Estimaci%C3%B3n
  • 8/1/2019 Trabajo colaboriativo 1

    7/13

    DESVENTAJA.

    -resulta a menudo insuficiente, debido a que solo tiene dos opciones: es correcta o est equivocada.

    7. El margen de error de una estimacin es controlado por tres factores: Nivel de confianza,

    tamao de la muestra y desviacin estndar. Explique los criterios que tiene uninvestigador para su determinacin en una investigacin estadstica.

    El investigador normalmente toma el riesgo en la representatividad de los datos o informacin, llamado

    el riesgo de "error de tipo 1", descartando equivocadamente la hiptesis nula y aceptando la hiptesisde investigacin, a pesar del hecho de que la hiptesis de investigacin en realidad ya no sea vlida. A

    pesar del riesgo, el investigador no debe poner el listn de la representatividad innecesariamente alto,

    porque entonces hay la amenaza del llamado "error de tipo 2", en que el investigador acepta la hiptesis

    nula y descarta equivocadamente la hiptesis de investigacin a pesar de ser en realidad verdadera.

    8. Cul es el criterio a seguir si queremos determinar un tamao de muestra y no conocemosla varianza poblacional. Explique cmo se resuelve el problema.

    Cuando no se conoce la varianza poblacional y para una muestra pequea.

    podemos utilizar la muestra en su lugar.

    Se determina entonces un nivel de significacin para la realizacin del contraste y se plantea en el

    supuesto de realizar una muestra aleatoria de tamao n.

    As: conocemos que1

    nt

    n

    s

    uxde forma que la hiptesis nula es: H0 0.

    El estadstico est dado por:

    n

    s

    uxt

    0

    9. Explique cmo se define la confiabilidad y cul es su interpretacin en la construccin deun intervalo de confianza. Presente un ejemplo.

    Un intervalo de confianza es un rango de valores (calculado en una muestra) en el cual se encuentra el

    verdadero valor del parmetro, con una probabilidad determinada. La probabilidad de que el verdaderovalor del parmetro se encuentre en el intervalo construido se denomina nivel de confianza, y se denota

  • 8/1/2019 Trabajo colaboriativo 1

    8/13

    1- . La probabilidad de equivocarnos se llama nivel de significancia y se simboliza . Generalmentese construyen intervalos con confianza 1- =95% (o significancia =5%). Menos frecuentes son los

    intervalos con =10% o =1%.

    Para construir un intervalo de confianza, se puede comprobar que la distribucin Normal Estndar

    cumple 1:

    P (-1.96 < z < 1.96) = 0.95

    De lo anterior se puede comprobar con una tabla de probabilidades o un programa computacional que

    calcule probabilidades normales.

    Luego, si una variable X tiene distribucin N ( , ), entonces el 95% de las veces se cumple:

    Despejando en la ecuacin se tiene:

    El resultado es un intervalo que incluye al el 95% de las veces. Es decir, es un intervalo de confianza

    al 95% para la media cuando la variable X es normal y es conocido.

    II- Intervalo de confianza para un promedio:

    Generalmente, cuando se quiere construir un intervalo de confianza para la media poblacional , la

    varianza poblacional es desconocida, por lo que el intervalo para construido al final de II es muypoco prctico.

    Si en el intervalo se reemplaza la desviacin estndar poblacional por la desviacin estndarmuestral, el intervalo de confianza toma la forma:

    La cual es una buena aproximacin para el intervalo de confianza de 95% para con desconocido.Esta aproximacin es mejor en la medida que el tamao muestral sea grande.

    Cuando el tamao muestral es pequeo, el intervalo de confianza requiere utilizar la distribucin t de

    Student (con n-1 grados de libertad, siendo n el tamao de la muestra), en vez de la distribucin normal

    (por ejemplo, para un intervalo de 95% de confianza, los lmites del intervalo ya no sern construidosusando el valor 1,96).

    http://escuela.med.puc.cl/recursos/recepidem/EPIANAL9.HTM#refhttp://escuela.med.puc.cl/recursos/recepidem/EPIANAL9.HTM#ref
  • 8/1/2019 Trabajo colaboriativo 1

    9/13

    Ejemplo:Los siguientes datos son los puntajes obtenidos para 45 personas de una escala de depresin (mayor

    puntaje significa mayor depresin).

    2 5 6 8 8 9 9 10 11

    11 11 13 13 14 14 14 14 14

    14 15 15 16 16 16 16 16 16

    16 16 17 17 17 18 18 18 19

    19 19 19 19 19 19 19 20 20

    Para construir un intervalo de confianza para el puntaje promedio poblacional, asumamos que los datos

    tienen distribucin normal, con varianza poblacional desconocida. Como es desconocido, lo

    estimamos por s =18,7. Luego, un intervalo de confianza aproximado es:

    Luego, el intervalo de confianza para es (13,2, 15,8). Es decir, el puntaje promedio poblacional seencuentra entre 13,2 y 15,8 con una confianza 95%.

    III. Intervalo de Confianza para una Proporcin.

    En este caso, interesa construir un intervalo de confianza para una proporcin o un porcentaje

    poblacional (por ejemplo, el porcentaje de personas con hipertensin, fumadoras, etc.)

    Si el tamao muestral n es grande, el Teorema Central del Lmite nos asegura que:

    O bien:

    Donde p es el porcentaje de personas con la caracterstica de inters en la poblacin (o sea, es el

    parmetro de inters) y p es su estimador muestral.

  • 8/1/2019 Trabajo colaboriativo 1

    10/13

    Luego, procediendo en forma anloga al caso de la media, podemos construir un intervalo de 95% deconfianza para la proporcin poblacional p.

    Ejemplo:

    En un estudio de prevalencia de factores de riesgo en una cohorte de 412 mujeres mayores de 15 aosen la Regin Metropolitana, se encontr que el 17.6% eran hipertensas. Un intervalo de 95% de

    confianza para la proporcin de mujeres hipertensas en la Regin Metropolitana est dado por:

    Luego, la proporcin de hipertensas vara entre (0,139, 0,212) con una confianza de 95%.

    IV. Uso de Intervalos de Confianza para verificar Hiptesis.

    Los intervalos de confianza permiten verificar hiptesis planteadas respecto a parmetrospoblacionales.

    Por ejemplo, supongamos que se plantea la hiptesis de que el promedio de peso de nacimiento decierta poblacin es igual a la media nacional de 3250 gramos.

    Al tomar una muestra de 30 recin nacidos de la poblacin en estudio, se obtuvo:

    = 2930

    s= 450

    n= 30

    Al construir un intervalo de 95% de confianza para la media poblacional, se obtiene:

    Luego, el peso de nacimiento vara entre 2769 y 3091 gramos, con una confianza de 95%.

    Como el intervalo no incluye el valor =3250 gramos planteado en la hiptesis, entonces esta esrechazada con confianza 95% (o un valor p menor a 0,5).

    De igual manera se deben tener en cuenta estas claves para determinar los niveles de confianza:

    1. Un intervalo de confianza aporta ms informacin que un estimador puntual cuando se quiere hacer

    inferencias sobre parmetros poblacionales.

  • 8/1/2019 Trabajo colaboriativo 1

    11/13

    2. Existen intervalos de confianza bilateral y unilateral.

    3. La amplitud de un intervalo de confianza est determinado por: el nivel de confianza establecido; lavariabilidad de los datos; el tamao de la muestra.

    4. En un estudio Caso-Control o uno de Cohorte, es posible (y frecuentemente deseable) construirintervalos de confianza para Odds Ratios y Riesgos Relativos.

    5. Un intervalo de confianza permite verificar hiptesis planteadas acerca de parmetros poblacionales.

    10.Consulte los registros sobre las tarifas de un servicio pblico (agua, telfono, luz, gas, etc.),de por los menos 300 usuarios de estrato 3, de un barrio de su ciudad de origen, en unaempresa de servicios pblicos: Determine la varianza de muestreo, con una muestra de 15tarifas seleccionadas al azar, utilcela para calcular el tamao de muestra necesario paraestimar la media y el total de la poblacin, con un error de $500 y una confianza de 99%.Obtenga con base en esta muestra (seleccionada con el muestreo aleatorio simple ysistemtico), los intervalos de confianza para estos dos parmetros. Vuelva a calcular los

    valores de los dos parmetros (media y el total) con todos los datos de la poblacin detarifas consultadas. Compare los valores estimados con los valores reales y concluya: qutan buenas son las estimaciones realizadas por usted?, estn las estimaciones calculadasde acuerdo con los valores reales?

  • 8/1/2019 Trabajo colaboriativo 1

    12/13

    Conclusiones

    Se han determinado con certeza y seguridad las respuestas de los tems propuestos para el trabajo

    colaborativo No 1 de Inferencia estadstica y se dan por comprendidos los tpicos que han sido objeto

    de estudio en la unidad uno del mismo curso.

    En la participacin colaborativa de los integrantes se ha podido demostrar el cumplimiento y el

    compromiso que tienen los integrantes de este grupo con el debido aprendizaje que de una u otra forma

    van a ser utilizados en nuestra vida profesional.

  • 8/1/2019 Trabajo colaboriativo 1

    13/13

    Bibliografa

    www.wikipedia.com

    www.ringondelvago.com

    http://www2.uiah.fi/projekti/metodi/252.htm

    Presentacin de diapositivas, universidad de valencia. Sin datos adicionales