distribucion chi cuadrado
DESCRIPTION
estadisticaTRANSCRIPT
RESEÑA HISTÓRICA El famoso artículo de Karl Pearson
sobre la distribución Chi-cuadrada apareció en la primavera de 1900, lo que se puede considerar un inicio auspicioso a un magnífico siglo para el campo de la estadística-B. Efron, The Statistical Century
UNIVERSIDA
D
NACIONAL DE
INGENIERÍA
INTRODUCCIÓN Con la práctica podemos realizar suposiciones
sobre el valor de algún parámetro estadístico. Estas proposiciones se deben contrastar con la realidad (mediante el muestreo de datos) para tomar una decisión entre aceptar o rechazar la suposición.
Estos supuestos se denominan Hipótesis y el procedimiento para decidir si se aceptan o se rechazan se llama prueba de hipótesis o de significación. Una prueba de hipótesis es una herramienta de análisis de datos muy importante para la toma de decisiones, que puede en general formar parte de un experimento comparativo más completo entre un supuesto y la realidad.
UNIVERSIDA
D
NACIONAL DE
INGENIERÍA
DISTRIBUCIÓN CHI-CUADRADO Función de densidad
Con parámetro: grados de libertad
Función de Distribución Acumulada
UNIVERSIDA
D
NACIONAL DE
INGENIERÍA
DISTRIBUCIÓN CHI-CUADRADO Teoremas Básicos
• Media • Moda• Varianza• Coeficiente de Simetría• Función Generadora de Momentos para
• Función Característica Teoremas fundamentales
• Teorema 1
UNIVERSIDA
D
NACIONAL DE
INGENIERÍA
APLICACIONES PRINCIPALES 1. Probar la supuesta independencia de dos
variables cualitativas de una población,
2. Hacer inferencias sobre más de dos proporciones de una población.
3. Hacer inferencias sobre la varianza de la población.
4. Realizar pruebas de bondad de ajuste para evaluar la credibilidad de que los datos muestrales, vienen de una población cuyos elementos se ajustan a un tipo específico de distribución de probabilidad.
UNIVERSIDA
D
NACIONAL DE
INGENIERÍA
PRUEBAS DE INDEPENDENCIA La prueba de independencia Chi-
cuadrado, nos permite determinar si existe una relación entre dos variables categóricas. Es necesario resaltar que esta prueba nos indica si existe o no una relación entre las variables, pero no indica el grado o el tipo de relación; es decir, no indica el porcentaje de influencia de una variable sobre la otra o la variable que causa la influencia.
UNIVERSIDA
D
NACIONAL DE
INGENIERÍA
PRUEBAS DE INDEPENDENCIA Procedimiento para elaborar una prueba de independencia. 1. Obtener la frecuencia observada (F.O), proveniente de una
encuesta, estudio o experimento. 2. Resumir los datos obtenidos, es decir, la frecuencia observada,
en un cuadro de contingencia. 3. Calcular la frecuencia esperada (F.E), y se calcula con la
siguiente formula: 4. Determinar el nivel de significancia (α), y los grados de libertad,
con la siguiente formula: 5. Plantear las hipótesis.
H0: independencia H1: dependencia
6. Construir las áreas de aceptación y rechazo. 7. Calcular ji-Cuadrada
8. Tomar una decisión y emitir una conclusión en términos del problema.
UNIVERSIDA
D
NACIONAL DE
INGENIERÍA
PRUEBAS DE INDEPENDENCIA Una agencia de publicidad desea saber si el género de los consumidores es independiente de sus preferencias de cuatro marcas de café. La respuesta determinará si se deben diseñar diferentes anuncios dirigidos a los hombres y otros diferentes para las mujeres. Realice la prueba con un nivel de significancía del 5%.
1. Los resultados obtenidos de la encuesta realizada a 139 personas fue:
UNIVERSIDA
D
NACIONAL DE
INGENIERÍA
PRUEBAS DE INDEPENDENCIA 2. Elaboración de la tabla de contingencia.
3. Calcular la Frecuencia Esperada.
UNIVERSIDA
D
NACIONAL DE
INGENIERÍA
4. Calcular los grados de libertad
5. Plantear las hipótesis. H0: La marca de café que se consume es
independiente del sexo de una persona. H1: La marca de café que se consume depende del
sexo de una persona. 6. Construcción de las áreas de aceptación y rechazo.
PRUEBAS DE INDEPENDENCIA
UNIVERSIDA
D
NACIONAL DE
INGENIERÍA
PRUEBAS DE INDEPENDENCIA 7. Calculando ji-cuadrada.
8. Tomar una decisión y concluir.
* Aceptar Ho: Con un nivel de confianza del 5% se encontró que la marca de café es independiente del sexo de la persona. Por lo que se recomienda elaborar un sólo tipo de anuncio.
UNIVERSIDA
D
NACIONAL DE
INGENIERÍA
PRUEBAS DE BONDAD Y AJUSTE La prueba de ji cuadrada también se puede
utilizar para decidir si una distribución de probabilidad, como la binomial, la de poisson o la normal, es la distribución apropiada.
De esta manera, estamos en condiciones de determinar la bondad y ajuste de una distribución teórica; en otras palabras, podemos precisar hasta que punto encaja en la distribución de los datos que hemos observado. Así pues podemos determinar si debemos creer que los datos observados constituyen una muestra extraída de la supuesta distribución teórica.
UNIVERSIDA
D
NACIONAL DE
INGENIERÍA
PRUEBAS DE BONDAD Y AJUSTE Procedimiento para elaborar una prueba de bondad y ajuste. 1. Obtener la frecuencia observada (F.O), proveniente de una
encuesta, estudio ó experimento. 2. Determinar la frecuencia esperada (F.E), 3. Establecer el nivel de significancia 4. Determinar los grados de libertad. De la siguiente manera:
gl=K-1 5. Plantear las hipótesis
H0: lo que se sostiene el supuesto valor del parámetro. H1: lo que contradice al supuesto valor del parámetro.
6. Construir las áreas de aceptación y rechazo. 7. Calcular jí-cuadrada
8. Tomar una decisión y emitir una conclusión, en términos del problema.
UNIVERSIDA
D
NACIONAL DE
INGENIERÍA
PRUEBAS DE BONDAD Y AJUSTE Se cree que la duración del sueño profundo de las personas se puede aproximar mediante una distribución normal con media μ= 3.5 hrs. y desviación estándar σ= 0.7 hrs. Probar la veracidad de esta idea con los siguientes datos tomados de una muestra de pacientes. Utilizar una significancia de 0.05.
Total de datos 40.
UNIVERSIDA
D
NACIONAL DE
INGENIERÍA
PRUEBAS DE BONDAD Y AJUSTE Primero visualizamos los datos en un histograma.
Aparentemente los datos siguen una distribución normal.Prueba de hipótesis:H0; Los datos provienen de una distribución normal.H1; Los datos no provienen de una distribución normal.
UNIVERSIDA
D
NACIONAL DE
INGENIERÍA
PRUEBAS DE BONDAD Y AJUSTE En este ejemplo en particular se cuenta con la media y desviación estándar de la población, por lo que no se tienen que estimar. En caso de que no se tuvieran, se estimarían a partir de los datos agrupados, tomando en cuenta que para los grados de libertad el valor de m sería 2, ya que se estimarían la media y la desviación estándar. Se procederá a calcular los valores de z para encontrar las probabilidades usando los límites inferiores de los intervalos de clase:
La razón por la cual se comienza con el límite de 1.95 y se termina con el límite de 4.45, es porque la suma de todas las probabilidades debe ser 1, bajo la curva normal. A continuación se muestra la curva normal con sus respectivas probabilidades, según los limites reales.
UNIVERSIDA
D
NACIONAL DE
INGENIERÍA
PRUEBAS DE BONDAD Y AJUSTE
Con estas probabilidades se calcularán los valores esperados, multiplicando cada probabilidad por 40 (el total).
UNIVERSIDA
D
NACIONAL DE
INGENIERÍA
PRUEBAS DE BONDAD Y AJUSTE Grados de libertad: k-1-m = 4-1-0 = 3
Regla de decisión:Si χ2≤7.815 no se rechaza Ho.Si χ2>7.815 se rechaza Ho.
Justificación y decisión:Como 3.06 no es mayor de 7.815, no se rechaza H0 y se concluye conα= 0.05 que el ajuste de los datos a una distribución normal es bueno.
UNIVERSIDA
D
NACIONAL DE
INGENIERÍA
EN PRUEBAS DE DESVIACIÓN ESTÁNDAR.La compañía de baterías Duramás ha desarrollado una nueva batería para celulares. En promedio, la batería dura 60 minutos por carga. La desviación estándar es de 4 minutos. Supongamos que el departamento de manufactura corre una prueba de control de calidad. Ellos seleccionan 7 baterías al azar. La desviación estándar de las baterías seleccionadas es de 6 minutos. ¿Qué valor de la estadística chi-cuadrada tenemos para esta prueba?
SoluciónBueno, empezamos con lo que sabemos:•La desviación estándar de la población es de 4 minutos. •La desviación estándar de la muestra es de 6 minutos. •El número de observaciones muestreadas es 7.
UNIVERSIDA
D
NACIONAL DE
INGENIERÍA
EN PRUEBAS DE DESVIACIÓN ESTÁNDAR.Para calcular la estadística chi-cuadrada, usamos los valores en la ecuación para .
donde es la estadística chi-cuadrada, n el tamaño de la muestra, s la desviación estándar de la muestra, y σ la desviación estándar de la población.
UNIVERSIDA
D
NACIONAL DE
INGENIERÍA
APLICACIÓN EN R Ejemplo de una prueba de frecuencia Candidatos postulan para la Presidencia de la Republica. Según los sondeos se tiene la siguientedistribución:Candidatos A= 34 %, B = 28%, C=14% D=8% Otros 16%
Las categorías son (A, B, C, D y Otros)
Nivel de riesgo: 0.10Se hizo el estudio de una muestra en donde arrojo los siguientes resultados:Total de encuestados: 120Preferencias a los candidatos:A = 45, B=30, C=18, D=6 y otros = 2
Hp: La preferencia a los candidatos se mantiene.Ha: Hay cambios en la preferencia.
UNIVERSIDA
D
NACIONAL DE
INGENIERÍA
Desarrollo en rstudio# Valores teóricosy<-c(A=34 , B=28, C=14, D=8, Otros= 16)# Valores de la muestrax<- c(A = 45, B=30, C=18, D=6, otros = 21)# Prueba estadisticachi.calculado <- chisq.test(x, p=y/sum(y) )# Valor critico para 0.10 y 4 gl.qchisq(1- 0.10 , 4)
UNIVERSIDA
D
NACIONAL DE
INGENIERÍA