prueba de hipotesis
DESCRIPTION
Prueba de Hipotesis, estadistica industrialcon buen nivelTRANSCRIPT
PRUEBA DE HIPOTESIS
Ing. William León Velásquez
ESTADISTICA INDUSTRIAL
TEMA 01
CONTENIDO
• CONCEPTOS BÁSICOS DE PRUEBA DE HIPÓTESIS
• PRUEBA DE HIPÓTESIS PARA MUESTRAS GRANDES
• PRUEBA DE HIPÓTESIS PARA DOS MUESTRAS GRANDES
CONCEPTOS BÁSICOS DE PRUEBA DE HIPOTESIS
HIPÓTESIS ESTADÍSTICA • Las hipótesis estadísticas es una
afirmación o suposición sobre un parámetro de la población,
Ejemplo:
–La media poblacional.
–La proporción poblacional
• Una Prueba de Hipótesis estadística es un procedimiento basado en evidencia de la muestra y la teoría de la probabilidad para determinar si la hipótesis es una afirmación razonable
Ing William León V 4
DETERMINACIÓN DE LA HIPÓTESIS ESTADÍSTICA
a. Como resultado de la
experiencia o conocimientos
pasados de un proceso, o
incluso de experimentación
previa.
•El objetivo de la prueba de
hipótesis es determinar si la
situación experimental ha
cambiado.
Ing William León V
El valor del parámetro de la población especificado en la hipótesis se determina de tres maneras:
5
b. A partir de una teoría o
modelo con respecto al objeto
que se estudia.
•El objetivo de la prueba de
hipótesis es verificar la teoría o
modelo.
Ing William León V 6
DETERMINACIÓN DE LA HIPÓTESIS ESTADÍSTICA
c. Como resultado de consideraciones experimentales, como las especificaciones de diseño o ingeniería, o de obligaciones contractuales. •El objetivo de la prueba de hipótesis es la prueba de conformidad.
Ing William León V 7
DETERMINACIÓN DE LA HIPÓTESIS ESTADÍSTICA
IDENTIFICACIÓN DE HIPÓTESIS
• En una prueba de hipótesis se empieza
asumiendo un valor de un parámetro que, a juicio
del investigador, es el más adecuado de acuerdo con
la información disponible, a este supuesto se le llama
hipótesis nula y se representa con Ho.
Ing William León V 8
• La otra hipótesis que se define
a continuación se llama
hipótesis alternativa, que es
la opuesta de lo que se afirma
en la hipótesis nula.
La hipótesis alternativa se
representa como Ha o H1
IDENTIFICACIÓN DE HIPÓTESIS •Hipótesis nula Ho
– La que se contrasta – Los datos pueden
rechazarla – No debería ser rechazada
sin una buena razón.
Ing William León V
•Hipótesis. Alternativa H1 – Es la negación de la H0 – Los datos pueden mostrar
evidencia a favor – No debería ser aceptada sin
una gran evidencia a favor.
:H
:H
1
00.5p
0.5p
, ,
9
EJEMPLO ¿Debo tomar Aspirina o Ibuprofeno para el dolor de
cabeza?
Laboratorios Bayer me dice que tome Aspirina
• Existe teoría (antigua) de que lo mejor es Aspirina
• Laboratorios Cinfa me dice que tome Ibuprofeno
• Existe teoría (nueva) de que lo mejor es Ibuprofeno
Tenemos dos teorías que
compiten.
En estadística se va a llamar
hipótesis.
DEFINICIONES
• La hipótesis nula, denotada por Ho, es el “status
quo”, lo convencional, lo que sabemos de la
población, lo aceptado hasta el momento.
• La hipótesis alternativa, denotada por H1, es una
alternativa a la hipótesis nula – implica cambio, es lo
que el investigador espera que sea cierto.
Ho: El nuevo medicamento es tan
efectivo como el antiguo.
H1: El nuevo medicamento es
más efectivo que el antiguo.
Problema: El tiempo de vida promedio
de una determinada pieza usada en el
ensamblaje de una marca de
computadoras es de 20,000 horas.
Solución:
– Traducir a lenguaje estadístico:
– Establecer su opuesto:
– Seleccionar la Hipótesis
alternativa
– Seleccionar la hipótesis nula
¿Cuál es H0?
000,20:0 H
Ing William León V
000,20𝜇 ≠ 20,000
𝐻1: 𝜇 ≠ 20,000
Problema: ¿El colesterol medio para la
dieta de los trabajadores de las empresas
textiles es 6 mmol/l?
Solución:
– Traducir a lenguaje estadístico:
– Establecer su opuesto:
– Seleccionar la Hipótesis alternativa:
– Seleccionar la hipótesis nula
¿Cuál es H0?
6
Ing William León V
6:0 H
6
𝐻1: 𝜇 ≠ 6
Problema: ¿La altura media o promedio de
los obreros de la empresa pesquera es de
1.60 m?
Solución:
– Traducir a lenguaje estadístico:
– Establecer su opuesto:
– Seleccionar la Hipótesis alternativa:
– Seleccionar la hipótesis nula
¿Cuál es H0?
60.1
Ing William León V
000,20:0 H
60.1
𝐻1: 𝜇 ≠ 1.60
Ing William León V
¿Cuál es H0?
Problema: El porcentaje de personas atacadas por cierta enfermedad laboral en una fabrica grande, no es mayor del 10%.
Solución:
Traducir a lenguaje estadístico:
Establecer su opuesto:
Seleccionar la Hipótesis alternativa:
Seleccionar la hipótesis nula
10.0p
10.0p
10.0:0 pH
𝐻1: 𝜇 > 0.10
Problema: ¿El estrés laboral está
relacionada con el género?
Solución:
– Traducir a lenguaje
estadístico:
– Establecer su opuesto:
– Seleccionar la Hipótesis
alternativa
– Seleccionar la hipótesis nula
Ing William León V
0.5p
¿Cuál es H0?
0 : 0.5H p
0.5p
𝐻1: 𝑝 ≠ 0.5
Ing William León V
• La región crítica es el conjunto de valores
de la prueba estadística que puede causar
el rechazo de la hipótesis nula.
REGIÓN CRÍTICA Y NIVEL DE
SIGNIFICACIÓN
Ing William León V
• El nivel de significancia (denotado por α) es la
probabilidad de que la prueba estadística caerá en la
región crítica cuando la hipótesis nula es actualmente
cierta.
REGIÓN CRÍTICA Y NIVEL DE SIGNIFICACIÓN
Región de no rechazo
• Si la prueba estadística cae en la
región crítica, se rechaza la
hipótesis nula, entonces α es la
probabilidad de cometer el error
de rechazar la hipótesis nula
cuando ésta es cierta.
• Las selecciones comunes de α
son 0.05, 0.01, y 0.10.
Ing William León V
Región crítica
• Valores ‘improbables’ si...
• Es conocida antes de realizar el experimento: resultados experimentales que refutarían H0
REGIÓN CRÍTICA Y NIVEL DE SIGNIFICACIÓN
Nivel de significación: α
• Número pequeño: 1% , 5%
• Fijado de antemano por el investigador
• Es la probabilidad de rechazar H0 cuando es cierta
No rechazo H0
Reg. Crit. Reg. Crit.
a=0.05
H0: =40
PRUEBA: UNILATERAL Y BILATERAL
• Las pruebas pueden ser unilaterales o
bilaterales (también llamados de una o dos
colas) según establezcamos las hipótesis,
Ing William León V
• Si se define en términos de igual y diferente se esta ante una hipótesis bilateral,
• Si se coloca una dirección (en términos de mayor o menor) se esta ante uno unilateral
20
PRUEBA: UNILATERAL Y BILATERAL
Ing William León V
La posición de la región crítica depende de la hipótesis alternativa
Unilateral Unilateral
Bilateral
H1: < 40 H1: >40
H1: 40
21
SIGNIFICACIÓN: p
• El grado de significación 'p' o 'sig' es la
probabilidad de error al rechazar la hipótesis
nula.
Ing William León V 22
• Cuanto más pequeño sea
su valor más probable
será que la hipótesis nula
sea falsa.
•El grado de significación está relacionado con el
nivel de significación es decir con el riesgo de error
que se está dispuesto a asumir en caso de rechazar la
hipótesis nula.
Ing William León V 23
.
SIGNIFICACIÓN: p
•El grado de significación se calcula 'a posteri', es decir
cuando se conoce el resultado de haber aplicado una
prueba de significación.
•El grado de significación indica la probabilidad de error
calculada al rechazar la hipótesis nula.
Ing William León V 24
En la práctica la forma de ejecutar es la
siguiente:
Si p >= α no se rechaza la
hipótesis nula.
Si p < α se rechaza la hipótesis
nula
SIGNIFICACIÓN: p
Ing William León V
SIGNIFICACIÓN: p
43X
No se rechaza H0: =40
p es la probabilidad que tendría una región crítica que comenzase exactamente en el valor del estadístico obtenido de la muestra. Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H0. Es la probabilidad de que por puro azar se logre una muestra “más extraña” que la obtenida. p es conocido después de realizar el experimento aleatorio. La verificación es no significativa cuando p>a
P
P a
a
25
H0: =40 H1: >40
Ing William León V
SIGNIFICACIÓN: p
P a
a
50XSe rechaza H0: =40 Se acepta H1: >40
La verificación es
estadísticamente
significativa
cuando p < α
Es decir, si el
resultado
experimental
discrepa más de “lo
tolerado” a priori.
P
26
H0: =40 H1: >40
RESUMEN: α, p y criterio de rechazo
•Sobre α • Es un número pequeño,
preelegido al diseñar el experimento
– Conocido a sabemos todo sobre la región crítica
Ing William León V
•Sobre p – Es conocido tras
realizar el experimento
– Conocido p sabemos todo sobre el resultado del experimento
Sobre el criterio de rechazo
La verificación es significativa si p menor que a
(cuando se rechaza Ho)
Ing William León V
•H0: Hipótesis nula – No es culpable
•H1: Hipótesis alternativa – Es culpable – No es inocente
RIESGOS AL TOMAR DECISIONES Ejemplo 1:
Se juzga a un individuo por la presunta comisión de
un delito Los datos pueden rechazarla No se rechazará si las pruebas no indican lo contrario Rechazarla por error tiene graves consecuencias
No debería ser aceptada sin una gran evidencia a favor. Rechazarla por error tiene consecuencias consideradas menos graves que la anterior
28
RIESGOS AL CONTRASTAR HIPÓTESIS
Ing William León V
Ejemplo 2: Se cree que la implementación de un nuevo proceso ofrece buenos resultados
Ejemplo 3: Parece que hay una incidencia de productos defectuosos más alta de lo normal
29
RIESGOS AL CONTRASTAR HIPÓTESIS
H0: Hipótesis nula – (Ej.1) No es culpable – (Ej.2) El nuevo proceso no tiene efecto en los
resultados – (Ej.3) No hay nada que destacar en los productos
H1: Hipótesis alternativa
– (Ej.1) Es culpable – (Ej.2) El nuevo proceso es útil – (Ej. 3) Hay una situación anormal en los productos
Ing William León V
No especulativa
Especulativa
30
TIPOS DE ERROR AL TOMAR UNA DECISIÓN
• En este proceso podemos incurrir en dos tipos de errores según sea la situación real y la decisión que tomemos.
Ing William León V
• La verificación de la hipótesis no
establece la verdad de la hipótesis,
sino un criterio que nos permite
decidir SI UNA HIPÓTESIS NO SE
RECHAZA O SE RECHAZA, o
• El determinar si las muestras
observadas difieren
significativamente de los resultados
esperados.
31
TIPOS DE ERROR AL TOMAR UNA DECISIÓN
• Si se rechaza una hipótesis nula, cuando debe no ser rechazada, se comete un error de tipo I, mientras que
• Si no se rechaza una hipótesis nula, debiendo ser rechazada se comete un error de tipo II.
Ing William León V 32
TIPOS DE ERROR AL TOMAR UNA DECISIÓN
• Minimizar los errores no es un asunto sencillo, un caso suele ser más grave que otro y los intentos de disminuir uno suelen producir el aumento del otro.
Ing William León V 33
La única forma de
disminuir ambos a la
vez es aumentar el
tamaño de la
muestra.
TIPOS DE ERROR AL TOMAR UNA DECISIÓN
REALIDAD
Inocente Culpable
VEREDICTO
Inocente OK Error
Menos grave
Culpable Error
Muy
grave
OK
Ing William León V 34
TIPOS DE ERROR AL CONTRASTAR HIPÓTESIS
REALIDAD
CONCLUSIÓN H0 cierta H0 Falsa
No Rechazo H0 Correcto El tratamiento no
tiene efecto y así se
decide.
Error de tipo II
El tratamiento si tiene
efecto pero no lo
percibimos.
Probabilidad β
Rechazo H0
Acepto H1
Error de tipo I
El tratamiento no
tiene efecto pero se
decide que sí.
Probabilidad α
Correcto El tratamiento tiene
efecto y el experimento
lo confirma.
Ing William León V 35
PRUEBA DE HIPOTESIS PARA LA MEDIA. MUESTRAS GRANDES
PRUEBA DE HIPOTESIS PARA MUESTRAS GRANDES
• Cuando se plantean hipótesis para la media de una población y para la diferencia de medias de dos poblaciones y las desviaciones estándar poblacionales son conocidas o el tamaño de la muestra es grande
• El estadístico de prueba está dado por:
z
Ing William León V
CINCO PASOS PARA PROBAR UNA HIPOTESIS PARA LA MEDIA
• En la prueba de hipótesis, se debe
establecer el valor supuesto o
hipotetizado del parámetro de la
población antes de comenzar a tomar la
muestra.
• La suposición que se desea probar se
conoce como hipótesis nula: Ho.
Ing William León V 38
1. Definir la Hipótesis estadística H0 y Ha
PASOS A SEGUIR EN UNA PRUEBA DE HIPOTESIS
• En base a los datos muestrales la hipótesis nula se rechaza o no rechaza.
• Nunca se puede aceptar la hipótesis nula como verdadera, para demostrar sin lugar a dudas que la hipótesis es verdadera, se tendría que conocer el parámetro de la población.
• El no rechazo solamente significa que la evidencia muestral no es lo suficientemente fuerte como para llevar a su rechazo.
Ing William León V 39
1. Definir la Hipótesis estadística H0 y Ha
PASOS A SEGUIR EN UNA PRUEBA DE HIPOTESIS
• Es importante recordar que, sin importar como se determina el problema, la hipótesis nula siempre lleva el signo de igual ( = ).
• Por ejemplo si se desea probar la hipótesis de que la media de la población es igual a 16.
• Se simbolizará y leerá de la siguiente manera: “La hipótesis nula es que la media de la población es igual a 16”.
Ho: μ= 16
Ing William León V
1. Definir la Hipótesis estadística H0 y Ha
40
PASOS A SEGUIR EN UNA PRUEBA DE HIPOTESIS
•La hipótesis alternativa describe
la conclusión a la que se llegará si
se rechaza a la hipótesis nula.
•También se conoce como hipótesis
de investigación.
•La hipótesis alternativa se acepta
si los datos de la muestra
proporcionan suficiente evidencia
estadística de que la hipótesis nula
es falsa. Ing William León V 41
1. Definir la Hipótesis estadística H0 y Ha
PASOS A SEGUIR EN UNA PRUEBA DE HIPOTESIS
• Se considera tres hipótesis alternativas
posibles:
Ha: ≠ 16
Ha: > 16
Ha: < 16
• El signo de igual ( = ) nunca aparecerá en la
hipótesis alternativa. Porque la hipótesis nula
es la declaración que se prueba, y es
necesario incluir un valor especifico en los
cálculos.
• La hipótesis alternativa se considera, sólo
si se demuestra que no es verdadera la
hipótesis nula. Ing William León V 42
1. Definir la Hipótesis estadística H0 y Ha
PASOS A SEGUIR EN UNA PRUEBA DE HIPOTESIS
• El estadístico de prueba es un valor
que se calcula en base a la
información de la muestra, y que se
utiliza para determinar si se rechaza o
no la hipótesis nula.
• Existen muchos estadísticos de prueba
que pertenecen a una distribución
muestral con su propia forma, media y
desviación estándar.
Z, t, χ2, F
Ing William León V
2. Establecer el estadístico de prueba que sea apropiado.
43
PASOS A SEGUIR EN UNA PRUEBA DE HIPOTESIS
Por ejemplo en la prueba de hipótesis
para la media, el estadístico de prueba
es la Z y se calcula por:
Ing William León V
n
Xz
44
2. Establecer el estadístico de prueba que sea apropiado.
PASOS A SEGUIR EN UNA PRUEBA DE HIPOTESIS
• El nivel de significancia es la
probabilidad de rechazar la
hipótesis nula cuando es
verdadera es a lo que se llama error
Tipo I.
• El nivel de significancia se define
con la letra griega alfa (α ).Se le
llama también nivel de riesgo.
Ing William León V
3. Definir el nivel de significancia y la zona de rechazo
45
PASOS A SEGUIR EN UNA PRUEBA DE HIPOTESIS
• No hay un nivel de significancia que se
aplique a todas las pruebas.
• Se toma la decisión de utilizar los niveles
0.05 ( que con frecuencia se conoce
como un nivel del 5%), 0.01, 0.10, o
cualquiera entre 0 y 1 a elección de la
persona que realiza la prueba.
Ing William León V 46
3. Definir el nivel de significancia y la zona de rechazo
PASOS A SEGUIR EN UNA PRUEBA DE HIPOTESIS
La zona de rechazo tiene:
• Una magnitud dada por α y
• Una dirección dada por la hipótesis alternativa.
Ing William León V 47
3. Definir el nivel de significancia y la zona de rechazo
PASOS A SEGUIR EN UNA PRUEBA DE HIPOTESIS
Ing William León V
Ejemplo
48
3. Definir el nivel de significancia y la zona de rechazo
PASOS A SEGUIR EN UNA PRUEBA DE HIPOTESIS
Ing William León V
Existe un 95% de probabilidad de que los resultados muestrales puedan caer entre ± 1.96 si la hipótesis nula es verdadera
Si μ = 16, existe sólo un 2.5% de oportunidad de que una media muestral produzca un valor de Z < -1.96
Si μ = 16, existe sólo un 2.5% de oportunidad de que una media muestral produzca un valor de Z > 1.96
49
3. Definir el nivel de significancia y la zona de rechazo
PASOS A SEGUIR EN UNA PRUEBA DE HIPOTESIS
Ing William León V
4. Calcular el estadístico de prueba a partir de los datos muestrales considerando H0 como verdadera
50
PASOS A SEGUIR EN UNA PRUEBA DE HIPOTESIS
Ing William León V
5. Decidir si H0 no se rechaza o se rechaza.
Y Concluir en términos del contexto del problema.
51
• Una empresa de transportes compró 48
llantas y halló que la duración media para
sus vehículos fue de 59,500 Km.
• ¿Es la experiencia, distinta de la expresada
por el fabricante al nivel de significación de
0.05?
Datos: = 60,000 Km σ = 5,000 Km n = 48 llantas a = 0.05 = 59,500 Km
Ejemplo 1.-
Ing William León V x
El fabricante de una llanta especial para camiones afirma
que la duración media de la parte rodante de agarre es de
60,000 Km. La desviación estándar del kilometraje es de
5,000 Km.
Solución:
Paso 1
Las hipótesis se expresan de la siguiente manera:
H0 : = 60,000 Km
La duración de las llantas es de 60,000 Km
H1 : 60,000 Km
La duración de las llantas es distinta a 60,000 Km
Ing William León V
Solución:
Paso 2
El estadístico de prueba mas apropiado.
Teniendo en cuenta que se tiene una muestra de 48
llantas y se conoce la desviación estándar de la
población
n = 48 llantas
σ = 5,000 Km
Se utilizará la distribución Z
Ing William León V
Solución: Paso 3
El nivel de significancia es de 0.05
Y por la hipótesis alternativa:
H1 : 60,000 Km Se trata de una prueba bilateral
Ing William León V
En el siguiente paso vamos a obtener el valor de “Z” y
para ello vamos a apoyarnos en la gráfica siguiente:
*Se recurre a las tablas
de la distribución normal y
en ellas localizamos
0.475, que se ubica en un
valor de Z = 1.96
* Este procedimiento va depender del tipo de tabla que se tenga
Solución:
Ing William León V
Paso 4
Se Calculará el estadístico de prueba a partir de los datos muestrales considerando H0 como verdadera
693.0
71.721
000,60500,59
Z
Z𝑍 =
𝑥 − 𝜇
𝜎𝑥
𝜎𝑥 =𝜎
𝑛
𝜎𝑥 =5000
48 =
5000
6.928=721.71
Donde:
Solución:
Ing William León V
Paso 5
• Se va ha decidir si H0 no se rechaza o se rechaza.
Como -0.693 es menor que -1.96 no se rechaza la hipótesis nula
Es decir el z de los datos se encuentra en la zona de no rechazo
La duración de las llantas NO es distinta a 60,000 Km
Entonces se concluye que la duración media de las llantas es muy
cercana a la que afirma el fabricante de 60,000 millas, con un
nivel de significancia de 0.05.
Solución:
• Primero, se va a calcular el error estándar de la media y para ello emplearemos la expresión del error estándar:
Ing William León V
nX
Sustituyendo valores en ella, se tiene:
Kmxxx 69.7219282.6
000,5
48
000,5
El Error Estándar de la media mide con cuánta precisión la media de la muestra estima la media de la población y se utiliza para crear intervalos de confianza para la media de la población. Los valores del Error Estándar de la Media más bajos indican con mayor precisión las estimaciones de la media de la población
Desarrollando bajo el enfoque del intervalo de confianza:
Solución: Se va a determinar los límites superior e inferior de
confianza para el intervalo de la media poblacional ya que se trata de una prueba de dos extremos.
Se aplica la expresión siguiente:
Ing William León V
Sustituyendo valores en ella, se tiene:
Lc = 60,000 1.96 (721.69)
Ls = 60,000 + 1,414.51 Ls = 61,414.51 Km.
Li = 60,000 – 1,414.51 Li = 58,585.49 Km
Entonces la media de la población fluctúa entre 58,585.49 y 61,414.51 millas en un nivel de confianza del 95%.
xH ZLc 0
Solución: Al regresar a la gráfica anterior se observa los límites
de confianza y la media muestral.
Con ello se analiza si no se rechaza la hipótesis nula además de verificar si es verdadera o falsa.
Ing William León V
Solución:
La media muestral se ubica dentro de la zona de no rechazo, por lo que podemos decir que la hipótesis nula es verdadera,
Ing William León V
Entonces la media muestral se ubica en -0.693 = -0.693(721.69)
500.13 60,000-500 = 59,500
y se confirma que cae en la zona de no rechazo
Concluimos que la duración media de las llantas es muy cercana a la que afirma el fabricante de 60,000 millas, con un nivel de significancia de 0.05.
__
X
¿Es dicho tiempo menor de 3 minutos? Datos: = 3 minutos. σ= 1minuto. n = 50 clientes. a = 0.05 = 2.75 minutos.
Ejemplo 2 Una cadena de restaurantes afirma que el tiempo medio de espera
de clientes por atender está distribuido normalmente con una
media de 3 minutos y una desviación estándar de 1 minuto.
Su departamento de aseguramiento de la calidad halló en una
muestra de 50 clientes en un cierto establecimiento que el tiempo
medio de espera era de 2.75 minutos. Al nivel de significación de
0.05,
Ing William León V
x
Paso 1 Las hipótesis se expresan de la siguiente manera:
Ing William León V
Ho : = 3 El tiempo promedio de espera es de 3 minutos. H1 : 3 El tiempo promedio de espera es menor de 3 minutos.
Ejemplo 2.-
Solución:
Paso 2
El estadístico de prueba mas apropiado.
Teniendo en cuenta que se tiene una muestra de 50 clientes
y se conoce la desviación de la población
n = 50 clientes
σ = 1 minuto
Entonces
Se utilizará la distribución Z
Ing William León V
Solución: Paso 3
El nivel de significancia es de 0.05
Y por la hipótesis alternativa:
H1 : 3 Se trata de una prueba unilateral
Ing William León V
En el siguiente paso vamos a obtener el valor de “Z” y para ello vamos a apoyarnos en la gráfica siguiente:
*0.5 – 0.05 = 0.45 .
Se busca en las tablas de
la distribución normal
0.45, y se encuentra que:
Z= 1.64
* Este procedimiento va depender del tipo de tabla que se tenga
Solución:
Ing William León V
Paso 4
Se Calculará el estadístico de prueba a partir de los
datos muestrales considerando H0 como verdadera
77.11414.0
25.0
1414.0
375.2
ZZZ
𝑍 =𝑥 − 𝜇
𝜎𝑥
Solución:
Ing William León V
Paso 5
• Se va ha decidir si H0 no se rechaza o se rechaza.
Como -1.77 es mayor que -1.64 se rechaza la hipótesis
nula Es decir el z de los datos se encuentra en la zona de
rechazo
Entonces se concluye que el tiempo medio de espera de clientes por atender en este establecimiento es menor de 3 minutos.
Calcula el error estándar de la media:
Con un a = 0.05 y es una prueba de hipótesis para un
extremo, en este caso, el extremo izquierdo, entonces, el
nivel de significancia está contenido en este extremo, por
lo que el nivel de confianza es 0.5 – 0.05 = 0.45 .
Se busca en las tablas de la distribución normal 0.45, y
se encuentra que: Z= 1.64
El límite izquierdo del intervalo de confianza será:
Li = 3 – 1.64 (0.1414)
Li = 3 – 0.2319
Li = 2.768
Ing William León V
1414.007.7
1
50
1 xxx
Ejemplo 2.-
nX
Desarrollando bajo el enfoque del intervalo de confianza
Gráficamente se representa así:
Ejemplo 2.-
Ing William León V
Ejemplo 2.-
Ing William León V
• La media muestral 2.75, se localiza en la zona de rechazo, por lo que se puede establecer que se rechaza la hipótesis nula y se acepta la alternativa.
Comprobemos con :
x
xZ
77.11414.0
25.0
1414.0
375.2
ZZZ
Como se puede observar 1.77 está localizado más hacia
la izquierda del límite de confianza 1.64.
Se puede concluir que el tiempo medio de espera de
clientes por atender en este establecimiento es
menor de 3 minutos.
PRUEBA DE HIPÓTESIS DE 2 MEDIAS POBLACIONALES
PRUEBA DE HIPÓTESIS DE 2 MEDIAS POBLACIONALES
• Se tienen dos poblaciones y se toman
muestras aleatorias independientes de
tamaños n1 y n2, se puede comparar el
comportamiento de dichas poblaciones a
través de los promedios.
• Las muestras se obtienen de poblaciones
con distribución normal
• El estadístico de trabajo depende de las
características de las poblaciones y del
tamaño de las muestras.
Ing William León V 72
PRUEBA DE HIPÓTESIS DE 2 MEDIAS POBLACIONALES
• Se puede plantear uno de los siguientes tres tipos de hipótesis:
• - Prueba de hipótesis a dos colas
H0 : µ1=µ2 ó H0 : µ1-µ2 = 0
H1 : µ1≠µ2 ó H1 : µ1-µ2 ≠ 0
• - Prueba de hipótesis a una cola superior
H0 : µ1=µ2 ó H0 : µ1-µ2 = 0
H1 : µ1>µ2 ó H1 : µ1-µ2 > 0
• - Prueba de hipótesis a una cola inferior
H0 : µ1=µ2 ó H0 : µ1-µ2 = 0
H1 : µ1<µ2 ó H1 : µ1-µ2 < 0
Ing William León V 73
PRUEBA DE HIPÓTESIS DE 2 MEDIAS POBLACIONALES
Ing William León V 74
PRUEBA DE HIPÓTESIS DE 2 MEDIAS POBLACIONALES µ1 y µ2
Si las muestras son mayores o iguales de 30
n1 y n2>=30
Si tienen varianzas poblacionales desconocidas
σ2 diferentes
Varianzas diferentes
σ2 conocidos
Varianzas iguales
σ2 desconocidos
Si tienen varianzas poblacionales conocidas
σ2 iguales
Si las muestras son menores a 30
n1 y n2<30
P. H. para la diferencia de medias, con varianzas poblacionales conocidas
•Se asume que hay dos poblaciones de interés μ1 y μ2,
•Además se asume que μ1 tiene media desconocida y
varianza conocida y que μ2 tiene media desconocida y
varianza conocida .
Ing William León V 75
Estaremos interesados en la
prueba de la hipótesis de que
las medias µ1y µ2 sean
iguales.
• Se considera primero las hipótesis
alternativas de dos lados:
• Donde
• H0 = Hipótesis nula
• H1 = Hipótesis alternativa.
• μ1= media de la población 1
• μ2= media de la población 2
P. H. para la diferencia de medias, con varianzas poblacionales conocidas
H0 : µ1=µ2 ó H0 : µ1-µ2 = 0 H1 : µ1≠µ2 ó H1 : µ1-µ2 ≠ 0
• El procedimiento para probar es calcular el estadístico de prueba Z0 mediante la siguiente fórmula:
P. H. para la diferencia de medias, con varianzas poblacionales conocidas
Donde: 𝜇1= media de la muestra 1 𝜇1= media de la muestra 2 𝜎1
2= varianza de la población 1 𝜎2
2= varianza de la población 2 𝑛1 = tamaño de la muestra 1 𝑛2 = tamaño de la muestra 2
𝑍 =(𝑋 1 − 𝑋 2) − (𝜇1 − 𝜇2)
𝜎21
𝑛1+
𝜎22
𝑛2
Las hipótesis alternativas de dos lados se analizan de la siguiente manera.
Para probar
𝐻0: 𝜇1=𝜇2
𝐻1: 𝜇1 ≠ 𝜇2
Se calcula el estadístico de prueba Z0 y se rechaza 𝐻0: 𝜇1=𝜇2 si 𝑧0 > 𝑧𝛼
2
o
𝑧0 < 𝑧𝛼2
Donde
Z0 = Valor calculado del estadístico de prueba
𝑍𝛼2 = Valor obtenido de las tablas.
P. H. para la diferencia de medias, con varianzas poblacionales conocidas
Las hipótesis alternativas de un lado se analizan de
manera similar. Para probar
𝐻0: 𝜇1=𝜇2
𝐻1: 𝜇1 > 𝜇2
Se calcula el estadístico de prueba Z0 , y se
rechaza 𝐻0: 𝜇1=𝜇2 si 𝑍0>𝑍𝛼 .
Para probar las otras hipótesis alternativas de un
lado
𝐻0: 𝜇1=𝜇2
𝐻1: 𝜇1 < 𝜇2
Se utiliza el estadístico de prueba Z0 y se rechaza
𝐻0: 𝜇1=𝜇2 si 𝑍0<−𝑍𝛼
P. H. para la diferencia de medias, con varianzas poblacionales conocidas
P. H. para la diferencia de medias, con varianzas poblacionales conocidas
•Se asume que hay dos poblaciones de interés μ1 y μ2,
•Además se asume que μ1 tiene media desconocida y
varianza desconocida y que μ2 tiene media
desconocida y varianza desconocida .
Ing William León V 80
Se estará interesado en la
prueba de la hipótesis de que
las medias µ1y µ2 sean
iguales.
• El procedimiento para probar es calcular la estadística de prueba Z0 mediante la siguiente fórmula:
P. H. para la diferencia de medias, con varianzas poblacionales desconocidas y
diferentes
Donde: 𝑥 1= media de la muestra 1 𝑥 2= media de la muestra 2
𝑆12= varianza de la muestra 1
𝑆22= varianza de la muestra 2
𝑛1 = tamaño de la muestra 1 𝑛2 = tamaño de la muestra 2
𝑍 =(𝑋 1 − 𝑋 2) − (𝜇1 − 𝜇2)
𝑆21
𝑛1+
𝑆22
𝑛2
• Si las muestras provienen de poblaciones normales con varianzas poblacionales iguales pero desconocidas y tamaños de muestra grandes , es decir, n1 > 30 y n2 > 30. Como se desconocen las varianzas poblacionales se debe obtener una expresión que represente dichas varianzas,
P. H. para la diferencia de medias, con
varianzas poblacionales desconocidas pero
iguales
Donde:
𝑥 1= media de la muestra 1
𝑥 2= media de la muestra 2
𝑆12= varianza de la muestra 1
𝑆22= varianza de la muestra 2
𝑛1 = tamaño de la muestra 1
𝑛2 = tamaño de la muestra 2 𝑍 =(𝑋 1 − 𝑋 2) − (𝜇1 − 𝜇2)
𝜎𝑑𝑖𝑓
𝜎𝑑𝑖𝑓 =𝑛1−1 𝑆2
1+ 𝑛2−1 𝑆22
𝑛1+𝑛2−2 1
𝑛1+
1
𝑛2
EJEMPLO 1
• El salario promedio mensual para una muestra de 30
empleados de una empresa manufacturera es de
$280.000, con desviación estándar de $14.000.
• En otra empresa del mismo tipo, una muestra aleatoria
de 40 empleados, tiene un salario promedio de
$270.000, con una desviación estándar de $10.000.
Ing William León V 83
• No se suponen iguales las
desviaciones estándar de las
poblaciones. Se requiere probar
la hipótesis de que no existe
diferencia entre los salarios
promedios mensuales de las
dos empresas, utilizando un
nivel de significancia del 5%.
EJEMPLO 1
Ing William León V 84
1.- Establecer las hipótesis
• 𝐻0: 𝜇1 − 𝜇2 = 0, o que 𝐻0: 𝜇1 = 𝜇2
• No existe diferencia entre los salarios promedios mensuales de las dos empresas
• 𝐻0: 𝜇1 − 𝜇2 ≠ 0, o que 𝐻0: 𝜇1 ≠ 𝜇2
• Existe diferencia entre los salarios
promedios mensuales de las dos empresas
EJEMPLO 1
2.- Elegir el modelo probabilístico:
– Como n> 30
– Se utiliza la curva Z:
Ing William León V 85
EJEMPLO 1 3.- Establecer el criterio de contraste
Ing William León V 86
REGION DE NO RECHAZO
Z1=-1.96 0 Z2=1.96 α=0.5
Para α/2 = 0.025, entonces 𝑍1 = −1.96 y 𝑍2 = 1.96. El Intervalo de los Valores críticos de Z es:
−1.96 < 𝑍 < 1.96
α/2=0.025 α/2=0.025
EJEMPLO 1 4.- Calcular el valor del estadístico de prueba
• La desviación estándar de cada una de las muestras es:
Ing William León V 87
𝜎1𝑥 =𝜎1𝑛1
=14000
30= 2556.04
𝜎2𝑥 =𝜎2
𝑛2=
10000
40= 1581.14
𝜎 = 𝜎1𝑥 2 + 𝜎2𝑥
2 = 2556.04 2 + 1581.14 2 = 3005.53
• Se calcula el valor del estadístico de prueba, en este caso Z*
𝑍 =𝑋 1 − 𝑋 2
𝜎=
280000 − 270000
3005.55= 3.33
EJEMPLO 1
5.- Tomar una decisión e interpretar
• Como Z = 3.33 no se encuentra en
• El Intervalo critico de Z. −1.96 < 𝑍 < 1.96
• No se encuentra en la región de NO RECHAZO
según la grafica de la Campana de Gauss.
• Por ello se rechaza la Hipótesis nula y se
acepta la hipótesis alternativa:
• El salario promedio mensual de las dos
empresas es diferente.
Ing William León V 88
EJEMPLO 2 Un analista de salarios consideraba que el salario
promedio de la primera empresa era mayor que en
la segunda empresa.
Con el objeto de someter su posición a una prueba
critica, le da el beneficio de la duda a la posibilidad
contraria y plantea la hipótesis nula de que el
salario promedio de la primera empresa es igual o
menor que el de la segunda.
Ing William León V 89
Con los datos del ejemplo 1
Pruebe la hipótesis, con el nivel
de significancia del 1%.
Se supone que las
desviaciones estándar de las
dos poblaciones son iguales.
EJEMPLO 2
Ing William León V 90
1.- Establecer las hipótesis • 𝐻0: 𝜇1 = 𝜇2 o 𝜇1 − 𝜇2 = 0 • El salario promedio de la primera
empresa es igual que en la segunda empresa.
• 𝐻1: 𝜇1 > 𝜇2 o 𝜇1 − 𝜇2 > 0 • El salario promedio de la primera
empresa es mayor que en la segunda empresa.
EJEMPLO 2
2.- Elegir el modelo probabilístico:
• Como n> 30
• Se utiliza la curva Z:
Ing William León V 91
EJEMPLO 2
3.- Establecer el criterio de contraste
Ing William León V 92
REGION DE NO RECHAZO
0 Z2=2.33 α=0.5
Como es para una cola, entonces el nivel de
significancia que se tiene es 𝛼 = 0.01 , el z
para esta área según la tabla es de Z= 2.33,
porque el área es A=0.99.
α=0.01
EJEMPLO 2
4.- Calcular el valor del estadístico de prueba
• Hallamos el z para comparar.
Ing William León V 93
𝑍 =𝑋 1 − 𝑋 2
𝜎=
280000 − 270000
3005.55= 3.33
EJEMPLO 2
5.- Tomar una decisión e interpretar
• Como z = 3.33 > z=2.33, entonces se rechaza la hipótesis nula y se acepta la hipótesis alternativa:
• El salario promedio de la primera empresa es mayor que el salario promedio de la segunda empresa.
• Además podemos observar que el valor de Z = 3.33 queda en la región de rechazo
Ing William León V 94
EJEMPLO 3 • Una empresa está considerando dos lugares alternativos para
construir un centro comercial. Como los ingresos de los hogares de una ciudad son un criterio importante en ésta selección, se quiere probar que el ingreso promedio de la primera ciudad excede al promedio de la segunda ciudad en cuando menos $1,500 mensuales. Con la información de un censo realizado el año anterior se sabe que la desviación estándar del ingreso mensual de la primera ciudad es de $1,800 y la de la segunda es de $2,400
Ing William León V 95
De una muestra aleatoria de 30 hogares de la primera ciudad, se encuentra que el ingreso mensual promedio es de $35,500 y de una muestra de 40 hogares de la segunda ciudad el ingreso promedio mensual es de $34,600. Probar la hipótesis con un nivel de confianza del 95 por ciento. .
EJEMPLO 3
Ing William León V 96
1.- Establecer las hipótesis • Se desea probar si la diferencia entre los ingresos
de la ciudad 1 y la 2 es de $1,500 o más, por lo tanto:
• H0 : 𝜇1 − 𝜇2 = 1,500 La diferencia en el ingreso promedio de la primera ciudad con respecto al promedio de la segunda ciudad es de $1.500 mensuales.
• H1 : 𝜇1 − 𝜇2 < 1,500 La diferencia en el ingreso promedio de la primera ciudad con respecto al promedio de la segunda ciudad es menor de $1.500 mensuales.
EJEMPLO 3
2.- Elegir el modelo probabilístico:
• El tamaño de las muestras es grande y las varianzas poblacionales son conocidas, por consiguiente la estadística de trabajo a utilizar es
la distribución Z:
Ing William León V 97
EJEMPLO 3 3.- Establecer el criterio de contraste
Ing William León V 98
Para un nivel de confianza del 95 por ciento, el alfa
será 0.05
Y la hipótesis alternativa es: H1 : 𝜇1 − 𝜇2 < 1,500 por lo tanto se trata de una prueba unilateral negativa
De la tabla de la distribución
normal se tiene un valor de Z de
-1.64..
EJEMPLO 3 4.- Calcular el valor del estadístico de prueba
• Se halla el z de la prueba, para comparar.
Ing William León V 99
n1=30
𝑥 = 35,500
σ1=1,800
n2=40
𝑥 = 34,600
σ2=2,400 1-α=0.95
𝑍𝑥 1−𝑥 2 =𝑥 1 − 𝑥 2 − (𝜇1 − 𝜇2)
𝜎21
𝑛1+
𝜎22
𝑛2
𝑍𝑥 1−𝑥 2 =35,500−34,600 −1.500
1,8002
30+
2,4002
𝑛2
=-1.195
EJEMPLO 3 5.- Tomar una decisión e interpretar
• De la figura se observa, que el estadístico de trabajo se ubica en la zona de no rechazo de la hipótesis nula;
• Es decir, la diferencia en el ingreso promedio de la primera ciudad con respecto al promedio de la segunda ciudad NO es menor de $1.500 mensuales, con una confiabilidad del 95 por ciento,
• Por lo tanto la empresa puede elegir la primera ciudad para construir el nuevo centro comercial
Ing William León V 100
-1.195
EJEMPLO 4 Se realizó un estudio con un nivel de significancia de 0.05 para
investigar si la prensa popular está más orientada hacia temas
sexuales que la prensa dirigida a la clase media. Se considera en ambos casos una variabilidad igual.
Se recogieron dos muestras representativas de 40 artículos
publicados en ambos tipos de revistas.
Ing William León V 101
Utilizando un índice que mide el contenido sexual de los artículos, la muestra 1 (popular) tuvo un puntaje medio de 3.5 con una desviación estándar de 2, mientras que la muestra 2 (clase media) tuvo una media de 3 con una desviación de 2.2.
EJEMPLO 4
• 1.- Establecer las hipótesis
• Ho: µ1 = µ 2
• Ho: « La orientación hacia contenidos sexuales en la prensa popular y en la prensa de clase media son iguales»
• Ha: µ 1> µ 2
• Ha: « La orientación hacia contenidos sexuales es mayor en la prensa popular que en la prensa de clase media ».
Ing William León V 102
EJEMPLO 4
• 2.- Elegir el modelo probabilístico:
• Para determinar que tipo de distribución se utilizará:
• Si n1 + n2 - 2 > 30 entonces se busca en la tabla el valor de z correspondiente a α/2.
• Si n1 + n2 – 2 ≤ 30 se busca en la tabla el valor t correspondiente a φ= n1+n2-2 y α/2.
Entonces n > 30 y por lo tanto se utiliza la distribución normal a través de la tabla z con α = .05
En este ejemplo, φ = n1 + n2 - 2 = 40 + 40 - 2 = 78
Ing William León V 103
Ing William León V
EJEMPLO 4 3.- Establecer el criterio de contraste
Como en este problema, α = .05 y la hipótesis alterna contiene
el signo (>) el problema es de una cola, es decir, la región crítica
se ubica en el extremo derecho de la curva.
• Luego se aplica la fórmula de interpolación:
104
0.05
EJEMPLO 4 4.- Calcular el valor del estadístico de prueba con varianzas iguales
• Se calcula el error estándar de la diferencia de las medias
Ing William León V 105
𝜎𝑑𝑖𝑓 =𝑛1−1 𝑆2
1+ 𝑛2−1 𝑆22
𝑛1+𝑛2−2 1
𝑛1+
1
𝑛2
Se calcula el valor del estadístico de prueba, en este caso Z*
σ
EJEMPLO 4
• 5.- Tomar una decisión e interpretar
• El estadístico de prueba queda localizado fuera de la zona crítica, entonces no se rechaza la hipótesis nula ( Ho),
• Por lo tanto se concluye lo siguiente: • No hay evidencia suficiente, con un nivel de
significancia de .05, de que la prensa popular tenga una mayor orientación al tema sexual que la prensa de clase media
Ing William León V 106