prueba de hipotesis

PRUEBA DE HIPOTESIS

Ing. William León Velásquez

ESTADISTICA INDUSTRIAL

TEMA 01

CONTENIDO

• CONCEPTOS BÁSICOS DE PRUEBA DE HIPÓTESIS

• PRUEBA DE HIPÓTESIS PARA MUESTRAS GRANDES

• PRUEBA DE HIPÓTESIS PARA DOS MUESTRAS GRANDES

CONCEPTOS BÁSICOS DE PRUEBA DE HIPOTESIS

HIPÓTESIS ESTADÍSTICA • Las hipótesis estadísticas es una

afirmación o suposición sobre un parámetro de la población,

Ejemplo:

–La media poblacional.

–La proporción poblacional

• Una Prueba de Hipótesis estadística es un procedimiento basado en evidencia de la muestra y la teoría de la probabilidad para determinar si la hipótesis es una afirmación razonable

Ing William León V 4

DETERMINACIÓN DE LA HIPÓTESIS ESTADÍSTICA

a. Como resultado de la

experiencia o conocimientos

pasados de un proceso, o

incluso de experimentación

previa.

•El objetivo de la prueba de

hipótesis es determinar si la

situación experimental ha

cambiado.

Ing William León V

El valor del parámetro de la población especificado en la hipótesis se determina de tres maneras:

5

b. A partir de una teoría o

modelo con respecto al objeto

que se estudia.

•El objetivo de la prueba de

hipótesis es verificar la teoría o

modelo.



c. Como resultado de consideraciones experimentales, como las especificaciones de diseño o ingeniería, o de obligaciones contractuales. •El objetivo de la prueba de hipótesis es la prueba de conformidad.



IDENTIFICACIÓN DE HIPÓTESIS

• En una prueba de hipótesis se empieza

asumiendo un valor de un parámetro que, a juicio

del investigador, es el más adecuado de acuerdo con

la información disponible, a este supuesto se le llama

hipótesis nula y se representa con Ho.


• La otra hipótesis que se define

a continuación se llama

hipótesis alternativa, que es

la opuesta de lo que se afirma

en la hipótesis nula.

La hipótesis alternativa se

representa como Ha o H1

IDENTIFICACIÓN DE HIPÓTESIS •Hipótesis nula Ho

– La que se contrasta – Los datos pueden

rechazarla – No debería ser rechazada

sin una buena razón.

Ing William León V

•Hipótesis. Alternativa H1 – Es la negación de la H0 – Los datos pueden mostrar

evidencia a favor – No debería ser aceptada sin

una gran evidencia a favor.

:H

:H

1

00.5p

0.5p

, ,

9

EJEMPLO ¿Debo tomar Aspirina o Ibuprofeno para el dolor de

cabeza?

Laboratorios Bayer me dice que tome Aspirina

• Existe teoría (antigua) de que lo mejor es Aspirina

• Laboratorios Cinfa me dice que tome Ibuprofeno

• Existe teoría (nueva) de que lo mejor es Ibuprofeno

Tenemos dos teorías que

compiten.

En estadística se va a llamar

hipótesis.

DEFINICIONES

• La hipótesis nula, denotada por Ho, es el “status

quo”, lo convencional, lo que sabemos de la

población, lo aceptado hasta el momento.

• La hipótesis alternativa, denotada por H1, es una

alternativa a la hipótesis nula – implica cambio, es lo

que el investigador espera que sea cierto.

Ho: El nuevo medicamento es tan

efectivo como el antiguo.

H1: El nuevo medicamento es

más efectivo que el antiguo.

Problema: El tiempo de vida promedio

de una determinada pieza usada en el

ensamblaje de una marca de

computadoras es de 20,000 horas.

Solución:

– Traducir a lenguaje estadístico:

– Establecer su opuesto:

– Seleccionar la Hipótesis

alternativa

– Seleccionar la hipótesis nula

¿Cuál es H0?

000,20:0 H

Ing William León V

000,20𝜇 ≠ 20,000

𝐻1: 𝜇 ≠ 20,000

Problema: ¿El colesterol medio para la

dieta de los trabajadores de las empresas

textiles es 6 mmol/l?

Solución:



– Seleccionar la Hipótesis alternativa:


¿Cuál es H0?

6

Ing William León V

6:0 H

6

𝐻1: 𝜇 ≠ 6

Problema: ¿La altura media o promedio de

los obreros de la empresa pesquera es de

1.60 m?

Solución:



– Seleccionar la Hipótesis alternativa:


¿Cuál es H0?

60.1

Ing William León V

000,20:0 H

60.1

𝐻1: 𝜇 ≠ 1.60

Ing William León V

¿Cuál es H0?

Problema: El porcentaje de personas atacadas por cierta enfermedad laboral en una fabrica grande, no es mayor del 10%.

Solución:

Traducir a lenguaje estadístico:

Establecer su opuesto:

Seleccionar la Hipótesis alternativa:

Seleccionar la hipótesis nula

10.0p

10.0p

10.0:0 pH

𝐻1: 𝜇 > 0.10

Problema: ¿El estrés laboral está

relacionada con el género?

Solución:

– Traducir a lenguaje

estadístico:


– Seleccionar la Hipótesis

alternativa


Ing William León V

0.5p

¿Cuál es H0?

0 : 0.5H p

0.5p

𝐻1: 𝑝 ≠ 0.5

Ing William León V

• La región crítica es el conjunto de valores

de la prueba estadística que puede causar

el rechazo de la hipótesis nula.

REGIÓN CRÍTICA Y NIVEL DE

SIGNIFICACIÓN

Ing William León V

• El nivel de significancia (denotado por α) es la

probabilidad de que la prueba estadística caerá en la

región crítica cuando la hipótesis nula es actualmente

cierta.

REGIÓN CRÍTICA Y NIVEL DE SIGNIFICACIÓN

Región de no rechazo

• Si la prueba estadística cae en la

región crítica, se rechaza la

hipótesis nula, entonces α es la

probabilidad de cometer el error

de rechazar la hipótesis nula

cuando ésta es cierta.

• Las selecciones comunes de α

son 0.05, 0.01, y 0.10.

Ing William León V

Región crítica

• Valores ‘improbables’ si...

• Es conocida antes de realizar el experimento: resultados experimentales que refutarían H0

REGIÓN CRÍTICA Y NIVEL DE SIGNIFICACIÓN

Nivel de significación: α

• Número pequeño: 1% , 5%

• Fijado de antemano por el investigador

• Es la probabilidad de rechazar H0 cuando es cierta

No rechazo H0

Reg. Crit. Reg. Crit.

a=0.05

H0: =40

PRUEBA: UNILATERAL Y BILATERAL

• Las pruebas pueden ser unilaterales o

bilaterales (también llamados de una o dos

colas) según establezcamos las hipótesis,

Ing William León V

• Si se define en términos de igual y diferente se esta ante una hipótesis bilateral,

• Si se coloca una dirección (en términos de mayor o menor) se esta ante uno unilateral

20

PRUEBA: UNILATERAL Y BILATERAL

Ing William León V

La posición de la región crítica depende de la hipótesis alternativa

Unilateral Unilateral

Bilateral

H1: < 40 H1: >40

H1: 40

21

SIGNIFICACIÓN: p

• El grado de significación 'p' o 'sig' es la

probabilidad de error al rechazar la hipótesis

nula.


• Cuanto más pequeño sea

su valor más probable

será que la hipótesis nula

sea falsa.

•El grado de significación está relacionado con el

nivel de significación es decir con el riesgo de error

que se está dispuesto a asumir en caso de rechazar la

hipótesis nula.


.

SIGNIFICACIÓN: p

•El grado de significación se calcula 'a posteri', es decir

cuando se conoce el resultado de haber aplicado una

prueba de significación.

•El grado de significación indica la probabilidad de error

calculada al rechazar la hipótesis nula.


En la práctica la forma de ejecutar es la

siguiente:

Si p >= α no se rechaza la

hipótesis nula.

Si p < α se rechaza la hipótesis

nula

SIGNIFICACIÓN: p

Ing William León V

SIGNIFICACIÓN: p

43X

No se rechaza H0: =40

p es la probabilidad que tendría una región crítica que comenzase exactamente en el valor del estadístico obtenido de la muestra. Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H0. Es la probabilidad de que por puro azar se logre una muestra “más extraña” que la obtenida. p es conocido después de realizar el experimento aleatorio. La verificación es no significativa cuando p>a

P

P a

a

25

H0: =40 H1: >40

Ing William León V

SIGNIFICACIÓN: p

P a

a

50XSe rechaza H0: =40 Se acepta H1: >40

La verificación es

estadísticamente

significativa

cuando p < α

Es decir, si el

resultado

experimental

discrepa más de “lo

tolerado” a priori.

P

26

H0: =40 H1: >40

RESUMEN: α, p y criterio de rechazo

•Sobre α • Es un número pequeño,

preelegido al diseñar el experimento

– Conocido a sabemos todo sobre la región crítica

Ing William León V

•Sobre p – Es conocido tras

realizar el experimento

– Conocido p sabemos todo sobre el resultado del experimento

Sobre el criterio de rechazo

La verificación es significativa si p menor que a

(cuando se rechaza Ho)

Ing William León V

•H0: Hipótesis nula – No es culpable

•H1: Hipótesis alternativa – Es culpable – No es inocente

RIESGOS AL TOMAR DECISIONES Ejemplo 1:

Se juzga a un individuo por la presunta comisión de

un delito Los datos pueden rechazarla No se rechazará si las pruebas no indican lo contrario Rechazarla por error tiene graves consecuencias

No debería ser aceptada sin una gran evidencia a favor. Rechazarla por error tiene consecuencias consideradas menos graves que la anterior

28

RIESGOS AL CONTRASTAR HIPÓTESIS

Ing William León V

Ejemplo 2: Se cree que la implementación de un nuevo proceso ofrece buenos resultados

Ejemplo 3: Parece que hay una incidencia de productos defectuosos más alta de lo normal

29

RIESGOS AL CONTRASTAR HIPÓTESIS

H0: Hipótesis nula – (Ej.1) No es culpable – (Ej.2) El nuevo proceso no tiene efecto en los

resultados – (Ej.3) No hay nada que destacar en los productos

H1: Hipótesis alternativa

– (Ej.1) Es culpable – (Ej.2) El nuevo proceso es útil – (Ej. 3) Hay una situación anormal en los productos

Ing William León V

No especulativa

Especulativa

30

TIPOS DE ERROR AL TOMAR UNA DECISIÓN

• En este proceso podemos incurrir en dos tipos de errores según sea la situación real y la decisión que tomemos.

Ing William León V

• La verificación de la hipótesis no

establece la verdad de la hipótesis,

sino un criterio que nos permite

decidir SI UNA HIPÓTESIS NO SE

RECHAZA O SE RECHAZA, o

• El determinar si las muestras

observadas difieren

significativamente de los resultados

esperados.

31


• Si se rechaza una hipótesis nula, cuando debe no ser rechazada, se comete un error de tipo I, mientras que

• Si no se rechaza una hipótesis nula, debiendo ser rechazada se comete un error de tipo II.


http://thumbs.dreamstime.com/z/error-sign-21759953.jpg


• Minimizar los errores no es un asunto sencillo, un caso suele ser más grave que otro y los intentos de disminuir uno suelen producir el aumento del otro.


La única forma de

disminuir ambos a la

vez es aumentar el

tamaño de la

muestra.


REALIDAD

Inocente Culpable

VEREDICTO

Inocente OK Error

Menos grave

Culpable Error

Muy

grave

OK


TIPOS DE ERROR AL CONTRASTAR HIPÓTESIS

REALIDAD

CONCLUSIÓN H0 cierta H0 Falsa

No Rechazo H0 Correcto El tratamiento no

tiene efecto y así se

decide.

Error de tipo II

El tratamiento si tiene

efecto pero no lo

percibimos.

Probabilidad β

Rechazo H0

Acepto H1

Error de tipo I

El tratamiento no

tiene efecto pero se

decide que sí.

Probabilidad α

Correcto El tratamiento tiene

efecto y el experimento

lo confirma.


PRUEBA DE HIPOTESIS PARA LA MEDIA. MUESTRAS GRANDES

PRUEBA DE HIPOTESIS PARA MUESTRAS GRANDES

• Cuando se plantean hipótesis para la media de una población y para la diferencia de medias de dos poblaciones y las desviaciones estándar poblacionales son conocidas o el tamaño de la muestra es grande

• El estadístico de prueba está dado por:

z

Ing William León V

CINCO PASOS PARA PROBAR UNA HIPOTESIS PARA LA MEDIA

• En la prueba de hipótesis, se debe

establecer el valor supuesto o

hipotetizado del parámetro de la

población antes de comenzar a tomar la

muestra.

• La suposición que se desea probar se

conoce como hipótesis nula: Ho.


1. Definir la Hipótesis estadística H0 y Ha

PASOS A SEGUIR EN UNA PRUEBA DE HIPOTESIS

• En base a los datos muestrales la hipótesis nula se rechaza o no rechaza.

• Nunca se puede aceptar la hipótesis nula como verdadera, para demostrar sin lugar a dudas que la hipótesis es verdadera, se tendría que conocer el parámetro de la población.

• El no rechazo solamente significa que la evidencia muestral no es lo suficientemente fuerte como para llevar a su rechazo.




• Es importante recordar que, sin importar como se determina el problema, la hipótesis nula siempre lleva el signo de igual ( = ).

• Por ejemplo si se desea probar la hipótesis de que la media de la población es igual a 16.

• Se simbolizará y leerá de la siguiente manera: “La hipótesis nula es que la media de la población es igual a 16”.

Ho: μ= 16

Ing William León V


40


•La hipótesis alternativa describe

la conclusión a la que se llegará si

se rechaza a la hipótesis nula.

•También se conoce como hipótesis

de investigación.

•La hipótesis alternativa se acepta

si los datos de la muestra

proporcionan suficiente evidencia

estadística de que la hipótesis nula

es falsa. Ing William León V 41



• Se considera tres hipótesis alternativas

posibles:

Ha: ≠ 16

Ha: > 16

Ha: < 16

• El signo de igual ( = ) nunca aparecerá en la

hipótesis alternativa. Porque la hipótesis nula

es la declaración que se prueba, y es

necesario incluir un valor especifico en los

cálculos.

• La hipótesis alternativa se considera, sólo

si se demuestra que no es verdadera la

hipótesis nula. Ing William León V 42



• El estadístico de prueba es un valor

que se calcula en base a la

información de la muestra, y que se

utiliza para determinar si se rechaza o

no la hipótesis nula.

• Existen muchos estadísticos de prueba

que pertenecen a una distribución

muestral con su propia forma, media y

desviación estándar.

Z, t, χ2, F

Ing William León V

2. Establecer el estadístico de prueba que sea apropiado.

43


Por ejemplo en la prueba de hipótesis

para la media, el estadístico de prueba

es la Z y se calcula por:

Ing William León V

n

Xz

44

2. Establecer el estadístico de prueba que sea apropiado.


• El nivel de significancia es la

probabilidad de rechazar la

hipótesis nula cuando es

verdadera es a lo que se llama error

Tipo I.

• El nivel de significancia se define

con la letra griega alfa (α ).Se le

llama también nivel de riesgo.

Ing William León V

3. Definir el nivel de significancia y la zona de rechazo

45


• No hay un nivel de significancia que se

aplique a todas las pruebas.

• Se toma la decisión de utilizar los niveles

0.05 ( que con frecuencia se conoce

como un nivel del 5%), 0.01, 0.10, o

cualquiera entre 0 y 1 a elección de la

persona que realiza la prueba.




La zona de rechazo tiene:

• Una magnitud dada por α y

• Una dirección dada por la hipótesis alternativa.




Ing William León V

Ejemplo

48



Ing William León V

Existe un 95% de probabilidad de que los resultados muestrales puedan caer entre ± 1.96 si la hipótesis nula es verdadera

Si μ = 16, existe sólo un 2.5% de oportunidad de que una media muestral produzca un valor de Z < -1.96

Si μ = 16, existe sólo un 2.5% de oportunidad de que una media muestral produzca un valor de Z > 1.96

49



Ing William León V

4. Calcular el estadístico de prueba a partir de los datos muestrales considerando H0 como verdadera

50


Ing William León V

5. Decidir si H0 no se rechaza o se rechaza.

Y Concluir en términos del contexto del problema.

51

• Una empresa de transportes compró 48

llantas y halló que la duración media para

sus vehículos fue de 59,500 Km.

• ¿Es la experiencia, distinta de la expresada

por el fabricante al nivel de significación de

0.05?

Datos: = 60,000 Km σ = 5,000 Km n = 48 llantas a = 0.05 = 59,500 Km

Ejemplo 1.-

Ing William León V x

El fabricante de una llanta especial para camiones afirma

que la duración media de la parte rodante de agarre es de

60,000 Km. La desviación estándar del kilometraje es de

5,000 Km.

Solución:

Paso 1

Las hipótesis se expresan de la siguiente manera:

H0 : = 60,000 Km

La duración de las llantas es de 60,000 Km

H1 : 60,000 Km

La duración de las llantas es distinta a 60,000 Km

Ing William León V

Solución:

Paso 2

El estadístico de prueba mas apropiado.

Teniendo en cuenta que se tiene una muestra de 48

llantas y se conoce la desviación estándar de la

población

n = 48 llantas

σ = 5,000 Km

Se utilizará la distribución Z

Ing William León V

Solución: Paso 3

El nivel de significancia es de 0.05

Y por la hipótesis alternativa:

H1 : 60,000 Km Se trata de una prueba bilateral

Ing William León V

En el siguiente paso vamos a obtener el valor de “Z” y

para ello vamos a apoyarnos en la gráfica siguiente:

*Se recurre a las tablas

de la distribución normal y

en ellas localizamos

0.475, que se ubica en un

valor de Z = 1.96

* Este procedimiento va depender del tipo de tabla que se tenga

Solución:

Ing William León V

Paso 4

Se Calculará el estadístico de prueba a partir de los datos muestrales considerando H0 como verdadera

693.0

71.721

000,60500,59

Z

Z𝑍 =

𝑥 − 𝜇

𝜎𝑥

𝜎𝑥 =𝜎

𝑛

𝜎𝑥 =5000

48 =

5000

6.928=721.71

Donde:

Solución:

Ing William León V

Paso 5

• Se va ha decidir si H0 no se rechaza o se rechaza.

Como -0.693 es menor que -1.96 no se rechaza la hipótesis nula

Es decir el z de los datos se encuentra en la zona de no rechazo

La duración de las llantas NO es distinta a 60,000 Km

Entonces se concluye que la duración media de las llantas es muy

cercana a la que afirma el fabricante de 60,000 millas, con un

nivel de significancia de 0.05.

Solución:

• Primero, se va a calcular el error estándar de la media y para ello emplearemos la expresión del error estándar:

Ing William León V

nX

Sustituyendo valores en ella, se tiene:

Kmxxx 69.7219282.6

000,5

48

000,5

El Error Estándar de la media mide con cuánta precisión la media de la muestra estima la media de la población y se utiliza para crear intervalos de confianza para la media de la población. Los valores del Error Estándar de la Media más bajos indican con mayor precisión las estimaciones de la media de la población

Desarrollando bajo el enfoque del intervalo de confianza:

Solución: Se va a determinar los límites superior e inferior de

confianza para el intervalo de la media poblacional ya que se trata de una prueba de dos extremos.

Se aplica la expresión siguiente:

Ing William León V

Sustituyendo valores en ella, se tiene:

Lc = 60,000 1.96 (721.69)

Ls = 60,000 + 1,414.51 Ls = 61,414.51 Km.

Li = 60,000 – 1,414.51 Li = 58,585.49 Km

Entonces la media de la población fluctúa entre 58,585.49 y 61,414.51 millas en un nivel de confianza del 95%.

xH ZLc 0

Solución: Al regresar a la gráfica anterior se observa los límites

de confianza y la media muestral.

Con ello se analiza si no se rechaza la hipótesis nula además de verificar si es verdadera o falsa.

Ing William León V

Solución:

La media muestral se ubica dentro de la zona de no rechazo, por lo que podemos decir que la hipótesis nula es verdadera,

Ing William León V

Entonces la media muestral se ubica en -0.693 = -0.693(721.69)

500.13 60,000-500 = 59,500

y se confirma que cae en la zona de no rechazo

Concluimos que la duración media de las llantas es muy cercana a la que afirma el fabricante de 60,000 millas, con un nivel de significancia de 0.05.

__

X

¿Es dicho tiempo menor de 3 minutos? Datos: = 3 minutos. σ= 1minuto. n = 50 clientes. a = 0.05 = 2.75 minutos.

Ejemplo 2 Una cadena de restaurantes afirma que el tiempo medio de espera

de clientes por atender está distribuido normalmente con una

media de 3 minutos y una desviación estándar de 1 minuto.

Su departamento de aseguramiento de la calidad halló en una

muestra de 50 clientes en un cierto establecimiento que el tiempo

medio de espera era de 2.75 minutos. Al nivel de significación de

0.05,

Ing William León V

x

Paso 1 Las hipótesis se expresan de la siguiente manera:

Ing William León V

Ho : = 3 El tiempo promedio de espera es de 3 minutos. H1 : 3 El tiempo promedio de espera es menor de 3 minutos.

Ejemplo 2.-

Solución:

Paso 2

El estadístico de prueba mas apropiado.

Teniendo en cuenta que se tiene una muestra de 50 clientes

y se conoce la desviación de la población

n = 50 clientes

σ = 1 minuto

Entonces

Se utilizará la distribución Z

Ing William León V

Solución: Paso 3

El nivel de significancia es de 0.05

Y por la hipótesis alternativa:

H1 : 3 Se trata de una prueba unilateral

Ing William León V

En el siguiente paso vamos a obtener el valor de “Z” y para ello vamos a apoyarnos en la gráfica siguiente:

*0.5 – 0.05 = 0.45 .

Se busca en las tablas de

la distribución normal

0.45, y se encuentra que:

Z= 1.64

* Este procedimiento va depender del tipo de tabla que se tenga

Solución:

Ing William León V

Paso 4

Se Calculará el estadístico de prueba a partir de los

datos muestrales considerando H0 como verdadera

77.11414.0

25.0

1414.0

375.2

ZZZ

𝑍 =𝑥 − 𝜇

𝜎𝑥

Solución:

Ing William León V

Paso 5

• Se va ha decidir si H0 no se rechaza o se rechaza.

Como -1.77 es mayor que -1.64 se rechaza la hipótesis

nula Es decir el z de los datos se encuentra en la zona de

rechazo

Entonces se concluye que el tiempo medio de espera de clientes por atender en este establecimiento es menor de 3 minutos.

Calcula el error estándar de la media:

Con un a = 0.05 y es una prueba de hipótesis para un

extremo, en este caso, el extremo izquierdo, entonces, el

nivel de significancia está contenido en este extremo, por

lo que el nivel de confianza es 0.5 – 0.05 = 0.45 .

Se busca en las tablas de la distribución normal 0.45, y

se encuentra que: Z= 1.64

El límite izquierdo del intervalo de confianza será:

Li = 3 – 1.64 (0.1414)

Li = 3 – 0.2319

Li = 2.768

Ing William León V

1414.007.7

1

50

1 xxx

Ejemplo 2.-

nX

Desarrollando bajo el enfoque del intervalo de confianza

Gráficamente se representa así:

Ejemplo 2.-

Ing William León V

Ejemplo 2.-

Ing William León V

• La media muestral 2.75, se localiza en la zona de rechazo, por lo que se puede establecer que se rechaza la hipótesis nula y se acepta la alternativa.

Comprobemos con :

x

xZ

77.11414.0

25.0

1414.0

375.2

ZZZ

Como se puede observar 1.77 está localizado más hacia

la izquierda del límite de confianza 1.64.

Se puede concluir que el tiempo medio de espera de

clientes por atender en este establecimiento es

menor de 3 minutos.

PRUEBA DE HIPÓTESIS DE 2 MEDIAS POBLACIONALES


• Se tienen dos poblaciones y se toman

muestras aleatorias independientes de

tamaños n1 y n2, se puede comparar el

comportamiento de dichas poblaciones a

través de los promedios.

• Las muestras se obtienen de poblaciones

con distribución normal

• El estadístico de trabajo depende de las

características de las poblaciones y del

tamaño de las muestras.



• Se puede plantear uno de los siguientes tres tipos de hipótesis:

• - Prueba de hipótesis a dos colas

H0 : µ1=µ2 ó H0 : µ1-µ2 = 0

H1 : µ1≠µ2 ó H1 : µ1-µ2 ≠ 0

• - Prueba de hipótesis a una cola superior

H0 : µ1=µ2 ó H0 : µ1-µ2 = 0

H1 : µ1>µ2 ó H1 : µ1-µ2 > 0

• - Prueba de hipótesis a una cola inferior

H0 : µ1=µ2 ó H0 : µ1-µ2 = 0

H1 : µ1<µ2 ó H1 : µ1-µ2 < 0




PRUEBA DE HIPÓTESIS DE 2 MEDIAS POBLACIONALES µ1 y µ2

Si las muestras son mayores o iguales de 30

n1 y n2>=30

Si tienen varianzas poblacionales desconocidas

σ2 diferentes

Varianzas diferentes

σ2 conocidos

Varianzas iguales

σ2 desconocidos

Si tienen varianzas poblacionales conocidas

σ2 iguales

Si las muestras son menores a 30

n1 y n2<30

P. H. para la diferencia de medias, con varianzas poblacionales conocidas

•Se asume que hay dos poblaciones de interés μ1 y μ2,

•Además se asume que μ1 tiene media desconocida y

varianza conocida y que μ2 tiene media desconocida y

varianza conocida .


Estaremos interesados en la

prueba de la hipótesis de que

las medias µ1y µ2 sean

iguales.

• Se considera primero las hipótesis

alternativas de dos lados:

• Donde

• H0 = Hipótesis nula

• H1 = Hipótesis alternativa.

• μ1= media de la población 1

• μ2= media de la población 2


H0 : µ1=µ2 ó H0 : µ1-µ2 = 0 H1 : µ1≠µ2 ó H1 : µ1-µ2 ≠ 0

• El procedimiento para probar es calcular el estadístico de prueba Z0 mediante la siguiente fórmula:


Donde: 𝜇1= media de la muestra 1 𝜇1= media de la muestra 2 𝜎1

2= varianza de la población 1 𝜎2

2= varianza de la población 2 𝑛1 = tamaño de la muestra 1 𝑛2 = tamaño de la muestra 2

𝑍 =(𝑋 1 − 𝑋 2) − (𝜇1 − 𝜇2)

𝜎21

𝑛1+

𝜎22

𝑛2

Las hipótesis alternativas de dos lados se analizan de la siguiente manera.

Para probar

𝐻0: 𝜇1=𝜇2

𝐻1: 𝜇1 ≠ 𝜇2

Se calcula el estadístico de prueba Z0 y se rechaza 𝐻0: 𝜇1=𝜇2 si 𝑧0 > 𝑧𝛼

2

o

𝑧0 < 𝑧𝛼2

Donde

Z0 = Valor calculado del estadístico de prueba

𝑍𝛼2 = Valor obtenido de las tablas.


Las hipótesis alternativas de un lado se analizan de

manera similar. Para probar

𝐻0: 𝜇1=𝜇2

𝐻1: 𝜇1 > 𝜇2

Se calcula el estadístico de prueba Z0 , y se

rechaza 𝐻0: 𝜇1=𝜇2 si 𝑍0>𝑍𝛼 .

Para probar las otras hipótesis alternativas de un

lado

𝐻0: 𝜇1=𝜇2

𝐻1: 𝜇1 < 𝜇2

Se utiliza el estadístico de prueba Z0 y se rechaza

𝐻0: 𝜇1=𝜇2 si 𝑍0<−𝑍𝛼



•Se asume que hay dos poblaciones de interés μ1 y μ2,

•Además se asume que μ1 tiene media desconocida y

varianza desconocida y que μ2 tiene media

desconocida y varianza desconocida .


Se estará interesado en la

prueba de la hipótesis de que

las medias µ1y µ2 sean

iguales.

• El procedimiento para probar es calcular la estadística de prueba Z0 mediante la siguiente fórmula:

P. H. para la diferencia de medias, con varianzas poblacionales desconocidas y

diferentes

Donde: 𝑥 1= media de la muestra 1 𝑥 2= media de la muestra 2

𝑆12= varianza de la muestra 1


𝑛1 = tamaño de la muestra 1 𝑛2 = tamaño de la muestra 2

𝑍 =(𝑋 1 − 𝑋 2) − (𝜇1 − 𝜇2)

𝑆21

𝑛1+

𝑆22

𝑛2

• Si las muestras provienen de poblaciones normales con varianzas poblacionales iguales pero desconocidas y tamaños de muestra grandes , es decir, n1 > 30 y n2 > 30. Como se desconocen las varianzas poblacionales se debe obtener una expresión que represente dichas varianzas,

P. H. para la diferencia de medias, con

varianzas poblacionales desconocidas pero

iguales

Donde:

𝑥 1= media de la muestra 1

𝑥 2= media de la muestra 2



𝑛1 = tamaño de la muestra 1

𝑛2 = tamaño de la muestra 2 𝑍 =(𝑋 1 − 𝑋 2) − (𝜇1 − 𝜇2)

𝜎𝑑𝑖𝑓

𝜎𝑑𝑖𝑓 =𝑛1−1 𝑆2

1+ 𝑛2−1 𝑆22

𝑛1+𝑛2−2 1

𝑛1+

1

𝑛2

EJEMPLO 1

• El salario promedio mensual para una muestra de 30

empleados de una empresa manufacturera es de

$280.000, con desviación estándar de $14.000.

• En otra empresa del mismo tipo, una muestra aleatoria

de 40 empleados, tiene un salario promedio de

$270.000, con una desviación estándar de $10.000.


• No se suponen iguales las

desviaciones estándar de las

poblaciones. Se requiere probar

la hipótesis de que no existe

diferencia entre los salarios

promedios mensuales de las

dos empresas, utilizando un

nivel de significancia del 5%.

EJEMPLO 1


1.- Establecer las hipótesis

• 𝐻0: 𝜇1 − 𝜇2 = 0, o que 𝐻0: 𝜇1 = 𝜇2

• No existe diferencia entre los salarios promedios mensuales de las dos empresas

• 𝐻0: 𝜇1 − 𝜇2 ≠ 0, o que 𝐻0: 𝜇1 ≠ 𝜇2

• Existe diferencia entre los salarios

promedios mensuales de las dos empresas

EJEMPLO 1

2.- Elegir el modelo probabilístico:

– Como n> 30

– Se utiliza la curva Z:


EJEMPLO 1 3.- Establecer el criterio de contraste


REGION DE NO RECHAZO

Z1=-1.96 0 Z2=1.96 α=0.5

Para α/2 = 0.025, entonces 𝑍1 = −1.96 y 𝑍2 = 1.96. El Intervalo de los Valores críticos de Z es:

−1.96 < 𝑍 < 1.96

α/2=0.025 α/2=0.025

EJEMPLO 1 4.- Calcular el valor del estadístico de prueba

• La desviación estándar de cada una de las muestras es:


𝜎1𝑥 =𝜎1𝑛1

=14000

30= 2556.04

𝜎2𝑥 =𝜎2

𝑛2=

10000

40= 1581.14

𝜎 = 𝜎1𝑥 2 + 𝜎2𝑥

2 = 2556.04 2 + 1581.14 2 = 3005.53

• Se calcula el valor del estadístico de prueba, en este caso Z*

𝑍 =𝑋 1 − 𝑋 2

𝜎=

280000 − 270000

3005.55= 3.33

EJEMPLO 1

5.- Tomar una decisión e interpretar

• Como Z = 3.33 no se encuentra en

• El Intervalo critico de Z. −1.96 < 𝑍 < 1.96

• No se encuentra en la región de NO RECHAZO

según la grafica de la Campana de Gauss.

• Por ello se rechaza la Hipótesis nula y se

acepta la hipótesis alternativa:

• El salario promedio mensual de las dos

empresas es diferente.


EJEMPLO 2 Un analista de salarios consideraba que el salario

promedio de la primera empresa era mayor que en

la segunda empresa.

Con el objeto de someter su posición a una prueba

critica, le da el beneficio de la duda a la posibilidad

contraria y plantea la hipótesis nula de que el

salario promedio de la primera empresa es igual o

menor que el de la segunda.


Con los datos del ejemplo 1

Pruebe la hipótesis, con el nivel

de significancia del 1%.

Se supone que las

desviaciones estándar de las

dos poblaciones son iguales.

EJEMPLO 2


1.- Establecer las hipótesis • 𝐻0: 𝜇1 = 𝜇2 o 𝜇1 − 𝜇2 = 0 • El salario promedio de la primera

empresa es igual que en la segunda empresa.

• 𝐻1: 𝜇1 > 𝜇2 o 𝜇1 − 𝜇2 > 0 • El salario promedio de la primera

empresa es mayor que en la segunda empresa.

EJEMPLO 2


• Como n> 30

• Se utiliza la curva Z:


EJEMPLO 2

3.- Establecer el criterio de contraste


REGION DE NO RECHAZO

0 Z2=2.33 α=0.5

Como es para una cola, entonces el nivel de

significancia que se tiene es 𝛼 = 0.01 , el z

para esta área según la tabla es de Z= 2.33,

porque el área es A=0.99.

α=0.01

EJEMPLO 2

4.- Calcular el valor del estadístico de prueba

• Hallamos el z para comparar.


𝑍 =𝑋 1 − 𝑋 2

𝜎=

280000 − 270000

3005.55= 3.33

EJEMPLO 2

5.- Tomar una decisión e interpretar

• Como z = 3.33 > z=2.33, entonces se rechaza la hipótesis nula y se acepta la hipótesis alternativa:

• El salario promedio de la primera empresa es mayor que el salario promedio de la segunda empresa.

• Además podemos observar que el valor de Z = 3.33 queda en la región de rechazo


EJEMPLO 3 • Una empresa está considerando dos lugares alternativos para

construir un centro comercial. Como los ingresos de los hogares de una ciudad son un criterio importante en ésta selección, se quiere probar que el ingreso promedio de la primera ciudad excede al promedio de la segunda ciudad en cuando menos $1,500 mensuales. Con la información de un censo realizado el año anterior se sabe que la desviación estándar del ingreso mensual de la primera ciudad es de $1,800 y la de la segunda es de $2,400


De una muestra aleatoria de 30 hogares de la primera ciudad, se encuentra que el ingreso mensual promedio es de $35,500 y de una muestra de 40 hogares de la segunda ciudad el ingreso promedio mensual es de $34,600. Probar la hipótesis con un nivel de confianza del 95 por ciento. .

EJEMPLO 3


1.- Establecer las hipótesis • Se desea probar si la diferencia entre los ingresos

de la ciudad 1 y la 2 es de $1,500 o más, por lo tanto:

• H0 : 𝜇1 − 𝜇2 = 1,500 La diferencia en el ingreso promedio de la primera ciudad con respecto al promedio de la segunda ciudad es de $1.500 mensuales.

• H1 : 𝜇1 − 𝜇2 < 1,500 La diferencia en el ingreso promedio de la primera ciudad con respecto al promedio de la segunda ciudad es menor de $1.500 mensuales.

EJEMPLO 3


• El tamaño de las muestras es grande y las varianzas poblacionales son conocidas, por consiguiente la estadística de trabajo a utilizar es

la distribución Z:




Para un nivel de confianza del 95 por ciento, el alfa

será 0.05

Y la hipótesis alternativa es: H1 : 𝜇1 − 𝜇2 < 1,500 por lo tanto se trata de una prueba unilateral negativa

De la tabla de la distribución

normal se tiene un valor de Z de

-1.64..

EJEMPLO 3 4.- Calcular el valor del estadístico de prueba

• Se halla el z de la prueba, para comparar.


n1=30

𝑥 = 35,500

σ1=1,800

n2=40

𝑥 = 34,600

σ2=2,400 1-α=0.95

𝑍𝑥 1−𝑥 2 =𝑥 1 − 𝑥 2 − (𝜇1 − 𝜇2)

𝜎21

𝑛1+

𝜎22

𝑛2

𝑍𝑥 1−𝑥 2 =35,500−34,600 −1.500

1,8002

30+

2,4002

𝑛2

=-1.195

EJEMPLO 3 5.- Tomar una decisión e interpretar

• De la figura se observa, que el estadístico de trabajo se ubica en la zona de no rechazo de la hipótesis nula;

• Es decir, la diferencia en el ingreso promedio de la primera ciudad con respecto al promedio de la segunda ciudad NO es menor de $1.500 mensuales, con una confiabilidad del 95 por ciento,

• Por lo tanto la empresa puede elegir la primera ciudad para construir el nuevo centro comercial


-1.195

EJEMPLO 4 Se realizó un estudio con un nivel de significancia de 0.05 para

investigar si la prensa popular está más orientada hacia temas

sexuales que la prensa dirigida a la clase media. Se considera en ambos casos una variabilidad igual.

Se recogieron dos muestras representativas de 40 artículos

publicados en ambos tipos de revistas.


Utilizando un índice que mide el contenido sexual de los artículos, la muestra 1 (popular) tuvo un puntaje medio de 3.5 con una desviación estándar de 2, mientras que la muestra 2 (clase media) tuvo una media de 3 con una desviación de 2.2.

EJEMPLO 4

• 1.- Establecer las hipótesis

• Ho: µ1 = µ 2

• Ho: « La orientación hacia contenidos sexuales en la prensa popular y en la prensa de clase media son iguales»

• Ha: µ 1> µ 2

• Ha: « La orientación hacia contenidos sexuales es mayor en la prensa popular que en la prensa de clase media ».


EJEMPLO 4

• 2.- Elegir el modelo probabilístico:

• Para determinar que tipo de distribución se utilizará:

• Si n1 + n2 - 2 > 30 entonces se busca en la tabla el valor de z correspondiente a α/2.

• Si n1 + n2 – 2 ≤ 30 se busca en la tabla el valor t correspondiente a φ= n1+n2-2 y α/2.

Entonces n > 30 y por lo tanto se utiliza la distribución normal a través de la tabla z con α = .05

En este ejemplo, φ = n1 + n2 - 2 = 40 + 40 - 2 = 78


Ing William León V


Como en este problema, α = .05 y la hipótesis alterna contiene

el signo (>) el problema es de una cola, es decir, la región crítica

se ubica en el extremo derecho de la curva.

• Luego se aplica la fórmula de interpolación:

104

0.05

EJEMPLO 4 4.- Calcular el valor del estadístico de prueba con varianzas iguales

• Se calcula el error estándar de la diferencia de las medias


𝜎𝑑𝑖𝑓 =𝑛1−1 𝑆2

1+ 𝑛2−1 𝑆22

𝑛1+𝑛2−2 1

𝑛1+

1

𝑛2

Se calcula el valor del estadístico de prueba, en este caso Z*

σ

EJEMPLO 4

• 5.- Tomar una decisión e interpretar

• El estadístico de prueba queda localizado fuera de la zona crítica, entonces no se rechaza la hipótesis nula ( Ho),

• Por lo tanto se concluye lo siguiente: • No hay evidencia suficiente, con un nivel de

significancia de .05, de que la prensa popular tenga una mayor orientación al tema sexual que la prensa de clase media


FIN [email protected]

prueba de hipotesis

Documents