3 unidad pruebas de hipotesis

39
3 UNIDAD PRUEBAS DE HIPOTESIS INTRODICCION La experiencia sobre el comportamiento de algún índice de un proceso, o la exigencia del cumplimiento de alguna norma nos lleva a realizar proposiciones sobre el valor de algún parámetro estadístico. Estas proposiciones se deben contrastar con la realidad (mediante el muestreo de datos) para tomar una decisión entre aceptar o rechazar la proposición Estas proposiciones se denominan Hipótesis y el procedimiento para decidir si se aceptan o se rechazan se denomina Prueba de Hipótesis. Una prueba de hipótesis es una herramienta de análisis de datos que puede en general formar parte de un experimento comparativo más completo Ejemplo: Consideremos el ejemplo anterior de la rapidez de combustión. Aquí se tenía: H 0 : m = 50 cm/seg H 1 : m 50 cm/seg Aceptación de H 0 .- Un valor de la media muestral x “muy cercano” a 50 cm/seg es una evidencia que apoya a la hipótesis nula, sin embargo es necesario introducir un criterio para decidir que tanto es muy cercano, para el ejemplo este criterio pudiera ser: 48.5 x 51.5, si esto ocurre se acepta H 0 De lo contrario, es decir, si x < 48.5 o x >51.5, se acepta H 1

Upload: irving-daniel-vargas-abarca

Post on 02-Dec-2015

2.701 views

Category:

Documents


13 download

TRANSCRIPT

Page 1: 3 Unidad Pruebas de Hipotesis

3 UNIDAD PRUEBAS DE HIPOTESISINTRODICCION

La experiencia sobre el comportamiento de algún índice de un proceso, o la exigencia del cumplimiento de alguna norma nos lleva a realizar proposiciones sobre el valor de algún parámetro estadístico.

Estas proposiciones se deben contrastar con la realidad (mediante el muestreo de datos) para tomar una decisión entre aceptar o rechazar la proposición

Estas proposiciones se denominan Hipótesis y el procedimiento para decidir si se aceptan o se rechazan se denomina Prueba de Hipótesis.

Una prueba de hipótesis es una herramienta de análisis de datos que puede en general formar parte de un experimento comparativo más completo

Ejemplo: Consideremos el ejemplo anterior de la rapidez de combustión. Aquí se tenía:H0: m = 50 cm/seg

H1: m 50 cm/seg

Aceptación de H0.- Un valor de la media muestral x “muy cercano” a 50 cm/seg es una evidencia que apoya a la hipótesis nula, sin embargo es necesario introducir un criterio para decidir que tanto es muy cercano, para el ejemplo este criterio pudiera ser: 48.5 x 51.5, si esto ocurre se acepta H0

De lo contrario, es decir, si x < 48.5 o x >51.5, se acepta H1

Page 2: 3 Unidad Pruebas de Hipotesis

3.2. CONFIABILIDAD Y SIGNIFICANCIA

Prueba de Hipótesis:-

Denominada también prueba de significación, tiene como objetivo principal evaluar suposiciones o afirmaciones acerca de los valores estadísticos de la población, denominados parámetros.

La palabra docimar significa probar, cuando se hace indispensable tomar una decisión sobre la validez de la representación de una población, con base en los resultados obtenidos a través de una muestra, se dicen que se toman decisiones estadísticas. Para tomar una decisión es necesario, ante todo plantear posibilidades acerca de la característica o características a estudiar en una población determinada. La suposición puede ser cierta o falsa. Estas suposiciones se llaman hipótesis estadísticas.

Hipótesis Estadística:-

Es un supuesto acerca de un parámetro o de algún valor estadístico de una población. Con esta definición encontramos que no todas las hipótesis son hipótesis estadísticas. Se debe tomar con referencia a un parámetro, ya sea una media aritmética, una proporción (porcentaje) o varianza para que sea hipótesis estadística.

Una hipótesis estadística también puede considerarse, como la afirmación de una característica ideal de una población sobre la cual hay inseguridad en el momento de formularla y que, a la vez, es expresada de tal forma que puede ser realizada.

3.3. ERRORES TIPO 1 Y TIPO 2

El procedimiento anterior puede llevarnos a una de dos conclusiones erróneas:

Error Tipo I.- Se rechaza H0 cuando ésta es verdaderaError Tipo II.- Se acepta H0 cuando ésta es falsa

En el ejemplo se cometerá un error de tipo I cuando µ =50, pero x para la muestra considerada cae en la región crítica.Y se cometerá un error de tipo II cuando µ 50 pero x para la muestra considerada cae en la región de aceptación.

Page 3: 3 Unidad Pruebas de Hipotesis

A la probabilidad de cometer un error de Tipo I se denota por a, y se le llama el nivel o tamaño de significancia de la prueba es decir

a = P(error Tipo I)= P(rechazar H0 | H0 es verdadera)

Ejemplo: Calcular a para el ejemplo de la rapidez de combustión para una muestra de N=10 datos, suponiendo que la desviación estándar de la rapidez de combustión es Ϭ=2.5 cm/seg.

Solución: en este caso a = P(x caiga en la región crítica | µ=50), es decir:

a = P(x < 48.5) + P(x > 51.5)

Recordando que La distribución de x es Normal con media µ=50 y desviación estándar s/N =0.79, por lo tanto, usando Matlab:

a = normcdf(48.5,50,0.79) + (1-normcdf(51.5,50,0.79))

= 0.288+ 0.288 = 0.0576

Esto significa que el 5.76% de las muestras de tamaño 10 conducirán al rechazo de la Hipótesis H0: µ=50 cm/seg, cuando ésta es verdadera.

Es claro que a se puede reducir de dos maneras:

- Aumentando la región de aceptación

- Aumentando el tamaño de la muestra

Ejemplo: recalcular a del ejemplo anterior para a) los nuevos límites de la región de aceptación 48 y 52. b) Para N=16 con los límites originales c) con ambas modificaciones

Solución:

a) a = normcdf(48,50,0.79) + (1-normcdf(52,50,0.79)) = 0.0114

b) a = normcdf(48.5,50,0.625)+(1-normcdf(51.5,50,0.625)) = 0.0164

c) a = normcdf(48,50,0.625)+(1-normcdf(52,50,0.625)) = 0.0014

ERROR TIPO II

Page 4: 3 Unidad Pruebas de Hipotesis

Para evaluar un experimento de prueba de hipótesis también se requiere calcular la probabilidad del error de Tipo II, denotada por β, es decir

β = P(error Tipo II) = P(aceptar H0 | H0 es falsa)

Sin embargo, no es posible calcular β si no se tiene una hipótesis alternativa específica, es decir, un valor particular del parámetro bajo prueba en lugar de un rango de valores

Por ejemplo, supongamos que es importante rechazar H0 si la rapidez promedio de combustión µ es mayor que 52 cm/seg o menor que 48 cm/seg. Dada la simetría sólo se requiere evaluar la probabilidad de aceptar H0: µ=50 cuando el valor verdadero es µ=52.

De acuerdo a la figura: β = P(48.5 x 51.5 | µ=52)

Usando Matlab:

Β = normcdf(51.5,52,0.79) - normcdf(48.5,52,0.79) = 0.2643

La probabilidad de obtener un error de tipo II aumenta muy rápido a medida que el valor verdadero m tiende al valor hipotético, por ejemplo, si suponemos que µ=50.5, y recalculamos β, obtenemos.

Usando Matlab:

β = normcdf(51.5,50.5,0.79) - normcdf(48.5,50.5,0.79) = 0.8923

β también depende del tamaño de la muestra, por ejemplo, si N=16 obtenemos en el ejemplo cuando µ=52: Ϭ=0.625, por lo tanto.

β = normcdf(51.5,52,0.625) - normcdf(48.5,52,0.625) = 0.2119

Es decir, β disminuye cuando N aumenta, excepto si el valor real de µ está muy cerca del hipotético.

Page 5: 3 Unidad Pruebas de Hipotesis

3.4. POTENCIA DE LA PRUEBA

Potencia de prueba: la gran ausente en muchos trabajos científicos. Se pretende destacar la importancia dela consideración del error tipo II y por ende la potencia dela prueba en la investigación científica, particularmente en el campo del diseño experimental. Se presenta su uso con base en un ejemplo hipotético y en un ejemplo real de un experimento en el campo agronómico en el que se estudió el efecto dela concentración de fertilizante sobre la vida útil y la calidad de las flores de Phalaenopsis y se concluyó, sustentando en una potencia de prueba alta, que aplicando fertilizante foliar en baja concentración es posible aumentar la calidad de las flores sin detrimento de su vida útil.

La Potencia de una prueba β representa la probabilidad de que la hipótesis nula no sea rechazada cuando de hecho es falsa y debería rechazársele. La potencia de prueba 1-β representa la sensibilidad de la prueba estadística para detectar cambios que se presentan al medir la probabilidad de rechazar la hipótesis nula cuando de hecho es falsa y debería ser rechazada. La potencia de prueba estadística depende de qué tan diferente en realidad es la media verdadera de la población del valor supuesto. Una prueba de un extremo es más poderosa que una de dos extremos, y se debería utilizar siempre que sea adecuado especificar la dirección de la hipótesis alternativa. Puesto que la probabilidad de cometer un error tipo I y la probabilidad de cometer un error tipo II tienen una relación inversa y esta última es el complemento de la potencia de prueba (1-β), entonces α y la potencia de la prueba varían en proporción directa. Un aumento en el valor del nivel de significación escogido, tendría como resultado un aumento en la potencia y una disminución en α tendría como resultado una disminución en la potencia. Un aumento en el tamaño de la muestra escogida tendría como resultado un aumento en la potencia de la prueba, una disminución en el tamaño de la muestra seleccionada tendría como resultado una disminución en la potencia.

3.5. FORMULACION DE HIPOTESIS ESTADISTICAS

Objetivos:1. Identificar los elementos básicos de una hipótesis.2 .Distinguir entre las diferentes clases de hipótesis.3. Formular hipótesis de investigación, nulas y alternativas.4. Reconocer la función e importancia de las hipótesis.5. Reconocer la importancia de definir los conceptos y variables.6. Reconocer y efectuar definiciones conceptuales, instrumentales y operacionales para variables e hipótesis.

Con el fin de establecer guías precisas hacia el problema de investigación, se proponen hipótesis que indican lo que estamos buscando o tratando de probar. Constituyen un puente entre la teoría y la investigación empírica. Es a través de la comprobación de los cuerpos hipotéticos que la ciencia busca la sistematización, generalización e interpretación.Las hipótesis son consideradas como explicaciones tentativas respecto al problema planteado, presentadas a manera de proposiciones. Pero no toda conjetura o suposición es una hipótesis

Page 6: 3 Unidad Pruebas de Hipotesis

científica. Cumple su función sólo si está relacionada con el conocimiento existente; si reúne lo ya conocido con lo que se busca.

Son afirmaciones a manera de conjeturas respecto a las relaciones entre dos o más variables expresada por medio de oraciones declarativas, sujetas a comprobación empírica.Según Rojas (1980), las ciencias sociales enfrentan problemas teórico-metodológicos para probar hipótesis surgidas en investigación. Muchos de los conceptos acuñados carecen de referentes empíricos y por otro lado el comportamiento humano no sigue patrones uniformes lo que impide generalizar los resultados y conservar la validez a través del tiempo.

Esto conduce a que la búsqueda de relaciones significativas en estas ciencias se limite a situaciones concretas y universos reducidos.Para que una hipótesis sea considerada como correcta, debe referirse a dos o más variables potencialmente medibles y especificar al mismo tiempo de qué manera se relacionan dichas variables (Kerlinger, 1988). Deben referirse a una situación real, los términos tienen que ser comprensibles, precisos y lo más concretos posible; la relación entre variables propuesta debe ser clara y verosímil (lógica) y deben estar relacionadas con técnicas disponibles para probarlas(Hernández, 1993; Rojas, 1981).

3.6. PRUEBA DE HIPOTESIS PARA LA MEDIA

Cuando se van a realizar pruebas de hipótesis relativas a la media poblacional m se debe saber si

la varianza poblacional s es conocida o desconocida, ya que la distribución subyacente al

estadístico de prueba será la normal estándar si la varianza es conocida, y la distribución t en caso

contrario.

Las diferentes hipótesis que se pueden presentar son las siguientes:

1) Ho: m = m0 H1: m > m0

2) Ho: m = m0 H1: m < m0

3) Ho: m = m0 H1: m ¹ m0

Las pruebas de hipótesis para la media se basan en el estadístico dado por la media muestral cuya

distribución tiende a la distribución normal (m, s

/n) para muestras grandes.

EJEMPLO: 1

Una encuesta revela que los 100 autos particulares, que constituyen una muestra aleatoria, se condujeron a un promedio de 12500 Km. Durante un año, con una desviación estándar de 2400 Km. Con base en esta información, decimar la hipótesis donde, en promedio, los autos particulares se condujeron a 12000 Km durante un año, f rente a la alternativa de que el promedio sea superior. Utilizar el nivel de significación.

SOLUCIÓN:

Page 7: 3 Unidad Pruebas de Hipotesis

Z = ẋ - µ S/ √n

H0: μ = 12000Ha: μ > 12000n = 100ẋ =12500S = 2400α = 0.05Zcalc = 2.083

Rechazamos la hipótesis de que μ es igual a 12000, luego aceptamos que los autos se condujeron en un promedio superior durante ese año, al nivel del 5%.

0 Zα

PRU DE HIP. PARA UNA O 2 MUESTRAS DE MEDIAS

EJEMPLO: 2

Un criador de pollos sabe por experiencia que el peso de los pollos de cinco meses es 4,35 libras. Los pesos siguen una distribución normal. Para tratar de aumentar el peso de dichas aves se le agrega un aditivo al alimento. En una muestra de pollos de cinco meses se obtuvieron los siguientes pesos (en libras).  

      4,41       4,37       4,33       4,35       4,30       4,39       4,36       4,38       4,40       4,39

En el nivel 0,01, el aditivo a ha aumentado el peso medio de los pollos?  Estime el valor  de p.

Page 8: 3 Unidad Pruebas de Hipotesis

3.7. PRUEBA DE HIPOTESIS PARA LA DIFERENCIA DE MEDIAS.

Hipótesis

Como en los casos anteriores se puede plantear uno de los siguientes tres tipos de hipótesis:

- Prueba de hipótesis a dos colas

H0 :   =         ó      H0 :   -   = k

H1 :            ó      H1 :   -     k

 - Prueba de hipótesis a una cola superior

Page 9: 3 Unidad Pruebas de Hipotesis

H0 :   =        ó       H0 :   -     k

H1 :   >        ó       H1 :   -   > k

 - Prueba de hipótesis a una cola inferior

H0 :   =        ó       H0 :   -    k

H1 :   <        ó       H1 :   -   < k

La estadística de trabajo depende de las características de las poblaciones y del tamaño de las muestras.

FORMULA:

REGLA DE DECISION

- Si se ha planteado la hipótesis alternativa como:

H1 :   >   ó H1 :   -   > k se tiene una prueba de hipótesis a dos colas, por lo tanto, el nivel de

significancia (   ) se divide en dos partes iguales, quedando estos valores en los extremos de la distribución como se aprecia en la figura 3.1

 y   pertenecen a una distribución Normal estándar. Si el valor de la estadística de trabajo

está entre   y   no se rechaza la hipótesis nula, en caso contrario se rechaza H o lo cual implica aceptar H 1. Es decir,

- Si se ha planteado la hipótesis alternativa como:

H1:   >   ó H1 :   -   > k, se tiene una prueba de hipótesis a una cola superior, quedando el

nivel de significancia (   ) en la parte superior de la distribución, como se aprecia en la figura 3.2

 Pertenece a una distribución Normal estándar. Si el valor de la estadística de trabajo es menor

que   se acepta la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H<sub>1. Es decir,

- Si se ha planteado la hipótesis alternativa como:

H1 :   <   ó H1 :   -   < k, se tiene una prueba de hipótesis a una cola inferior, quedando el nivel

de significancia (   ) en la parte inferior de la distribución, como se aprecia en la figura 3.3

Page 10: 3 Unidad Pruebas de Hipotesis

Z  pertenece a una distribución Normal estándar. Si el valor de la estadística de trabajo es mayor

que Z  no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1. Es decir,

Estimación y Prueba de Hipótesis:-La información siguiente muestra la producción Fito planctónica (clorofila) por estanques (

E1 ,E2) fertilizados con Nutrilake y superfosfato triple de fósforo (SPT). Se desea estudiar la

diferencia de medias poblacionales, contando con muestras n1=15

(E1=Es tan que1

) Y n2=19 (

E2=es tan que 2).

Para = 0.90ال

La información es:

N1=26n1=15 ;

6250, 25000, 25000, 37250, 30000, 125000, 37500, 37250, 43750, 50000, 12500, 43750,37500, 250000, 28400.

N2=26n2=19

25600, 10000, 12500, 50000, 30000, 37500, 10000, 26100, 30000, 350000, 43750, 57500, 12500, 6250, 10000, 12500, 12500, 6250, 32500.

n1=15<30 , σ2=? ; n2=18<30 , σ

2=? usamos “t”

μ1−μ2 : (x̄1− x̄2 ) ± (tα /2 , n1+n2−2 )

σ̂ x̄1− x̄2

σ x̄ 1−x̄ 2 = √sc2 ( 1n1+ 1n2 )

Page 11: 3 Unidad Pruebas de Hipotesis

sc2=

(n1−1 )sc2+(n2−1)s

c2

n1+n2−2

En n1 ,

x̄1=30110.00000

s1=12676 .44328 ,s12=160692214 .2

En n2 , x̄2=24234 .21053

s2=15614 .92389 ,s22=243825848

ss2=

(15−1 )(160692214 .2 )+(19−1)(243825848 )15+19−2

sc2=840180476 .6

σ x̄ 1−x̄ 2=√840180476 .6( 115 + 119

)=10011.596

μ1−μ2=(30110.00000−24234 .21053)±(0 .6944 )(10011.596 )

0.90ال = , α=0 .10

t(α /2 , n1+n2−2)=t0 .102

,15+19−2 )=(0.05 ,32)=0 .6944

: 5875.79 ± 6952.05

5875.798 – 6952.05 , 5875.79 + 6952.05-1076.26 12827.84

P (−1076 .26<μ1−μ2<12872 .84 )=0 .90

La probabilidad de la diferencia en producción de clorofila en los dos estanques fertilizados oscila de 0 – 12872.84, al 0.90.

EJEMPLO: 1

Un constructor está considerando dos lugares alternativos para construir un centro comercial. Como los ingresos de los hogares de la comunidad son una consideración importante en ésta selección, desea probar que el ingreso promedio de la primera comunidad excede al promedio de la segunda comunidad en cuando menos $1.500 diarios. Con la información de un censo realizado el año anterior sabe que la desviación estándar del ingreso diario de la primera comunidad es de $1.800 y la de la segunda es de $2.400

Page 12: 3 Unidad Pruebas de Hipotesis

Para una muestra aleatoria de 30 hogares de la primera comunidad, encuentra que el ingreso diario promedio es de $35.500 y con una muestra de 40 hogares de la segunda comunidad el ingreso promedio diario es de $34.600. Pruebe la hipótesis con un nivel de confianza del 95 por ciento.

Solución

Se desea probar si la diferencia entre los ingresos de la comunidad 1 y la 2 es de $1.500 o más, por lo tanto:

H0 :   -     1.500

H1 :   -   < 1.500

El tamaño de las muestras es grande y las varianzas poblacionales son conocidas, por consiguiente la estadística de trabajo a utilizar es la expresión 3.9

Para un nivel de confianza del 95 por ciento, en la tabla de la distribución normal se tiene un valor de Z de -1,64. Como puede observarse en la figura 3.13, la estadística de trabajo se ubica en la zona de aceptación de la hipótesis nula; por lo tanto, con una confiabilidad del 95 por ciento, la diferencia entre el ingreso promedio por hogar en las dos comunidades es mayor a $1.500 diarios.

EJEMPLO: 2

Una muestra de 80 alambres de acero producidos por la fábrica A presenta una resistencia promedio a la ruptura de 1.230 lbs. con una desviación estándar de 120 lbs .. Una muestra de 100 alambres de acero producidos por la fábrica B presenta una resistencia promedio a la ruptura de 1.110 lbs. Con una desviación estándar de 90 lbs .. Con base en ésta información pruebe si la

Page 13: 3 Unidad Pruebas de Hipotesis

resistencia promedio a la rotura de los alambres de acero de la marca A es significativamente mayor que la de los alambres de acero de la marca B. Asuma un nivel de confianza del 99 por ciento.

Solución:

H0 :  A =  B

H1 :  A >  B

El tamaño de las muestras es grande, las varianzas poblacionales son desconocidas, por la tanto la estadística de trabajo a utilizar es la expresión 3.10

 

Con un nivel del confianza del 99 por ciento, en la tabla de la distribución normal el valor de Z es 2,33. Como puede observarse en la figura 3.14, la estadística de trabajo está en la zona de rechazo de la hipótesis nula, por consiguiente, con una confiabilidad del 99 por ciento se acepta que la resistencia promedio de los alambres de la marca A es significativamente mayor que la resistencia promedio de los alambres de la marca B.

Figura 3.14 Regla de decisión para una prueba de hipótesis a una cola superior.

Page 14: 3 Unidad Pruebas de Hipotesis

EJEMPLO: 3

Se desea probar si la cantidad promedio de cera superficial en el lado interno (I) de las bolsas de papel encerado es mayor que la cantidad promedio en el lado externo (E). Para tal efecto se tomó una muestra aleatoria de 25 bolsas, midiéndose la cantidad de cera en cada lado de esas bolsas, obteniéndose los siguientes resultados:

Con base en esta información cuál es su conclusión? Asuma un nivel de confianza del 90 por ciento.

Solución:

Con la información suministrada se obtienen los estimadores necesarios:

En consideración a que el tamaño de las muestras es pequeño, antes de realizar la prueba de hipótesis para la diferencia de medias, se debe probar si las varianzas poblacionales son iguales o diferentes.

H0 :   /   = 1

H1 :   /   1

Para la estadística de trabajo se utiliza la expresión 3.8:

Con una confiabilidad del 90 por ciento, en la tabla de la distribución F con 24 grados de libertad en el numerador y 24 grados de libertad en el denominador, el valor de Z 0,05 es 0,505 y el valor de Z 0,95 es 1,98. Como puede observarse en la figura 3.15, la estadística de trabajo cae en la zona de no rechazo de la hipótesis nula, por consiguiente las varianzas poblacionales son iguales.

Page 15: 3 Unidad Pruebas de Hipotesis

Como las varianzas poblacionales son iguales, para realizar la prueba de hipótesis para la diferencia de medias se usa la expresión 3.11

H0 :  I    E

H1 :  I >  E

Con una confiabilidad del 90 por ciento, en la tabla de la distribución t con 48 grados de libertad, el valor de Z es 1,3. Como puede observarse en la figura 3.16, la estadística de trabajo se encuentra en la zona de no rechazo de la hipótesis nula, por lo tanto, con una confiabilidad del 90 por ciento se concluye que la cantidad promedio de cera en el lado interno no es mayor que la cantidad promedio de cera en el lado externo.

Figura 3.16 Regla de decisión para una prueba de hipótesis a una cola superior

REGLA DE DECISIÓN

Page 16: 3 Unidad Pruebas de Hipotesis

La regla de decisión es la misma que en los casos anteriores pero los valores de la tabla se hallan en una distribución t con k grados de libertad, siendo:

(3.13)

EJEMPLO: 4

Un fabricante de bombillos sospecha que una de sus líneas de producción está produciendo bombillos con una duración promedio menor que la de otra línea. Para probar su sospecha toma una muestra aleatoria de 16 bombillos de la línea sospechosa (s) y 18 de la otra línea (c), obteniendo los siguientes resultados:

Con ésta información cuál es su conclusión si se asume un nivel de confianza del 90 por ciento.

Solución

Como el tamaño de las muestras es pequeño, para decidir cuál es la estadística de trabajo adecuada para la prueba de hipótesis de la diferencia de medias, primero se debe probar si las varianzas poblacionales son iguales o no.

H0 :   /   = 1

H1 :   /   1

La estadística de trabajo es:

Con una confiabilidad del 90 por ciento, en la tabla de la distribución F con 15 grados de libertad en el numerador y 17 grados de libertad en el denominador, el valor de Z 0,05 es 0,43 y el valor de Z 0,95 es 2,31. como puede observarse en la figura 3.17, la estadística de trabajo cae en la zona de rechazo de la hipótesis nula, por consiguiente las varianzas poblacionales son diferentes.

Page 17: 3 Unidad Pruebas de Hipotesis

Figura 3.17 Regla de decisión para una prueba de hipótesis a dos colas

Considerando que las varianzas poblacionales son diferentes, la estadística de trabajo a utilizar para la prueba de hipótesis para la diferencia de medias es la expresión 3.12

H0 :  S =  C

H1 :  S <  C

La estadística de trabajo es:

Con la expresión 3.13 se calculan los grados de libertad de la distribución t

En la tabla de la distribución t, con 26 grados de libertad y una confiabilidad del 90 por ciento, el valor de Z es -1,315. Como se observa en la figura 3.18, la estadística de trabajo cae en la zona de no rechazo de la hipótesis nula, por lo tanto, con una confiabilidad del 90 por ciento se concluye que no hay diferencia en el promedio de producción de las dos líneas.

Page 18: 3 Unidad Pruebas de Hipotesis

Figura 3.18 Regla de decisión para una prueba de hipótesis a una cola inferior

3.8. PRUEBA DE HIPOTESIS PARA LA PROPORCION

Hipótesis Científica:- la proporción de días cuya producción de clorofila oscila de 600 – 25000 es igual a 0.50

Hipótesis Estadística:- H0 P = 0.50

Solución: trabajar para: = 0.98ال

1. H0 P = 0.50

H0 P ¿ 0.50

2. α=0 .05

Page 19: 3 Unidad Pruebas de Hipotesis

RR/H0 RR/

H0

3.

Z= p−P

√ PQn

−zα /2=2.33 0zα /2=2.33

RA/H0

4. H1 :≠¿ ¿

α=0 .05 Z

0.9800ال =

= ال

0 .98002

=0 .4900

Para 0.4900 Normal = Zα /2 = 2.33

RA/H0 : -2.33 <z < 2.33

RR/H0 : z≤−2 .33 ò z≥2 .33

5. En base a la información de la muestra anterior

p= x

n= nº dediascuyaproduccionoscilade 600−250024 dìas

p =

1324

=0 .5417

Zc=p−P

√ PQn =

0.5417−05000

√(0 .50)( 0.50 )24

=0 .41

6. Z tabla vs

Zc

2.33 >0.41Zce RA/

H0

7. Se acepta H0

8. la proporción de días cuya producción de clorofila oscila de 6000 – 25000 es igual a 0.50.

EJEMPLO: 1

Page 20: 3 Unidad Pruebas de Hipotesis

El expendio Pollos Deliciosos asegura que 90% de sus órdenes se entregan en menos de 10 minutos. En una muestra de 100 órdenes, 82 se entregaron dentro de ese lapso. Puede concluirse en el nivel de significancia 0,01, que menos de 90% de las órdenes se entregan en menos de 10 minutos?

SOLUCION:

EJERCICIO: 2

Un artículo reciente, publicado en el diario USA today, indica que solo a uno de cada tres egresados de una universidad les espera un puesto de trabajo. En una investigación a 200 egresados recientes de su universidad, se encontró que 80 tenían un puesto de trabajo. Puede concluirse en el nivel de significancia 0,02, que en su universidad la proporción de estudiantes que tienen trabajo es mayor ?

SOLUCION:

Page 21: 3 Unidad Pruebas de Hipotesis

EJERCICIO 3

A una muestra a nivel nacional (en Estados Unidos) de ciudadanos influyentes de los partidos republicano y demócratas, se les preguntó entre otras cosas, si estaban de acuerdo con la disminución de los estándares ambientales para permitir el uso del carbón con alto contenido de azufre como combustible. Los resultados fueron:

  Republicanos                 Demócratas 

Cantidad muestreada              1000

Cantidad a favor                       200 

  800

  168

Page 22: 3 Unidad Pruebas de Hipotesis

Al nivel de significancia 0,02, puede decirse que hay una proporción mayor de Demócratas a favor de reducir los estándares?

 

 

   

Page 23: 3 Unidad Pruebas de Hipotesis

3.9. PRUEBA DE HIPOTESIS PARA LA DIFERENCIA DE PROPORCCIONES

Cuando se tienen dos poblaciones y se han tomado muestras aleatorias de tamaños n 1 y n 2, para observar una característica o cualidad, se puede comparar el comportamiento de dicha característica en las poblaciones a través de la diferencia de proporciones.

Hipótesis

Como en los casos anteriores se puede plantear uno de los siguientes tres tipos de hipótesis:

- Prueba de hipótesis a dos colas

H0 :  1 =  2 ó H0 :  1 -  2 = k

H1 :  1    2 H1 :  1 -  2   k

 - Prueba de hipótesis a una cola superior

H0 :  1 =  2 ó H0 :  1 -  2   k

H1 :  1 >  2 H1 :  1 -  2 > k

 

- Prueba de hipótesis a una cola inferior

H0 :  1 =  2 ó H0 :  1 -  2   k

H1 :  1 <  2 H1 :  1 -  2 < k

 

La estadística de trabajo es la expresión 1.14:

(3.14)

REGLA DE DECISION

Como en los casos anteriores depende del tipo de hipótesis que se haya planteado.

Page 24: 3 Unidad Pruebas de Hipotesis

- Si se ha planteado la hipótesis alternativa como:

H1 :  1    2 ó H1 : p 1 - p 2 ¹ k se tiene una prueba de hipótesis a dos colas, por lo tanto, el nivel

de significancia (   ) se divide en dos partes iguales, quedando estos valores en los extremos de la distribución como se aprecia en la figura 3.1

 y   pertenecen a una distribución Normal estándar. Si el valor de la estadística de trabajo

(Zp1-p2 ) está entre   y   no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo

cual implica aceptar H1 . Es decir, si   < Zp1-p2 <   no se rechaza H0 .

- Si se ha planteado la hipótesis alternativa como:

H1 :  1 >  2 ó H1 :  1 -  2 > k, se tiene una prueba de hipótesis a una cola superior, quedando el

nivel de significancia (   ) en la parte superior de la distribución, como se aprecia en la figura 3.2

 pertenece a una distribución Normal estándar. Si el valor de la estadística de trabajo es

menor que   no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica

aceptar H1 . Es decir, si Zp1-p2 <   no se rechaza H0 .

- Si se ha planteado la hipótesis alternativa como:

H1 :  1 <  2 ó H1 :  1 -  2 < k, se tiene una prueba de hipótesis a una cola inferior, quedando el

nivel de significancia (   ) en la parte inferior de la distribución, como se aprecia en la figura 3.3

Z  pertenece a una distribución Normal estándar. Si el valor de la estadística de trabajo (Zp1-p2) es

mayor que Z  no se rechaza la hipótesis nula, en caso contrario se rechaza H o lo cual implica

aceptar H1 . Es decir, si Zp1-p2 > Z  no se rechaza H0 .

 

EJEMPLO: 1

Se seleccionó una muestra aleatoria de 100 hombres y 100 mujeres de un departamento de Colombia; se halló que de los hombres 60 estaban a favor de una ley de divorcio y de las mujeres 55 estaban a favor de dicha ley. Con base en ésta información, pruebe que la proporción de hombres que favorece ésta ley es mayor que la proporción de mujeres. Asuma un nivel de confianza del 99 por ciento.

Solución

H0 :  H =  M

H1 :  H >  M

Se utiliza la expresión 3.14

Page 25: 3 Unidad Pruebas de Hipotesis

Por la hipótesis alternativa se trabaja a una cola superior. En la tabla de la distribución normal con una confiabilidad del 99 por ciento, el valor de Z es 2,33. La estadística de trabajo está en la zona de no rechazo de la hipótesis nula (figura 3.19), es decir, con una seguridad del 99 por ciento se concluye que no hay diferencia en la proporción de hombres y mujeres que favorecen la ley de divorcio.

Figura 3.19 Regla de decisión para una prueba de hipótesis a una cola superior.

EJERCICIO 2

Harry Hutchings es propietario de un gimnasio y afirma que la ingestión de ciertas vitaminas

aumente la fuerza corporal. Se seleccionan aleatoriamente 10 estudiantes atletas y se les aplica

una prueba de fuerza muscular. Después de dos semanas de tomar las vitaminas y de

entrenamiento se les aplica nuevamente la prueba. Los resultados se muestran a continuación:

Page 26: 3 Unidad Pruebas de Hipotesis

EJERCICIO 3

Se realizó un estudio sobre la cantidad de plomo en sangre en mujeres puérperas – ciudad de

México, años 2005 y 2006, se trabajó con una población de 102 mujeres en el año 2005(N1=102

) y con 120 mujeres en el año 2006 (N2=120 ). Para efectos de estudio comparativo sobre la

cantidad de plomo en sangre superior a 11 μg/dl en mujeres puérperas, se trabaja con una

Page 27: 3 Unidad Pruebas de Hipotesis

muestra de 30 mujeres puérperas (n1=30 ) en el año 2005 y con una muestra aleatoria de 38

mujeres (n2=38 ) en el año 2006.

Sobre esta investigación. ¿Será diferente la proporción de mujeres puérperas con cantidad de

plomo en sangre superior a 11 μg/dl en los dos años de realizada la investigación en ciudad México?

La información está dada por:

ESTIMACIÒN PARA LA DIFERENCIA DE PROPORCIONES

x = mujer puérpera con plomo en sangre superior a 11 μg/dl

p1=x1n1

=1130

=0 .37 p2=x2n2

=1138

=0.29

Para un = 94ال %

n1=30 (Año 2005)

10.0, 12.9, 6.9, 6.4, 11.6, 9.1,

17.0, 23.3, 10.0, 11.5, 11.7, 7.2, 5.6, 12.4, 4.6, 8.8, 15.9, 8.2, 7.6,

n2=38 (Año 2006)

9.2, 10.5, 6.4, 12.4, 14.2, 9.7,

6.8, 7.8, 5.2, 9.2, 5.9, 10.5,

6.8, 5.1, 13.3, 21.0, 12.7, 23.1, 9.8, 2.9, 7.4, 18.9, 9.8, 8.5, 21.0, 7.1, 8.5, 13.1, 10.7, 5.5, 14.5, 14.4, 6.9, 8.8, 9.4, 7.4, 12.9, 11.0

Page 28: 3 Unidad Pruebas de Hipotesis

p1−p2 : p1−p2±Zα /2 √ P1Q1n1

+P2Q2n2

0.37 – 0.29 ± 1.88 √ (0 .37 )(0 .63)30

+(0 .29 )(0 .71 )38

Si = 0.94ال ,

δ2=0 .94

2=0 .4700

z= 1.88 (tabla normal Pág. 19)

: 0.08 ± 0.22

P (−0 .14<P1−P2<0.30 ) = 0.94

Al 0.94 de confiabilidad la diferencia de proporciones de mujeres puérperas en la ciudad de

México en los años 2005 – 2006 de plomo en sangre es superior a 11 μg/dl , oscila de 0 – 0.30

3.10. PRUEBA DE HIPOTESIS PARA LA VARIANZA

Es frecuente que se desee comprobar si la variación o dispersión de una variable ha tenido alguna modificación, lo cual se hace con la prueba de hipótesis para la varianza.

HipótesisSe puede plantear uno de los siguientes tres tipos de hipótesis:- Prueba de hipótesis a dos colas

H0 :   = k

H1 :     k- Prueba de hipótesis a una cola superior

H0 :   = k     ó     H0 :     k

H1 :  > k     ó     H1 :   > k- Prueba de hipótesis a una cola inferior

H0 :   = k     ó     H1 :   k

H1 :  < k     ó     H1 :  < kEn este caso se tienen dos situaciones, dependiendo de si se utiliza la varianza muestral sin corregir o corregida.

•  Si se utiliza la varianza sin corregir (  ) la estadística de trabajo es la expresión (1.4):

(3.6)•  Si se utiliza la varianza corregida, la estadística de trabajo es la expresión (1.5):

Page 29: 3 Unidad Pruebas de Hipotesis

 

REGLA DE DECISION

- Si se ha planteado la hipótesis alternativa como:

H1 :     k se tiene una prueba de hipótesis a dos colas, por lo tanto, el nivel de significancia (   ) se divide en dos partes iguales, quedando estos valores en los extremos de la distribución como se aprecia en la figura 3.8

Figura 3.8 Regla de decisión para una prueba de hipótesis a dos colas

 y   pertenecen a una distribución X2 con (n-1) grado de libertad. Si el valor de la estadística de trabajo (T) está entre   y   no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si   < T <   no se rechaza H0.

- Si se ha planteado la hipótesis alternativa como:

H1 :   > k, se tiene una prueba de hipótesis a una cola superior, quedando el nivel de significancia (   ) en la parte superior de la distribución, vease figura 3.9

Figura 3.9 Regla de decisión para una prueba de hipótesis a una cola superior

Page 30: 3 Unidad Pruebas de Hipotesis

Z1-  pertenece a una distribución X2 con (n-1) grado de libertad. Si el valor de la estadística de trabajo (T) es menor que   no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si T <   no se rechaza H0 .

- Si se ha planteado la hipótesis alternativa como:

H1 :   < k, se tiene una prueba de hipótesis a una cola inferior, quedando el nivel de significancia (   ) en la parte inferior de la distribución, vease figura 3.10

Figura 3.10 Regla de decisión para una prueba de hipótesis a una cola inferior

Z  pertenece a una distribución X2 con (n-1) grado de libertad. Si el valor de la estadística de trabajo (T) es mayor que Z  no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si T >Z  no se rechaza H0.

EJEMPLO: 1

Se supone que los diámetros de cierta marca de válvulas están distribuidos normalmente con una varianza poblacional de 0,2 pulgadas 2 , pero se cree que últimamente ha aumentado. Se toma una muestra aleatoria de válvulas a las que se les mide su diámetro, obteniéndose los siguientes resultados en pulgadas: 5,5     5,4     5,4     5,6     5,8     5,4     5,5     5,4     5,6     5,7

Con ésta información pruebe si lo que se cree es cierto.

Solución:

Se cree que la varianza poblacional ha aumentado, es decir es superior a 0,2; por lo tanto:

H0 :   = 0,2

H1 :   > 0,2

Page 31: 3 Unidad Pruebas de Hipotesis

Para realizar esta prueba de hipótesis se utiliza la expresión 3.6

Asumiendo un nivel de confianza del 95 por ciento, en la tabla de la distribución chi-cuadrado con 9 grados de libertad, se obtiene un valor para Z de 16,919. Como puede observarse en la figura 3.11, el valor de la estadística de trabajo se ubica en la zona de no rechazo de la hipótesis nula, por consiguiente con una confiabilidad del 95 por ciento se puede afirmar que la varianza poblacional no ha aumentado.

3.11. PRUEBA DE HIPOTESIS PARA LA RELACION DE VARIANZAS

PARA COSIENTES DE VARIANZAS

Si de dos poblaciones con distribución normal se seleccionan dos muestras aleatorias independientes de tamaños n1 y n2 , se puede comparar la homogeneidad o variabilidad de dichas poblaciones a través de una prueba de hipótesis para el cociente de varianzas.

Cuando se planteen las hipótesis debe quedar en el numerador la población cuya muestra tenga mayor varianza. Es decir que la población 1 será la que tenga mayor varianza muestral.

Hipótesis

Se puede plantear uno de los siguientes tres tipos de hipótesis:

- Prueba de hipótesis a dos colas

H0 :   =       ó     H0 :   /   = 1

H1 :       ó     H1 :   /   1

Page 32: 3 Unidad Pruebas de Hipotesis

- Prueba de hipótesis a una cola superior

H0 :   =       ó     H0 :   /   1

H1 :  >       ó     H1 :   /   > 1

- Prueba de hipótesis a una cola inferior

H0 :   =      ó     H0 :   /   1

H1 :   <       ó     H1 :   /   < 1

La estadística de trabajo es la expresión (1.15)

(3.8)

REGLA DE DECISION

Si se ha planteado la hipótesis alternativa como:

H1 :       ó H1 :  /     1 se tiene una prueba de hipótesis a dos colas, por lo tanto, el nivel de significancia (   ) se divide en dos partes iguales, quedando estos valores en los extremos de la distribución como se aprecia en la figura 3.8

 y   pertenecen a una distribución F con (n1 -1) grado de libertad en el numerador y (n2-1) grado de libertad en el denominador. Si el valor de la estadística de trabajo (T) está entre   y   no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si   < T <   no se rechaza H0 .

- Si se ha planteado la hipótesis alternativa como:

H1 :   >   ó H1 :   /   > 1 , se tiene una prueba de hipótesis a una cola superior, quedando el nivel de significancia (   ) en la parte superior de la distribución, como se aprecia en la figura 3.9

Z 1- a pertenecer a una distribución F con (n 1 -1) grado de libertad en el numerador y (n 2 -1) grado de libertad en el denominador. Si el valor de la estadística de trabajo (T) es menor que Z 1- a no se rechaza la hipótesis nula, en caso contrario se rechaza H o lo cual implica aceptar H 1 . Es decir, si T < Z 1- a no se rechaza H o .

- Si se ha planteado la hipótesis alternativa como:

H1 :   <   ó H1 :   /   < 1 , se tiene una prueba de hipótesis a una cola inferior, quedando el nivel de significancia (   ) en la parte inferior de la distribución, como se aprecia en la figura 3.10

Page 33: 3 Unidad Pruebas de Hipotesis

Z a pertenecer a una distribución F con (n1 -1) grado de libertad en el numerador y (n2 -1) grado de libertad en el denominador. Si el valor de la estadística de trabajo (T) es mayor que Z a no se rechaza la hipótesis nula, en caso contrario se rechaza H o lo cual implica aceptar H 1 . Es decir, si T > Z a no se rechaza H0 .

EJEMPLO 1

Dos fuentes de materias primas están siendo consideradas. Ambas fuentes parecen tener características similares, pero no se está seguro de su homogeneidad. Una muestra de 10 grupos de la fuente A produce una varianza de 250 y una muestra de 11 grupos de la fuente B produce una varianza de 195. Con base en ésta información se puede concluir que la varianza de la fuente A es significativamente mayor que la de la fuente B?. Asuma un nivel de confianza del 99 por ciento.

Solución

H 0 :  A =   B

H1 :  A >   B

Con un nivel de confianza del 99 por ciento, en la tabla de la distribución F con 9 grados de libertad en el numerador y 10 grados de libertad en el denominador, se obtiene un valor para Z de 4,94. Como puede observarse en la figura 3.12, el valor de la estadística de trabajo está en la zona de no rechazo de la hipótesis nula, por lo tanto, con una confiabilidad del 99 por ciento, no se puede rechazar que la variabilidad de las dos fuentes de materia prima es igual.

3.12. USO DE SOFTWARE ESTADISTICO