capítulo viii

67
CAPÍTULO VIII. CONTRASTES DE HIPÓTESIS 8.1 INTRODUCCIÓN Hipótesis: Enunciado acerca de una población, elaborada con el propósito de ponerse a prueba. Ejemplos de hipótesis acerca de un parámetro de población son: La media mensual de ingresos para analistas de sistemas es 2000, El 20% de los delincuentes juveniles son capturados y sentenciados a prisión Contrastar una hipótesis (Prueba de hipótesis) es comparar las predicciones con la realidad que observamos. Si dentro del margen de error que nos permitimos admitir, hay coincidencia, aceptaremos la hipótesis y en caso contrario la rechazaremos. Hipótesis nula: Es aquella hipótesis que se desea contrastar, se simboliza por Ho. Esta suele ser una estrategia o medio del que se sirve el investigador para probar la alternativa. El planteamiento de Ho permite elaborar un modelo probabilístico a partir del cual se puede llegar a una decisión final. Hipótesis alternativa: También se conoce como experimental y se representa por H1 o Ha. Esta es la hipótesis de investigación. De modo que se espera que hay un argumento para la hipótesis de investigación (o alternativa) H1, demostrando que no lo hay para su contraria, la hipótesis nula. Los contrastes pueden ser unilaterales o bilaterales (también llamados de una o dos colas) El contraste es bilateral (dos colas) si la hipótesis alternativa H 1 es del tipo ≠. El contraste es unilateral (una cola) si la hipótesis alternativa H 1 es del tipo < o >. Nota: generalmente una a hipótesis de investigación se plantea como una hipótesis alternativa, es decir que las hipótesis alternativa e hipótesis nula deben formularse de manera que al rechazar Ho, se apoye la conclusión de la investigación. 8.1.1 ERRORES DE TIPO I Y DE TIPO II. Si rechazamos una hipótesis cuando debiera ser aceptada, diremos que se ha cometido un error de tipo I. Error tipo I: Ho es cierto pero lo rechazo; = P(rechazar Ho) cuando es cierta Error de tipo II: Es el error que consiste en no rechazar H 0 cuando es falsa. La probabilidad de cometer este error la denotamos con la letra β Error tipo II: Ho es falso pero lo acepto; β = P(aceptar Ho) cuando es falsa

Upload: richard-huaman-durand

Post on 05-Jul-2015

3.032 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Capítulo viii

CAPÍTULO VIII. CONTRASTES DE HIPÓTESIS

8.1 INTRODUCCIÓN

Hipótesis: Enunciado acerca de una población, elaborada con el propósito de ponerse a prueba.

Ejemplos de hipótesis acerca de un parámetro de población son:

La media mensual de ingresos para analistas de sistemas es 2000,

El 20% de los delincuentes juveniles son capturados y sentenciados a prisión

Contrastar una hipótesis (Prueba de hipótesis) es comparar las predicciones con la realidad que

observamos. Si dentro del margen de error que nos permitimos admitir, hay coincidencia,

aceptaremos la hipótesis y en caso contrario la rechazaremos.

Hipótesis nula: Es aquella hipótesis que se desea contrastar, se simboliza por Ho. Esta suele ser una

estrategia o medio del que se sirve el investigador para probar la alternativa. El planteamiento de Ho

permite elaborar un modelo probabilístico a partir del cual se puede llegar a una decisión final.

Hipótesis alternativa: También se conoce como experimental y se representa por H1 o Ha. Esta es la

hipótesis de investigación. De modo que se espera que hay un argumento para la hipótesis de

investigación (o alternativa) H1, demostrando que no lo hay para su contraria, la hipótesis nula.

Los contrastes pueden ser unilaterales o bilaterales (también llamados de una o dos colas)

El contraste es bilateral (dos colas) si la hipótesis alternativa H1 es del tipo ≠. El contraste es unilateral (una cola) si la hipótesis alternativa H1 es del tipo < o >.

Nota: generalmente una a hipótesis de investigación se plantea como una hipótesis alternativa, es

decir que las hipótesis alternativa e hipótesis nula deben formularse de manera que al rechazar Ho, se

apoye la conclusión de la investigación.

8.1.1 ERRORES DE TIPO I Y DE TIPO II.

Si rechazamos una hipótesis cuando debiera ser aceptada, diremos que se ha cometido un error de

tipo I.

Error tipo I: Ho es cierto pero lo rechazo; = P(rechazar Ho) cuando es cierta

Error de tipo II: Es el error que consiste en no rechazar H0 cuando es falsa. La probabilidad de

cometer este error la denotamos con la letra β

Error tipo II: Ho es falso pero lo acepto; β = P(aceptar Ho) cuando es falsa

Page 2: Capítulo viii

Región de

aceptación Región crítica

Región Crítica

Errores y conclusiones correctas en las pruebas de hipótesis

Conclusión

Situación en la población Ho Verdadera H1 Verdeara

Se Acepta Ho Conclusión

correcta Error tipo II

Se rechaza Ho Error tipo I

Conclusión

correcta

Observaciones.

1. Los errores de tipo I y II no están relacionados más que del siguiente modo: Cuando α decrece β

crece. Por tanto no es posible encontrar test que hagan tan pequeños como queramos ambos errores

simultáneamente. De este modo es siempre necesario privilegiar a una de las hipótesis, de manera que

no será rechazada, a menos que su falsedad se haga muy evidente. En los contrastes, la hipótesis

privilegiada es H0 que sólo será rechazada cuando la evidencia de su falsedad supere el umbral del

100(1 − α) %.

2. Al tomar α muy pequeño tendremos que β se puede aproximar a uno.

Lo ideal a la hora de definir un test es encontrar un compromiso satisfactorio entre α y β (aunque

siempre a favor de H0). Denominamos potencia de un contraste a la cantidad 1 − β.

3. En el momento de elegir una hipótesis privilegiada podemos en principio dudar entre si elegir una

dada o bien su contraria.

8.1.2 PRINCIPALES CONCEPTOS IMPLICADOS EN LA PRUEBA DE HIPÓTESIS:

Nivel de significancia. Es la probabilidad de cometer un error de tipo I, cuando la hipótesis nula es

verdadera, se denota con la letra α, y los mas conocidos son 0.05; 0.01; 0.1

El nivel de significancia se define como la máxima probabilidad de rechazar Ho cuando ésta es

verdadera.

Región crítica. El conjunto de todos los valores de la estadística de prueba que nos harían rechazar la

hipótesis nula.

Región de aceptación. Es la región complementaria de la anterior. Si el valor evaluado del estadístico

pertenece a ella No rechazamos la hipótesis. (Las hipótesis nunca se aceptan de forma definitiva, sólo

se aceptan provisionalmente, es decir, no se rechazan, a la espera de una nueva información que

eventualmente pueda llevarnos a rechazarla en el futuro).

Valor crítico: El valor o valores que separan la región crítica de los valores de la estadística de

prueba que no nos harían rechazar la hipótesis nula.

Los valores críticos dependen de la naturaleza de la hipótesis nula, la distribución de muestreo

pertinente y el nivel de significancia α.

En una prueba de dos colas, el nivel de significancia α

se divide equitativamente entre las dos colas. En una

prueba de una cola, este nivel es el área de la región a

Page 3: Capítulo viii

44,1

36

5,0

1612,16

n

s

ux

teoz

partir del valor crítico hasta el extremo derecho o izquierdo, según corresponda.

Estadística de prueba: Es una estadística obtenida de una muestra o un valor basado en datos de

muestra.

p-valor. El valor de más pequeño que nos lleve a rechazar H0 se llama el p-valor de la prueba..

8.1.3 PASOS DE LA PRUEBA DE HIPÓTESIS

Pasos Ejemplo 1. Expresar la hipótesis nula y la hipótesis alternativa

Ho: µ = µo Vs H1: µ ≠ µo o H1: µ < µo o H1: µ < µo Ho: µ = 16 H1: µ ≠ 16

2. Determinar y calcular una estadística de prueba

3. Establecer los valores críticos que determinan las

regiones de rechazo de las de no rechazo en

función del nivel de significancia

Para un α = 0,05;

4. Formular una regla de decisión Si Z < Z α /2 se rechaza Ho Si Z> Z α /2 se acepta Ho

H0 se rechaza si z < – 1,96 o z > 1,96

5. Aplicar la regla de decisión (conclusión).

No se rechaza H0 porque 1,44 es menor

que el valor crítico 1.96

8.1.4 POTENCIA DE UNA PRUEBA DE HIPÓTESIS

Potencia de una prueba. Se define como potencia a la probabilidad de rechazar la Hipótesis Nula

cuando ésta es falsa. La potencia se denota como π.

Esta probabilidad representa la chance de concluir que Ho es falsa cuando efectivamente lo es. La

potencia se calcula como π = 1 - β, donde β es la probabilidad de cometer el Error de Tipo II.

Cuanto mayor es la potencia mejor es la prueba. La potencia es función de varios factores: a) el nivel

de significación elegido, b) la varianza de la variable aleatoria y c) el tamaño de la muestra. Cuando el

nivel de significación se ha fijado y la varianza de la variable aleatoria es conocida (o se ha estimado)

es posible controlar la potencia de la prueba manejando el tamaño muestral (o, en el caso de los

diseños experimentales, manejando el número de repeticiones).

8.1.5 EJERCICIOS RESUELTOS

En los siguientes ejercicios identifique los datos y plantee las Hipótesis

Ejercicio 1. Un jurado de elecciones de cierto país dice que el porcentaje de ausentismo generalmente

es de 30% como mínimo. Se elige una muestra de 100 individuos y se encuentra que 40 están

Page 4: Capítulo viii

dispuestos a votar. Con un nivel de significancia del 5%, se puede afirmar que el jurado de elecciones

tiene razón.

Solución.

Datos

Po= 0.30=30% (porcentaje de ausentismo poblacional)

p = 60/100=0.60= 60% (porcentaje de ausentismo de la muestra)

= 0.05 (nivel de significancia)

n= 100 (tamaño de la muestra)

Hipótesis

Ho: Po ≥ 0.30 (el ausentismo como mínimo es del 30%)

H1: Po < 0.30 (el ausentismo es menor del 30%)

También se puede expresar

Ho: Po = 0.30 (el ausentismo como mínimo es del 30%) (Se considera solo el signo =)

H1: Po < 0.30 (el ausentismo es menor del 30%)

Ejercicio 2. Se desea adquirir tubos fluorescente de una empresa, siempre y cuando la vida media de

una muestra de 110 tubos fluorescentes sea mayor a 1610 horas, con una desviación típica de 100

horas. Con un nivel de significancia de 0.05 se quiere saber si la duración media de los tubos es mayor

de 1650 horas.

a) Dé las hipótesis nula y alternativa adecuada

b) En esta situación ¿Cuál es el error de tipo I? ¿Qué consecuencias tiene cometer este error?

c) En esta situación ¿Cuál es el error de tipo II? ¿Qué consecuencias tiene cometer este error?

Solución

Datos

μ = 1650 (media de la población)

1610x Media de la muestra s= 100 desviación típica de la muestra =0.05

a) Hipótesis

Ho: μ ≤ 1650 (No se adquiere los tubos)

H1: μ > 1650 (Se adquiere los tubos)

b) El error de tipo I es rechazar que la duración media es menor o igual a 1610 horas siendo estas

verdaderas, las consecuencias es que se adquiere productos que no cumplen las horas

establecidas.

c) El error de tipo II es aceptar que la duración media es menor o igual a 1610 horas siendo esta

falsa, las consecuencias es que se deja de comprar focos que cumplen las horas requeridas.

Ejercicio 3. En un muestreo realizado entre los empleados de una multinacional se eligieron al azar

15 empleados y se anotó su sueldo mensual obteniéndose los siguientes datos: 1285, 1152, 1546,

1423, 1120, 1660, 956, 1250, 1812, 1120, 1553, 1056, 1163, 1358 y 1457. El gerente afirma que el

sueldo medio de sus trabajadores está por encima de los 1500 y los sindicatos afirman que es de 1400.

Sabiendo que los sueldos en esa multinacional se distribuyen de forma aproximadamente normal,

a) Crees que efectivamente el sueldo medio de todos los trabajadores es de 1400?

Page 5: Capítulo viii

b) Crees que lo que dice el gerente es cierto?

c) En la situación del gerente ¿Cuál es el error de tipo I? ¿Qué consecuencias tiene cometer este

error?

d) En la situación del gerente ¿Cuál es el error de tipo II? ¿Qué consecuencias tiene cometer este

error?

Solución

a) datos

μ = 1400 (media de la población)

15

1457...1521285x media de la muestra

115

)(151457...115212852222

xs Desviación típica de la muestra =0.05

Hipótesis

Ho: μ = 1400 (el sueldo medio de todo los trabajadores es 1400)

H1: μ ≠ 1400 (el sueldo medio de todo los trabajadores NO es 1400)

b) datos

μ = 1500 (media de la población)

15

1457...1521285x media de la muestra

115

)(151457...115212852222

xs desviación típica de la muestra =0.05

Hipótesis

Ho: μ = 1500 (el sueldo medio de todo los trabajadores No esta por encima de 1500, el gerente

miente)

H1: μ > 1500 (el sueldo medio de todo los trabajadores esta por encima de 1500, el gerente dice la

verdad)

c) El error de tipo I es rechazar que el gerente miente a pesar que realmente esta mintiendo, las

consecuencias es que se le cree a un mentiroso.

d) El error de tipo II es aceptar que el gerente miente a pesar que dice la verdad, las consecuencias

es que se deja de creer a alguien que dice la verdad.

Ejercicio 4. Para comprobar si más un tercio de las llamadas a un servicio de ambulancias son

urgencias con peligro de muerte, se ha tomado una muestra aleatoria de sus archivos y se ha

encontrado que 61 de 150 llamadas son de este tipo. ¿Tiene fundamento dicha afirmación?

Solución

Po= 1/3=0.333 (Proporción de la población)

Page 6: Capítulo viii

p= 61/150 (proporción de la muestra)

Hipótesis

Ho: Po = 0.33 (No mas de 1/3 de las llamadas son urgentes con peligro de muerte)

H1: Po> 0.33 (mas de 1/3 de las llamadas son urgentes con peligro de muerte)

8.1.6 EJERCICIOS PROPUESTOS

Ejercicio 1. Un proceso de fabricación produce 12.3 unidades por hora. Esta producción tiene una

varianza igual a 4. Se sugiere un nuevo proceso que es costoso de instalar, pero se piensa que puede

incrementar la producción. Para decidir si se hace el cambio o no, se prueban 10 máquinas nuevas y

se observa que éstas producen en promedio 13.3 unidades.

a) Calcular la probabilidad del error de tipo II en la prueba para µ= 12.3 vs. µ>12.3 cuando la

verdadera esperanza del nuevo proceso es µ= 14. Trabajar con α= 0.01.

Ejercicio 2. Se acepta que después de 3 años de almacenamiento el vigor de un arbusto forrajero

medido como peso seco alcanzado a los 20 días de la germinación es de 45 mg promedio. Un nuevo

método de almacenamiento se propone para aumentar el vigor.

Se evalúan para ello 20 lotes de 10 semillas cada uno y al cabo de 3 años se las hace germinar,

obteniéndose los siguientes resultados de peso seco promedio a los 20 días:

49 43 56 57 59 65 52 51 50 55

60 65 53 57 67 56 53 37 45 42

a) Plantear las hipótesis nula y alternativa asociadas al problema.

b) ¿Cuál es el error de tipo I? ¿Qué consecuencias tiene cometer este error?

c) ¿Cuál es el error de tipo II? ¿Qué consecuencias tiene cometer este error?

Ejercicio 3. Un cierto tipo de cáncer tiene habitualmente una letalidad (número de muertos por cada

cien enfermos) de 30. Se experimenta una nueva droga en 80 casos, en los cuales se producen 15

defunciones.

a. Señale la hipótesis de trabajo.

b. Señale el nivel de significación.

c. Realice la prueba de significación estadística.

Page 7: Capítulo viii
Page 8: Capítulo viii

nZx

nZx

2/2/

n

sZx

n

sZx

2/2/

CAPÍTULO IX. PRUEBA DE HIPÓTESIS PARA LA MEDIA DE LA

POBLACIÓN.

9.1 PRUEBA DE HIPÓTESIS PARA LA MEDIA : MUESTRAS GRANDES.

9.1.1 INTRODUCCIÓN

Sean X1, X2, X3,...,Xn una muestra aleatoria simple (m.a.s) de una distribución normal o cualquier

distribución (si n≥30, la distribución cumple el teorema del limite central) con media desconocida µ, y

con una varianza σ2 , la distribución de x ~ N(μ,

n

2

) y la variable z ~ N(0,1).

Deseamos contrastar la hipótesis de que el parámetro poblacional μ toma un determinado valor μ0.

Es decir:

Hipótesis

Caso I Caso II Caso III

Ho : = 0

H1 : < 0

Ho : = 0

H1 : ≠ 0

Ho : = 0 H1 : > 0

9.1.2 SUPUESTOS

1. El tamaño de la muestra es grande n≥30

2. Las observaciones son independientes

3. Las medias de las muestras se distribuyen normalmente (distribución normal z), no importa cómo

sea la distribución de la población original.

Estadístico de prueba

a) Se conoce la varianza poblacional σ2. b) Se desconoce la varianza poblacional

2.

Intervalo de Confianza del 100(1- )% para la media poblacional , es de la forma:

a) Se conoce la varianza poblacional σ2. b) Se desconoce la varianza poblacional σ

2.

n

uxZ

o

n

s

uxZ

o

Page 9: Capítulo viii

Donde:

μ : media poblacional : Desviación estándar poblacional

n : Tamaño de la muestra

x : Media de la muestra s : Desviación estándar de la muestra

Nota: para encontrar s se utiliza la siguiente formula

1

22

n

xnxs

Teorema del límite central: Si x es la media de una muestra aleatoria de tamaño n que se toma

de una población con cualquier distribución (oblicua a la derecha, oblicua a la izquierda, con forma

de tina, etc...), cuya media es µ y varianza finita σ2, entonces la forma límite de la distribución de:

n

xz

conforme n →∞, es la distribución normal estándar N (0,1).

9.1.3 EJERCICIOS RESUELTOS

Ejercicio 1. La casa Carma S.A emite su propia tarjeta de crédito. Carla, la gerente de crédito, quiere

encontrar si la media mensual de saldos no pagados es mayor que S/.400. Una revisión al azar de 172

saldos reveló que la media de la muestra es S/.407 y la desviación estándar de la muestra es S/. 38.

¿Debe Carla concluir que la población media es mayor que S/.400, con un nivel de significancia del

5%?.

Solución

Datos.

μ = 400 407x

s = 38 = 0.05 (nivel de significancia 5%)

n = 172

Paso 1: Establecemos las hipótesis

H0 : μ = 400 (La media mensual de saldo no pagados no es mayor de 400)

H1 : μ > 400 (La media mensual de saldo no pagados si es mayor de 400)

Nota: la Ho también puede expresarse como Ho : μ ≤ 50

Paso 2: Calculamos el estadístico de prueba

Page 10: Capítulo viii

42,2

172

38

400407

n

s

uxz

Z0,05=1,645

Zona de rechazo Ho Zona de Aceptación Ho

Z0,05=1,645 Z=2,42

Zona de rechazo Ho Zona de Aceptación Ho

Como n > 30 la prueba es la distribución normal Z

Paso 3. Establecemos la región de rechazo para un =0.05, de la tabla normal z0.05=1.645

Paso 4. Decisión

H0 se rechaza si Z=2.42 cae en la zona de rechazo (zona achurada) es decir si

(z=2.42) > (z0.05=1.645)

Paso 5: Conclusión

Como (Z=2,42) cae en la zona de rechazo, o lo que es lo mismo (Z=2,42)> (Z0,05=1,645),

rechazamos la Ho. Es decir rechazamos que (La media mensual de saldo no pagado no es mayor de

400)

Luego Carla puede concluir que hay evidencia suficiente para aceptar que la media de saldos no

pagados es mayor que S/.400.

SOLUCIÓN EN MINITAB

Ingresamos al minitab y hacemos click en Stat>Basic statistics>1-sample Z... como se ve en la

figura siguiente

Page 11: Capítulo viii

Aparece la siguiente pantalla; luego ingresamos los datos en esta..

Hacemos click en Options… ingresamos el nivel de confianza y elegimos la Alternative, finalmente

presionamos OK, luego OK y los resultados son:

One-Sample Z Test of mu = 400 vs > 400

The assumed standard deviation = 38

95%

Lower

N Mean SE Mean Bound Z P

172 407,000 2,897 402,234 2,42 0,008

Interpretación: N=172 (tamaño de la muestra )

Mean= 407,00 (media de la muestra)

SE Mean = 2,897 (error estándar de la media)

Lower Bound = 402,234 (valor mínimo del nivel de confianza al 95% )

Z= 2,42 ( z calculado)

P = 0.008 (de 100 veces que rechazamos Ho por ser falsa, hay un probabilidad de 0.8% de

equivocarse)

Decisión: la decisión se puede tomar en función de Z=2,42 o en función de P=0,008.

En el segundo caso, Como (P = 0,008)< (α =0,05) entonces se rechaza la Ho

Conclusión. Carla tiene evidencia suficiente para aceptar que la media de saldos no pagados es mayor

que S/.400.

Media de la muestra ( n )

Desviación estándar de la muestra (s) o de

la población ( )

Media de la población ( μ )

Nivel de

confianza (1- )

Hipótesis alternativa (mayor que “ > “ )

Tamaño de la muestra ( n )

Page 12: Capítulo viii

932,0

36

15,5

502,49

n

s

uxZ

Z0,01=-2,33 z=- 0,932

Ejercicio 2. El peso de un grupo de niños debe ser de 50,00 kilogramos. Sin embargo, los

trabajadores de salud afirman que tienen un peso menor a 50,00 kilogramos. Para salir de dudas, se

tomó una muestra de 36 niños, obteniendo un peso de 49,20 kilogramos, con una desviación estándar

de 5,15 kilogramos. Con un 99% de confiabilidad, ¿puede afirmarse que el peso de todos los niños es

menor de 50,00 kilogramos?

Solución.

Datos μ = 50 n = 36

2,49x α = 0,01

s = 5,15

Prueba de hipótesis

Ho: μ = 50 (los niños NO tienen pesos menores que 50kg)

H1: μ < 50 (los niños tienen pesos menores a 50kg)

Nota: la Ho también puede expresarse como Ho : μ ≥ 50

Estadística de prueba

Como n>30 utilizamos la prueba Z, reemplazando datos

Para decidir si rechazamos o aceptamos la Ho

Construimos el gráfico y determinamos Z0,01 = – 2,33 de tabla normal

Conclusión.

Como Z= – 0,932 esta dentro de la zona de aceptación, entonces aceptamos Ho, es decir, los niños

tienen pesos mayor o igual a 50.

Utilizando Minitab

Ingresamos al minitab y hacemos click en Stat>Basic statistics>1-sample Z... y se obtiene la figura

siguiente, Aquí ingresamos los datos y activamos Options…, para ingresar el 1-

Page 13: Capítulo viii

Presionamos Ok luego Ok y los resultados obtenidos son:

One-Sample Z Test of mu = 50 vs < 50

The assumed standard deviation = 5.15

95%

Upper

N Mean SE Mean Bound Z P

36 49.2000 0.8583 50.6118 -0.93 0.176

Conclusión:

Como (P=0.176) es mayor que ( = 0.05) entonces se acepta la Ho, es decir no hay suficiente

evidencia para rechazar que los niños tengan pesos mayores o iguales a 50,00 kg.

Ejercicio 3. Los invitados a una reunión de trabajo tienen una tolerancia de 5 minutos en promedio.

Se quiere saber si un grupo de invitados están dentro de la tolerancia, para lo cual se midió el tiempo

de demora de 60 invitados, los resultados fueron

2 6 7 5 9 5 5 0 7 5 1 1 7 9 0 6 5 2 3 5 5 4 6 3 5 2 3 7 6 8 1 1 7 8 4 2 8 4 2 7 6 7 5 2 9 2 1 6 6 4 9 4 6 3 4 8 4 6 2 9

A nivel del 10%, ¿Los invitados están fuera del tiempo de tolerancia?.

Solución

Datos

μ = 5 = 10% = 0.10 n = 60

Calculamos la media aritmética ( x ) y la desviación estándar de la muestra (s)

7667.460

926...762x

52020.259

2)667.4(60)

29

22

26...

27

26

22(

s

Hipótesis

Ho: μ = 5 min (los invitados están dentro de la tolerancia)

H1: μ > 5 min (los invitados NO están dentro de la tolerancia)

Nota: la Ho también puede expresarse como Ho : μ ≤ 5 min

Estadística de prueba

Como n>30 utilizamos la prueba Z, reemplazando datos

Page 14: Capítulo viii

72,0

60

52,2

57667,4

n

s

uxZ

Z=-0,72 Z0,10= 1,28

Zona de rechazo Ho Zona de Aceptación Ho

One-Sample Z: Tiempo

Test of mu = 5 vs > 5

The assumed standard deviation = 2.52

90%

Lower

Variable N Mean StDev SE Mean Bound Z P

Tiempo 60 4.76667 2.52020 0.32533 4.34974 -0.72 0.763

Para decidir si rechazamos o no la Ho

Construimos el gráfico y determinamos Z0,1 = 1,28 de tabla normal

Conclusión. Como z=-0.72 cae en la zona de aceptación de Ho, esta no se rechaza, por lo tanto los

invitados están dentro del tiempo tolerado.

Utilizando MINITAB

Ingresamos al minitab y hacemos click en Stat>Basic statistics>1-sample Z... como se ve en la

figura siguiente

Los datos lo ingresamos en la columna C1 (Tiempo)

Nota: la desviación estándar de la muestra primero debemos encontrarlo. Para esto utilizamos

Stat>Basic statistics>Display Descriptive estatistics…

Finalmente los resultados de la prueba de hipótesis son

Page 15: Capítulo viii

Conclusión. como (p=0.763> =0.1) se acepta Ho. Por lo tanto los invitados están dentro del tiempo

tolerado.

Ejercicio 4. El control de calidad de una cooperativa que produce azúcar, verifica que la presentación

del producto en bolsas de 500 g. contenga dicha cantidad. Se obtuvo una muestra de 50 bolsas los

cuales tuvieron los siguientes pesos en gramos:

505 409 500 503 515 495 501 496 498 499 497 511 497 500 498 498 596 506 499 597 497 523 506 495 500 519 494 514 500 504 510 497 489 508 522 498 485 500 498 495 497 507 501 499 508 499 506 502 503 497

a) ¿Hay evidencia suficiente en base a esta muestra, de que el contenido de las bolsas es diferente a

500 g. si el nivel de significancia es 0.01?

b) Se obtuvo otra muestra, esta de 25 bolsas, con una media de 497 g. y una desviación de 10 g. y

con 5% de nivel de significancia. ¿Podemos afirmar la hipótesis de que las bolsas contienen

menos de 500 g.?

Solución

a) ¿Hay evidencia suficiente en base a esta muestra, de que el contenido de las bolsas es diferente a

500 g. si el nivel de significancia es 0.01?

Datos

μ = 500g

Para determinar la media y la desviación estándar utilizamos Minitab, de la siguiente manera

Ingresamos los datos en C1 como se ve en la figura y Hacemos clic en Stat>Basic statistics>Display

Descriptive estatistics…

Page 16: Capítulo viii

finalmente hacemos click en OK, el resultado es

Descriptive Statistics: C1 Variable N N* Mean SE Mean StDev Minimum Q1 Median Q3

C1 50 0 503.86 3.45 24.36 409.00 497.00 500.00 506.25

Variable Maximum

C1 597.00

Interpretación

N=50 (tamaño de la muestra)

Mean = 503.86 ( x media de la muestra)

StDev =24.36 (s Desviación estándar de la muestra)

Q1=497.00 (primer cuartil )

Median=500.00 (Me Mediana)

Q3=506.25 (tercer cuartil)

Hipótesis

Ho: μ = 500 g (el contenido es igual a 500g)

H1: μ ≠ 500 g (el contenido es diferente a 500g)

Para un nivel de significancia de 0.01 tenemos un nivel de confianza de 99%

Utilizando minitab se tiene

Finalmente hacemos clic on Ok luego en OK

Los resultados son

One-Sample Z: C1

Test of mu = 500 vs not = 500

The assumed standard deviation = 24.36

Variable N Mean StDev SE Mean 99% CI Z P

C1 50 503.860 24.360 3.445 (494.986, 512.734) 1.12 0.263

Conclusión

Page 17: Capítulo viii

Como (p=0.263) > ( =0.01) se acepta Ho, es decir el contenido es igual a 500g

b.¿Podemos afirmar la hipótesis de que las bolsas contienen menos de 500 g.?

datos

μ= 500 n = 25 bolsas

gx 497

s = 10 g. =5% = 0.05, osea que 1- = 0.95

Hipótesis

Ho: μ = 500 g (el contenido no es menos de 500g)

H1: μ < 500 g (el contenido es menos de 500g)

Utilizando minitab se obtiene

One-Sample Z Test of mu = 500 vs < 500

The assumed standard deviation = 10

95%

Upper

N Mean SE Mean Bound Z P

25 497.000 2.000 500.290 -1.50 0.067

Conclusión

Como (P=0.067) > ( =0.05) se acepta Ho, es decir el contenido no es menos de 500g.

Ejercicio 5. Calcular el valor de P para el ensayo de hipótesis en donde se quiere probar que la edad

promedio de los habitantes de una ciudad es superior a 65 años, se tomó una muestra de 50 habitantes

y se encontró que tenían una media de 60, una varianza es 2 años a un nivel de significancia de 0,05.

Page 18: Capítulo viii

03,3

18

7

1419

n

uxz

Solución

Datos

μ = 65 n = 50 60x Sha

= 2, =0.05

Hipótesis

Ho: u ≤ 65 (Edad promedio de la ciudad no es mayor a 65)

Ho: u > 65 (Edad promedio de la ciudad es mayor a 65);

Hacemos uso de MINITAB

One-Sample Z

Test of mu = 65 vs > 65

The assumed standard deviation = 1,4142

95%

Lower

N Mean SE Mean Bound Z P

50 60,0000 0,2000 59,6710 -25,00 1,000

DECISIÓN: Como (P=1)> (α=0,05), No se rechaza la Ho, o sea que no hay evidencia que la edad

promedio de la ciudad sea mayor de 65 año

Ejercicio 6. Un laboratorio farmacéutico afirma que el antiinflamatorio de su fabricación elimina la

inflamación en 14 minutos en los casos corrientes. Con la finalidad de comprobar estadísticamente

esta afirmación, se elige al azar 18 cerdas con inflamaciones varias y se toma como variable de

respuesta el tiempo transcurrido entre la administración del antiinflamatorio y el momento en que

desaparece la inflamación. Además, nos dicen que la variable tiempo transcurrido entre la

administración del antiinflamatorio y el momento en que desaparece la inflamación sigue una

distribución normal de media 14 y desviación 7. El tiempo medio de respuesta de la muestra fue de 19

minutos.

Se pide comprobar la afirmación del laboratorio a un nivel de significación de 0.05.

Solución:

Datos; 19x , μ = 14, σ= 7, n = 18

Hipótesis

Page 19: Capítulo viii

00,10

100

20

110130

n

uxz

Z0,05=1,645 Z=10

Zona de rechazo Ho Zona de Aceptación Ho

79.5

100

9.1

4.185.19

n

uxz

Z0,025 =-1,96 Z0,025 =1,96 Z=5.79

Zona de aceptación Ho

Zona

rechazo Ho

Zona

rechazo Ho

Ho: μ =14

H1: μ >14

Z0,05=1,645;

Luego como Z>Z0,05 se rechaza la Ho.

NOTA: A pesar que (n=18) < 30 utilizamos la distribución Z y no la t esto se debe a que

conocemos la desviación típica de la población σ =7

Ejercicio 7. Se ha tomado una muestra aleatoria de 100 individuos para determinar si tienen

hipertensión, a los que se ha medido la presión sistólica, obteniéndose una media muestral de 130

mmHg. Se sabe que la media y desviación típica normal de la población es respectivamente 110 y 20

mmHg.

¿Cual es su conclusión a un nivel de significancia de 0.05?

Solución

Datos

n = 100 mmHgx 130 μ = 110 mmHg = 20 mmHg

Hipótesis

Ho: μ = 110 (no sufren de hipertensión)

H1: μ > 110 (sufren de hipertensión)

Z0.05=1.645

Del gráfico concluimos que se rechaza la Ho, o sea los individuos sufren hipertensión.

Ejercicio 8. Se cree que la edad promedio de los alumnos que ingresan a la Universidad es de 18.4

años. De los alumnos anteriores se elige, al azar, una muestra de 100 y se encuentra que tienen una

edad promedio de 19.5 años con desviación típica 1.9 años. De su opinión al respecto, con un nivel de

significancia de 0.05.

Solución

Datos

n = 100 añosx 5.19 μ = 18.4 años s = 1.9 años

Hipótesis

Ho: μ = 19.5 (la edad promedio es 18.4)

H1: μ ≠ 19.5 (la edad promedio es diferente a 18.4)

Page 20: Capítulo viii

n

Zx

n

Zx2/

;2/

200

1.000.12;

200

1.000.12 007.2;993.1

n

Zx

n

Zx2/

;2/

200

1.000.22;

200

1.000.22 014.2;986.1

n

Zx

n

Zx2/

;2/

200

1.000.32;

200

1.000.32 021.2;979.1

96.19.0

25.0

nn

uxz

Z0.025=1.96

Del gráfico concluimos que se rechaza la Ho, o sea la edad promedio es diferente a 18.4

Ejercicio 9. Las medidas de los diámetros de una muestra tomada al azar, de 200 cojinetes de bolas,

hechos por una determinada máquina, dieron una media de 2 cm y una desviación típica de 0,1 cm.

Hallar los intervalos de confianza del:

a. 68,26%

b. 95,44%

c. 99,73%

Para el diámetro de todos los cojinetes.

Solución

n = 200, 2x , s=0.1,

a. 1- =0.6826

= =

b. 1- =0.9544

= =

c. 1- =0.9973

= =

Ejercicio 10. Se sabe que el contenido de lactosa de cierto alimento lácteo sigue una distribución

normal, cuya varianza es conocida, teniendo un valor de 0.81. Se desea estimar el valor de la media

poblacional mediante el valor de la media de una muestra, admitiéndose un error máximo de 0,25 con

una confianza del 95%. ¿Cuál ha de ser el tamaño de la muestra?

Solución

Datos. 2=0.81 entonces =0.9 si 1- = 0.95 entonces =0.05,

e = 0.25 = x - μ Para =0.05, de la tabla (dos colas) se tiene z /2=1.96

25.0

9.096.1 xn , n=49.79,

Luego la muestra debe ser 50 como mínimo

68.26% 95.44% 99.73%

-z /2 z /2

x1 x2

Page 21: Capítulo viii

n

Zx

n

Zx2/

;2/

64

596.114;

64

596.114 22.15;78.12

Ejercicio 11. En una determinada población estudiantil, la nota sigue una distribución normal

N(14,5). Si se extrae una muestra aleatoria de 64 alumnos y para un nivel de significación del 5%, ¿en

qué condiciones se rechazaría la hipótesis de que la media de la población es de 14?

Solución

Datos

Para =0.05 z=1.96 (dos colas)

La hipótesis se rechazaría cuando el valor de la media de la muestra no pertenezca al intervalo de

confianza siguiente.

= =

Ejercicio 12. Tras realizar un test de cultura general entre los habitantes de cierta población, se

observa que las puntuaciones siguen una distribución normal, de media 68 y desviación típica 18. Se

desea clasificar a los habitantes en tres grupos (de baja cultura general, de cultura general aceptable,

de cultura general excelente), de manera que el primer grupo abarque un 20% de la población, el

segundo un 65% y el tercero el 15% restante. ¿Cuáles son las puntuaciones que marcan el paso de un

grupo a otro?

Solución

Datos. =18 μ =68

=0.20 (baja cultura),

=0.65 (cultura media), =0.15 (alta cultura)

x1= u-z1 =68-0.84(18)= 52.85 x2= u+z2 =68+0.84(18)=83.15

9.1.4 EJERCICIOS PROPUESTOS

Ejercicio 1. En una fabrica de productos lácteos, una muestra de 100 unidades, dieron en promedio

un peso de 1.35 kg., con una desviación estándar de 0.2 kg. ¿Se puede asegurar para un α = 0,05 que

los pesos de los productos esta por debajo de 1.5 kg?

Ejercicio 2. Una empresa estudia introducir un nuevo sistema de producción para mejorar su

productividad media establecida actualmente en 40 unidades por persona diaria.

Se estima que el cambio no será rentable si no consigue elevar dicho numero por encima de 44 u.

Realizada una prueba con la nueva tecnología, aplicada a 40 personas, se obtuvo una producción

media de 45 y no se observó ningún cambio apreciable en la dispersión que estaba establecida en

=1.0 u. por día. ¿Se debe efectuar el cambio tecnológico?

Ejercicio 3. La policía afirma que las denuncias por robo son resueltas en 10 días en promedio, con

una varianza de 4. Se hizo una encuesta a una muestra de 200 denunciantes cuyas denuncias fueron

resueltas y se encontró que sus casos fueron resueltos en 15 día en promedio, considere una

población normal, si = 0.05, que opina de la afirmación de la policía.

0.65 0.20 0.15

z1 z2

x2 x2

Page 22: Capítulo viii

Ejercicio 4. En la etiqueta de un producto comestible figura que el tiempo de duración de este es de

100 días, se eligió una muestra aleatoria de 60 artículos y se comprobó que su tiempo de duración fue

de 80 días con una varianza de 16. ¿Se puede afirmar a nivel de significación 0,05 que el tiempo de

duración media de los productos es 100 días?.

Ejercicio 5. Una encuesta realizada a 164 trabajadores de una fábrica, concluyó que el sueldo medio

es de s/. 600 con una desviación típica de 64. ¿El salario medio es mayor o igual que 500 a un nivel de

significación del 5%?

Ejercicio 6. En estudios previos se ha determinado que el nivel de colesterol promedio de pacientes

con problemas cardíacos es 222. Un cardiólogo piensa que en realidad el nivel es más alto y para

probar su afirmación usa la muestra siguiente. ¿Habrá suficiente evidencia estadística para apoyar la

afirmación del cardiólogo? Justificar su contestación.

217 245 217 226 202 233 235 242 219 221 223 238 225 216 199 224 236 218 215 240

234 248 226 221 217 210 205 222 220 210 215 220 240 230 214 210

Ejercicio 7. Un profesor universitario está interesado en determinar si las computadoras mejoran el

rendimiento de sus alumnos de estadística. Con este propósito seleccionó aleatoriamente 35

estudiantes del tercer ciclo y después de facilitarles el uso de computadoras durante un semestre,

determinó que las notas fueron en promedio 15 con varianza de 4. Si los promedios de estadística en

años anteriores eran de 12, y se consideran pruebas normalizadas, Utilizando α= 0.01, determine la

conclusión a que llegó el profesor?.

Ejercicio 8. Se sabe que el sueldo anual de los trabajadores de una empresa sigue una distribución

normal de media desconocida y desviación típica de s/500. Se ha observado el sueldo anual de 36

trabajadores de dicha empresa escogidos al azar, y se ha obtenido un valor medio de s/. 2400.

Probar la hipótesis, a un nivel de significación del 5%, si la media de la distribución muestral es de

s/2500.

a. ¿Cuáles son las hipótesis nula y alternativa del contraste?

b. Determina la forma de la región crítica.

c. ¿Se acepta la hipótesis nula con el nivel de significación indicado?

Ejercicio 9. El MTC afirma que los pasajes de taxi local son de s/5.00 Para saber si es cierto, se toma

una muestra de 36 taxis, resultando que el precio medio es de s/6.5 con desviación estándar s/0.50

.Tiene razón el MTC al 95% de confianza.

Ejercicio 10. Se quiere estudiar la vida media μ de unas resistencias producidos en una empresa. Por

experimentos anteriores, se piensa que la desviación típica de la población es 90h. Al extraer una

muestra de 80 resistencias, se encuentra una media de 1700h. a. Contrastar la hipótesis de que μ=1650

h, frente a la alternativa μ≠1650; b. Ídem., frente a la alternativa μ >1650.

Ejercicio 11. Se quiere probar la eficacia de una dieta para bajar de peso. El promotor afirma que en

un mes los participantes bajaría 5kg, para comprobar se puso a dieta a 66 personas, luego de un mes

se obtuvo una disminución de peso en promedio 4kg y una desviación estándar de 1.0 kg. a. Con un

99% de confiabilidad, ¿puede afirmarse que es cierto la afirmación del promotor?.

b. Con un 95% de confiabilidad, ¿puede afirmarse que es cierto la afirmación del promotor?.

Ejercicio 12. Una variable aleatoria sigue una distribución N(μ, 144) con μ desconocido.

a) ¿Se descartaría la hipótesis μ = 15 en favor de la alternativa μ ≠ 15, para α= 0.05,

Page 23: Capítulo viii

si una muestra aleatoria de n = 64 observaciones arroja una media igual a 20? b) Construir un intervalo de confianza del 95% para μ. c) Considerando la misma hipótesis del punto a), ¿qué sucedería con un nivel de significación del 1%? d) Construir un intervalo de confianza del 99% para μ.

e) Probar H0: μ = 15 versus H1: μ > 15 para α = 0.05 y α = 0.01. Comparar con los

resultados obtenidos en los puntos a) y c).

Ejercicio 13. El gerente afirma que el contenido promedio de los botellas envasadas por su

representada es igual a 320ml. Suponga que los datos provienen de una población aproximadamente

normal. Para confirmar lo dicho por el gerente, se toma una muestra de tamaño 10, y encuentra que la

media es 300 ml. Con un nivel de confianza de 95% , determinar si tiene razón el gerente.

Ejercicio 14. Una muestra aleatoria de 100 muertes registradas en un país el año pasado muestra una

vida promedio de 71.8 años. Suponga una desviación estándar poblacional de 8.9 años, ¿esto parece

indicar que la vida media hoy en día es mayor que 70 años? Utilice un nivel de significancia de 0.05.

Ejercicio 15. Los trabajadores de una empresa que utilizan el autobús regular se quejan de que éstos

se están retrasando en media más de un cuarto de hora. Para comprobarlo han anotado el retraso de

algunos días elegidos al azar. Los datos fueron:

12 36 17 15 19 25 5 10 17 5 12 11 17 9 6 15 22 35 5 14 23 15 25 35 17 16 15 11 13 7 23 2 25 14 16 3 25 9 23 26 11 16 17 8 4 12 18 4 21 7 16 17 25 26 7 13 24 6 8 23 24 16 6 14 9 14 26 3 14 8 24 6 24 42 24 6 4 7 12 7 4 3 11 22 14 26 12 42 22 11 19 20 23 16 13 6 6 14 18 5

A nivel de significación del 10 %, ¿crees que tienen razón los trabajadores?

Ejercicio 16. Un equipo de psicólogos está estudiando el efecto del estrés sobre la presión arterial en

alumnos de la UNHEVAL. El equipo afirma que la presión sistólica media en varones jóvenes

estresados es mayor que 18 cm de Hg. Se toma una muestra de 36 alumnos y se encuentra que

6,35,18 sx ; ¿Se puede afirmar que el equipo tenía razón?

Ejercicio 17. Plantee y resuelva como mínimo 4 ejercicios, de prueba de hipótesis tomando como

datos problemas de su área.

Page 24: Capítulo viii

n

uxz

o

n

s

uxt

o

nZx

nZx

2/2/

n

stx

n

stx

nn )1,2/()1,2/(

9.2 PRUEBA DE HIPÓTESIS PARA LA MEDIA POBLACIONAL: MUESTRAS

PEQUEÑAS

9.2.1 INTRODUCCIÓN

Para realizar pruebas de hipótesis acerca de la media el tamaño de la muestra es pequeño, es necesario

el supuesto de normalidad en las muestras. Supongamos que 1 2 n

X , X , , X es una muestra

aleatoria de una población normal con media μ y varianza σ, la

n

s

xT tiende a una distribución t

con n-1 grados de libertad.

Se quiere probar las hipótesis

Hipótesis

Caso I Caso II Caso III

Ho : = 0

H1 : < 0

Ho : = 0

H1 : ≠ 0

Ho : = 0 H1 : > 0

9.2.2 SUPUESTOS

1. Las muestras son muestras aleatorias simples.

2. La muestra es pequeña (n < 30)

3. Los valores de la muestra provienen de una población con una distribución normal o

aproximadamente normal.

Estadístico de prueba.

a). Se conoce la 2 poblacional (pocas veces sucede) b) Se desconoce la

2 poblacional

1-nt~

Intervalo de Confianza. del 100(1- )% para la media poblacional , es de la forma:

a) Se conoce la varianza poblacional σ2. b) Se desconoce la varianza poblacional σ

2.

Donde:

n : Tamaño de la muestra

x : Media de la muestra

μ : Media de la población

Page 25: Capítulo viii

8

4

5

10

16

5

3545

n

s

uxt

: Desviación estándar poblacional

s : desviación estándar de la muestra

n-1 : grados de libertad

Nota: para encontrar la media y la desviación estándar se utiliza las siguientes formulas

1

221

n

xnxs

n

xi

x

n

i

Nota: para determinar si la distribución es normal, podemos utilizar las pruebas de Anderson-

darlin, shapiro-Will o Kolmogorov-Smirnov ver ejercicio 3

9.2.3 EJERCICIOS RESUELTOS

Ejercicio 1. El peso medio en mujeres comprendidas entre 30 y 40 años, es de 35kg. Un estudio

realizado en 16 mujeres con edades comprendidas en el intervalo anterior y que siguen una dieta

vegetariana da un peso medio de 45kg. Con una desviación típica de 5kg. Considerar distribución

normal.

a. Puede considerarse que la dieta vegetariana produce una modificación del peso medio de las

mujeres?.

b. Dar un intervalo de confianza al 95%, para de las vegetarianas

Solución.

Datos

n =16; α=0,05;

a) Puede considerarse que la dieta vegetariana produce una modificación del peso medio de las

mujeres?.

Hipótesis

Ho: μ = 35 (La dieta vegetariana NO produce modificaciones en el peso de las mujeres)

H1: μ ≠ 35 (La dieta vegetariana SI produce modificaciones en el peso de las mujeres).

Como la población es normal y n<30 se usa la tabla de una cola t (α,n-1)= t (0,05,15) = 2,131

Si t > t (0,05,15) = se rechaza la Ho

Decisión: como (t=8) > (t (0,05,15) = 2,131), se rechaza Ho, o sea la dieta si produce modificaciones

b. INTERVALO:

t(0,05,15) =-2,131 t(0,05,15) =2,131 t=8

Zona de aceptación Ho

Zona

rechazo Ho

Zona

rechazo Ho

Page 26: Capítulo viii

One-Sample T Test of mu = 35 vs not = 35

N Mean StDev SE Mean 95% CI T P

16 45,0000 5,0000 1,2500 (42,3357; 47,6643) 8,00 0,000

6643.47;3357.4216

5131.245;

16

5131.245

n

stx

n

stx

nn 1,()1,(;

Solución en MINITAB

Ingresamos al minitab y hacemos click en Stat >Basic statistics >1-sample t.. como se ve en la

figura siguiente

Los resultados son los siguientes

DECISIÓN: Como (P = 0,000) < (α = 0,05) luego se rechaza Ho.

INTERVALO: (42,3357; 47,6643) al 95%

Ejercicio 2. En un muestreo realizado entre los empleados de una multinacional se eligieron al azar

15 empleados y se anotó su sueldo mensual obteniéndose los siguientes datos: 1285, 1152, 1546,

1423, 1120, 1660, 956, 1250, 1812, 1120, 1553, 1056, 1163, 1358 y 1457. El gerente afirma que el

sueldo medio de sus trabajadores está por encima de los 1500 y los sindicatos afirman que es de 1400.

Sabiendo que los sueldos en esa multinacional se distribuyen de forma aproximadamente normal,

Crees que lo que dice el gerente es cierto?

Solución.

Datos

Page 27: Capítulo viii

738,2

15

105,244

15004,1327

n

s

uxt

t = – 2,734 t(14;0,05)=1,761

Zona de rechazo Ho Zona de Aceptación Ho

n = 15 μ=1500 (sueldo promedio según el gerente) s = ¿? ¿?x

Primero hallamos s y x

15

14571358116310561553112018121250956166011201423154611521285x

4,132715

19911x

115

)4,1327(15)14571358.............154611521285(222222

s

s = 244,105

Prueba de Hipótesis

Ho: μ=1500 (sueldo promedio no es mayor que 1500)

H1: μ>1500 (sueldo promedio es mayor a 1500, según el gerente)

Estadístico de prueba

Como la población es aproximadamente normal y n<30 , utilizamos la prueba t de student

Para decidir si rechazamos Ho o aceptamos Ho, construimos la grafica y determinamos el valor de

t, de la tabla. t(14;0,05) =1,761

Conclusión.

Como t=–2,739 cae en la zona de aceptación aceptamos Ho, es decir que el gerente esta equivocado,

el sueldo de los trabajadores no es mayor que 1500.

Ejercicio 3. Un fabricante de lámparas eléctricas sostiene que la duración media de las mismas

(horas) es en promedio superior a 1300 h. Se toma una muestra de 16 lámparas siendo el resultado de

la inspección el siguiente:

980 1350 1020 1140 1520 1390 1205 1180 970 1420 1850 1300 1305 1040 1050 1520

Verificar la Ho del fabricante con un coeficiente de riesgo del 5%.

Solución

Datos

μ= 1300 n =16

Page 28: Capítulo viii

?x

s = ? = 0.05

Primero

Dado que no sabemos si la población es normal; entontes debemos determinar si la distribución es

normal, para eso aplicamos la prueba de Kolmogorov-Smirnov de Minitab

Ho: la distribución es normal

H1: la distribución no es normal

Si P-value es mayor que 0.05, la distribución se considera normal.

Hacemos click en >Stat>Basic Statistics>Normality Test…,

Los datos lo ingresamos en la columna C3. y hacemos click en OK, para obtener los resultados

Los resultados son

Page 29: Capítulo viii

C3

Perc

ent

200018001600140012001000800600

99

95

90

80

70

60

50

40

30

20

10

5

1

M ean

>0.150

1265

S tD ev 241.3

N 16

KS 0.126

P -Valu e

P robability P lot of C3

Norm al

Tenemos que p-Value puede tomar valores mayores a 0.150

Para un nivel de significancia de 0.05

(p-value=0.15) > ( =0.05), luego se acepta la hipótesis nula, es decir la distribución es normal, en el

grafico puede confirmar esta afirmación.

Segundo

Sabiendo que la distribución es normal para nuestro ejemplo aplicamos la prueba de t de estudents

Hipótesis

Ho: μ ≤ 1300 (La duración de las lámparas no es mayor que 1300)

H1 : u >1300 (La duración de las lámparas es mayor que 1300)

Utilizando MINITAB tenemos:

Ingresamos las horas en C3, luego ejecutamos las opciones Stat/Basic statistics/1-sample t.., luego

completamos los datos como se ve en la figura y clickeamos ok, ok

Page 30: Capítulo viii

cmS

cmX

10

170

2

5

10

4

25

10

174170

n

s

uxt

Los resultados son:

One-Sample T: C3 Test of mu = 1300 vs > 1300

95%

Lower

Variable N Mean StDev SE Mean Bound T P

C3 16 1265.00 241.32 60.33 1159.24 -0.58 0.715

Decisión

T= – 0,58; t(0,05;16) = 1,746

Luego 0,56 < 1,756, se acepta Ho.

También (p = 0,705)> (α=0,05) luego se acepta Ho. Es decir que la duración de las lámparas no es

mayor que 1300 horas.

Ejercicio 4. Conocemos que las alturas X de los individuos de una ciudad, se distribuyen de modo

gaussiano. Deseamos contrastar con un nivel de significación de α = 0, 05 si la altura media es

diferente de 174 cm. Para ello nos basamos en un estudio en el que con una muestra de n = 25

personas se obtuvo:

Solución:

Como n< 30 se toma la prueba de t de student por ser la distribución gaussiana (normal)

El contraste que se plantea es:

H0: μ = 174 (la altura media es igual a 174)

H1: μ ≠ 174 (la altura media es diferente a 174)

La técnica a utilizar consiste en suponer que H0 es cierta y ver si el valor que toma el estadístico

Cae dentro de la zona de rechazo de Ho.

Conclusión.

Como t= –2, cae dentro la zona de aceptación de Ho, además (t= –2) < (t(0,05,24)=– 2,064) se acepta Ho,

es decir la altura media es igual a 174

En MINITAB teems:

One-Sample T Test of mu = 174 vs not = 174

N Mean StDev SE Mean 95% CI T P

t(0,05,24) =-2,064 t(0,05,24) =2,064 t= – 2

Zona de aceptación

Ho

Zona

rechazo Ho

Zona

rechazo Ho

t(0.05,24)=-2.064 t=-2 t(0.05,24)= 2.064

Page 31: Capítulo viii

18.11

20

2

4540

n

s

uxt

n

tx

n

txss

2/;

2/20

209.240;

20

209.240

25 170,000 10,000 2,000 (165,872; 174,128) -2,00 0,057

Aquí su interpretación:

Test of mu = 174 vs not = 174

Prueba de la media (Ho: μ = 174) vs (Ho: μ ≠ 174)

N Mean StDev SE Mean 95% CI T P

n

Media

Desviación Estándar

Cuadrado medio

del error

Intervalo de confianza al 95%

Valor T Valor P

25 170,000 10,000 2,000 (165,8722; 174,1278) -2,00 0,057

La interpretación es la misma que se hace en el caso manual ya visto anteriormente.

Pero hay otra forma de tomar la decisión de aceptar la Ho y esto se hace con el Valor P;

Si Valor P ≤ α se rechaza la Ho de lo contrario se Acepta.

En este caso tenemos que Valor P=0,057 y α=0,05

Conclusión: Dado que Valor P es mayor que α entonces se acepta la Ho. y esta decisión es la misma

que vimos anteriormente.

Ejercicio 6. Con objeto de estimar el peso de los niños de un jardín se tomó una muestra aleatoria al

azar de 20 niños. Se encontró una media de 40 kg y una varianza de 4 kg.

Suponiendo que la muestra se distribuye normalmente.

d. Pruebe la hipótesis de que la media es menor que 45kg. con =0.05

e. Determine un intervalo de confianza al 95% para la media.

Solución.

Datos n=20, x =40, s= 2

a. Ho: μ ≥ 45 (La media no es menor que 45 kg)

H1: μ < 45 (La media es menor que 45 kg)

t(0,05;19) = 1,729

Conclusión. Como (t=11.18)> (t(0,05;19) = 1,729) se rechaza Ho o sea la media es menor que 45kg

b. Intervalo de confianza a 95% t0.05/2=2.09

= = (39.06; 40.94)

Page 32: Capítulo viii

162.3

10

2

3032

n

s

uxt

5.2

25

4

198200

n

s

uxt

Ejercicio 7. Un empresario de una editorial, paga un salario mensual de s/.1000 si un vendedor vende

mas 100 libros a lo mucho en 30 días, de lo contrario solo paga s/.5 por libro vendido, un grupo de 10

vendedores vendió mas de 100 libros en 32 días, con un varianza de 4 días, si la distribución de las

ventas se considera normal, con una confianza de 0.95, ¿Cobran s/1000 cada vendedor?.

Solución

Datos n=10, x =30, s=2

Ho: μ ≤ 30 (Cobran los s/1000)

H1: μ > 30 (No cobran los s/1000)

t(0,05;9) = 1.833

Conclusión. Como (t=3.162)> (t(0,05;9) = 1.833) se rechaza Ho o sea no cobran los s/ 1000.

Ejercicio 8. Una muestra de 25 familias de una ciudad pagan en promedio por servicios s/ 200

mensual y una varianza de s/16. Se trata de ver si esta muestra es consistente con la Ho que la media

en la ciudad por servicios es de s/ 198, con una confianza de 99%, considerar la distribución normal.

Solución

Datos n=25, x =200, s=4

Ho: μ = 198 (La media de la ciudad es s/198)

H1: μ ≠ 198 (La media de la ciudad no es s/198)

t(0,005;24) = 2.797

Conclusión. Como (t=2.5)< (t(0,005;24) = 2.797) no se rechaza Ho o sea la media de la ciudad es s/198.

Ejercicio 9. Un fabricante de mantequilla quiere comprobar si el peso promedio de cada paquete es de

100 g. Se toma una muestra de 15 paquetes siendo el resultado de la inspección el siguiente:

98.7 99.5 100.2 99.7 100.5 98.8 100.0 98.6 99.1 100.3 100.2 100.4 101.0 99.0 100.0

Verificar la Ho del fabricante con un coeficiente de riesgo del 5%.

Solución.

Primero determinamos si la distribución es normal.

Aplicando kolmogorov-Smirnov de minitab

Se tiene que p-value=0.150 esto es mayor que 0.05, luego la distribución es normal, podemos aplicar

la t de estuden para probar nuestra hipótesis.

Segundo

Page 33: Capítulo viii

41.1

15

744.0

10073.99

n

s

uxt

828.2

18

3

108

n

s

uxt

6.1

9

5.1

622.61

n

s

uxt

Datos n=15, x =99.73, s=0.7442

Hipótesis

Ho: μ = 100 (El paquete pesa en promedio 100 g)

H1: μ ≠ 100 (El paquete no pesa en promedio 100 g)

t(0,025;14) = 2.145

Conclusión. Como (t=1.41)< (t(0,025;14) = 2.145) no se rechaza Ho o sea el paquete pesa en promedio

100 g.

Ejercicio 9. El aumento de peso promedio de 18 vacas bajo una dieta alimenticia durante dos meses

fue de 8 kg con una s=3kg. Se desea probar si es válido afirmar que esta ración aumenta el peso al

menos en 10 kg. durante los dos meses con un nivel de significación del 5%, considerar distribución

normal.

Solución.

Datos n=18, x =8, s=3

Ho: μ ≥ 10 (El peso aumenta al menos en 10 g)

H1: μ < 10 (El peso no aumenta al menos en 10 g)

De la tabla t se tiene t(0,025;14) = 1.740

Conclusión. Como (t=2.828)> (t(0,05;14) = 1.740) se rechaza Ho o sea el peso no aumenta al menos en

10 g.

Ejercicio 10. Un fabricante que elabora alimento balanceado, desea comprobar que los pesos de los

paquetes tienen un promedio 60kg. En una muestra de 9 paquetes tomados al azar se obtuvo una

media de 61.2 kg. con una desviación de 1.5 kg. si la distribución es normal ¿Que a comprobado el

fabricante con un nivel de significación del 1% ?

Solución.

Datos n=9, x =61.2, s=1.5

Ho: μ = 60 (El peso promedio es 60 kg)

H1: μ ≠ 60 (El peso promedio no es 60 kg)

De la tabla t se tiene t(0,005;8) = 3.355

Conclusión. Como (t=1.6)< (t(0,005;8) = 3.355) no se rechaza Ho o sea el peso promedio es 60 kg.

9.2.4 EJERCICIOS PROPUESTOS

Ejercicio 1. La corporación Tampico desea saber cuál es la máxima tensión de ruptura que soportan

los cables de acero que fabrica. Un cliente importante está interesado en la compra de un número

grande de cables y ha establecido que el punto de ruptura no debe ser menor que un tonelada.

Tampico piensa que una tonelada es aproximadamente el punto de ruptura de los cables, pero decide

Page 34: Capítulo viii

probar la hipótesis de que la tensión de ruptura promedio es una tonelada. La muestra es de 10,

=0.05, x= 0.96, s=0.15

Ejercicio 2. Se tiene las siguientes pruebas de hipótesis

Ho: μ= 20

H1: μ≠ 20

Los datos de una muestra de 6 elementos son 16, 20, 18, 19, 20, 18

a. Calcule la media de la muestra

b. Encuentre la desviación estándar de la muestra

c. Con α=5%, cual es la regla de rechazo

d. Calcule el valor del estadístico t

e. ¿Cuál es su concusión?

f. ¿Que puede decir acercad del valor p?

Ejercicio 3. Se tiene la siguiente prueba estadística

Ho: μ= 10

H1: μ< 10

Con una muestra de 15 datos se obtuvo una s=5, use α=5% determine el valor de t y su conclusión

para cada uno de los siguientes resultados

a) x = 9 b) x = 11 c) x = 8.5 d) x = 9.5 e) x = 12

Ejercicio 4. Un cardiólogo desea hallar un intervalo de confianza del 90% para el nivel colesterol

promedio de todos los pacientes que presentan problemas cardíacos. Para esto asume que la

distribución de los niveles de colesterol es normal con una desviación estándar = 13 y usa la

siguiente muestra al azar de niveles de colesterol de 20 pacientes con problemas cardíacos.

217 223 225 245 238 216 217 226 202 233 235 242 219 221 234 199 236 248 218 224

Ejercicio 6. El pH medio del agua que sale de una planta de tratamiento debe ser de 7.0. La autoridad

sospecha que es posible que cierta planta no cumpla con la normativa. Se tomaron 15 muestras de

agua de esa planta y se obtuvo un pH de 6.7, 7.1, 6.8, 6.9, 7.3, 7.5, 6.5, 6.6, 7.3, 7.1, 6.3, 6.8, 7.0, 7.1

y 6.8. Sabiendo que el pH varía según una distribución normal, ¿hay razón para dudar que se

mantenga la especificación?

Ejercicio 7. Dos secciones de un curso de estadística son sometidas a un mismo examen final. De las

calificaciones obtenidas se extrae una muestra aleatoria de tamaño 9 en la grupo "A", y otra de tamaño

4 en el grupo "B".

Grupo "A": 65, 68, 72, 75, 82, 85, 87, 91, 95

Grupo "B": 50, 59, 71, 80

a. Con un nivel de significación de 0.05 ¿podría decirse que los dos grupos tienen las mismas

calificaciones promedio?. Suponga que provienen de poblaciones normales con varianzas iguales.

Ejercicio 8. La experiencia en la investigación de demandas por accidentes en una institución

aseguradora revela que en promedio cuesta $60 la realización de los trámites. Este costo se consideró

exorbitante en comparación al de otras compañías aseguradoras y se instauraron medidas para reducir

costos. A fin de evaluar el impacto de las medidas, se seleccionó una muestra de 16 demandas

recientes. Se encontró un costo promedio de $57 y una desviación estándar de $10. Elabore una

prueba de hipótesis que permita comprobar si los costos han disminuido, con un 99% de confianza.

Ejercicio 9. Por registros pasados se sabe que la duración promedio de unas pilas eléctricas que se

fabrican para ser utilizadas en un reloj digital es de 300 días.

Hace poco tiempo, el proceso de fabricación fue modificado para darle mayor duración. Para

comprobar la efectividad del proceso modificado, se probó una muestra de 20 pilas, y se encontró una

Page 35: Capítulo viii

duración promedio de 311 días y una desviación estándar de 12 días. A un nivel de significación de

0,05, ¿puede afirmarse que el nuevo proceso aumenta la duración de las pilas?

Ejercicio 10. Un gerente de ventas de libros universitarios afirma que en promedio sus representantes

de ventas realizan 40 visitas a profesores por semana. Varios de estos representantes piensan que

realizan un número de visitas promedio superior a 40. Una muestra tomada al azar con 8 semanas

reveló un promedio de 42 visitas semanales y una desviación estándar de 2 visitas. Utilice un nivel de

confianza del 99% para aclarar esta cuestión.

Ejercicio 11. Cuando la cantidad de semillas de soja que quedan en el suelo luego de pasar la cosechadora es igual o mayor a 80 semillas/m2, la pérdida de producción, en qq/ha, es grande. Un productor decide probar el funcionamiento de su máquina y para ello luego de cosechar una parcela cuenta en 10 unidades de 1 m2 cuántas semillas quedan en el suelo. Los resultados fueron, en semillas/m2: 77 73 82 82 79 81 78 76 76 75 a) ¿Se puede concluir, trabajando con un nivel de significación del 10%, que la cosechadora está funcionando bien?, es decir, ¿está la perdida dentro de los límites admisibles?

b) Construir un intervalo de confianza para μ apropiado para el problema.

Ejercicio 12. Referido al problema 11.

a) Si las normas técnicas indican que la desviación estándar del número de semillas caídas por m2 no debería ser superior a 5, ¿qué se debería concluir sobre la máquina trabajando

con un nivel de significación α = 0.10?

b) Construir un intervalo de confianza para σ2.

Ejercicio 13. Los registros de una comercializadora de repuestos para vehículos revelaron que la

duración promedio de un juego de bujías es de 44.000 kilómetros. Un fabricante de bujías, sin

embargo, afirmó que su producto tiene una vida media superior a este valor. El propietario de una

flotilla de camiones adquirió 18 bujías, como prueba. Encontró una duración promedio de 42.400

kilómetros y la desviación 1.500. Esta información muestral convenció al propietario. ¿Y a Ud.?

Ejercicio 14. Una cadena de talleres para la afinación de motores de automóvil anuncia que su

personal puede realizar el servicio completo (cambio de aceite, cambio del filtro de aceite, lavado y

engrase de motor) en un promedio de 15 minutos. Sin embargo, la gerencia ha recibido quejas de los

clientes en relación al tiempo de servicio. Para verificar la afirmación, la oficina muestreó a 21

automóviles, obteniendo una media de atención de 18 minutos y una desviación de 1 minuto.

Utilice un nivel de significación de 0,05 para probar si es razonable la afirmación de la cadena de

talleres.

Ejercicio 15. Se instala una máquina para llenar botellas pequeñas con 9,0 gramos de medicamento.

Se piensa que el peso medio es de menos de 9,0 gramos. Una muestra de llenado se da a continuación.

Pruebe la afirmación con un 99% de confianza.

9,2 8,7 8,9 8,6 8,8 8,5 8,7 9,0

Ejercicio 16. Se desea estudiar el gasto semanal de fotocopias, de los estudiantes de la UNHEVAL.

Para ello, se ha elegido una muestra aleatoria de 9 de estos estudiantes, resultando los valores

siguientes para estos gastos: 100 150 90 70 75 105 200 120 80

Se supone que la variable aleatoria objeto de estudio sigue una distribución normal de media

desconocida y de desviación típica igual a 12.

Determina un intervalo de confianza del 95% para la media del gasto semanal en fotocopias por

estudiante.

Page 36: Capítulo viii

Ejercicio 17. Se sabe que la desviación típica de las notas de cierto examen es 0,4. Para una muestra

de 36 estudiantes se obtuvo una nota media de 5,6. ¿Sirven estos datos para confirmar la hipótesis de

que la nota media del examen fue de 6, a un nivel de significación de 0,05?

Ejercicio 18. Cuando fue contratado como mesonero de un restaurante, a un caballero se le dijo que

obtendría S/.20 por día en propinas. Al cabo de 25 días de trabajo, el mesonero piensa que no obtuvo

tanto en propinas. El restaurante le pidió cuentas de sus propinas durante el mes: había recibido S/.

450 en los 25 días.

Así mismo, se determinó con los datos muestrales que la desviación estándar fue de S/. 3. por día.

¿Puede el mesonero sostener estadísticamente su opinión, al 95% de confianza?

Ejercicio 19. Pruebe la hipótesis de que el contenido promedio de los envases de un lubricante en

particular es de 10 litros si los contenidos de una muestra aleatoria de 10 envases son: 10.2, 9.7, 10.1,

10.3, 10.1, 9.8, 9.9, 10.4, 10.3 y 9.8 litros. Utilice un nivel de significancia de 0.01 y suponga que la

distribución del contenido es normal.

Ejercicio 20. Una muestra de 9 explotaciones agrícolas arrojó una media de 125 ha y un desvío de 25

ha. Testar si se puede suponer con bastante confiabilidad que el promedio verdadero de la población

de explotaciones puede ser 135 ha.

Page 37: Capítulo viii

2

2

2

1

2

1

2121)(

nn

uxxz

2

2

2

1

2

1

2121)(

n

s

n

s

uxxtz

2

2

2

1

2

1

2/2121

2

2

2

1

2

1

2/21nn

Zxxnn

Zxx

2

2

2

1

2

1

2/2121

2

2

2

1

2

1

2/21n

s

n

sZxx

n

s

n

sZxx

9.3 PRUEBA DE HIPÓTESIS SOBRE LA DIFERENCIA ENTRE MEDIAS: MUESTRAS

GRANDES

9.3.1 INTRODUCCIÓN

Supóngase que se tiene dos poblaciones independientes con medias desconocidas μ1 y μ2, y

varianzas σ12 y σ2

2. Sean

1x y

2x las medias de las muestras de dos poblaciones. El tamaño de cada

una de estas muestras son n1 y n2 respectivamente.

Queremos observar si la diferencia entre las medias es significativa o no, es decir.

Hipótesis

Caso I Caso II Caso III Ho: μ1 – μ2 ≥ Δ H1 : μ1 – μ2 < Δ

Ho: μ1 – μ2 = Δ H1 : μ1 – μ2 ≠ Δ

Ho: μ1 – μ2 ≤ Δ H1 : μ1 – μ2 > Δ

9.3.2 SUPUESTOS

1. Las observaciones de las muestras son aleatorias 2. Las poblaciones son independientes 3. Los tamaños de las muestras son n 1≥ 30 y n2 ≥30 4. Las poblaciones son normales o cumplen las condiciones del teorema del límite central.

Estadístico de prueba

a) Varianzas conocidas 12 y 2

2 b) Varianzas desconocidas 1

2 y 2

2

Intervalo de Confianza. Del 100(1- )% para la diferencia de medias poblacionales 1- 2, es de la

forma:

a) Se conoce la varianza poblacional σ2. b) Se desconoce la varianza poblacional σ

2.

Donde:

n1: Tamaño de la muestras 1; n2 : Tamaño de la muestras 2

1x : Media de la muestra 1 ,

2x : Media de la muestra 2

μ1 : Media de la población 2; μ2 : Media de la población 2;

1 : Desviación estándar poblacional 1 ; 2 : Desviación estándar poblacional 2

s1 : desviación estándar de la muestra 1; s : desviación estándar de la muestra 2

Page 38: Capítulo viii

Z0,025=-1,96 Z0,025 =1,96 Z= – 1,38

Zona de aceptación Ho

Zona rechazo Ho

Zona rechazo Ho

38,1

56

169

42

225

)0(7874)(

2

2

2

1

2

1

2121

n

s

n

s

uxxz

Notas. 1. Para muestras grandes es indistinto usar la distribución Z o distribución t de student, para

calcular el p-valor en la práctica se usa generalmente la distribución t porque en la mayoría de

los paquetes estadísticos viene como una opción 2. Si NO se conoce las desviaciones estándar de las poblaciones 1 y 2 se estima con s1 y Sha las

desviaciones estándar de las muestras 3. Generalmente se tiene que μ1 – μ2 = 0

9.3.3 EJERCICIOS RESUELTOS

Ejercicio 1. Se conocen los datos de dos muestras de dos poblaciones, que son los siguientes: Las

medias X1 = 74 ; X2 = 78 ; las varianzas S12 = 225 ; S2

2 = 169; las muestras n1 = 42 ; n2 = 56; Se

pide contrastar estadísticamente si existe diferencia entre las dos poblaciones, a un nivel de

significación del 0.05. Las dos poblaciones siguen una distribución Normal N(μ1,σ12) y N(μ2, σ2

2)

Solución. Sabemos que las distribuciones de las dos poblaciones son Normales, pero desconocemos el

valor de su desviación, sólo conocemos el valor de la desviación típica de las muestras entonces

estimamos las desviaciones poblacionales con las de las muestras.

Hipótesis:

Ho: μ 1 - μ 2 = 0, es decir, μ 1 = μ 2 (no existe diferencia entre las poblaciones)

H1: μ 1 - μ 2 ≠ 0, es decir, μ 1 ≠ μ 2 (si existe diferencia entre las poblaciones)

Ya que el tamaño de las muestras es elevado, utilizaremos el siguiente estadístico:

Estadístico

El nivel de significación nos dice el enunciado que es de α = 0.05 como es de dos colas α/2 = 0.025, y

para el criterio de aceptación tenemos en la figura:

Conclusión. Como (Z = – 1,38) queda en el área de aceptación de Ho, luego aceptamos Ho, es decir

no existe diferencia entre las poblaciones

Solución en MINITAB

Ejecutamos las opciones Stat/Basic statistics/2 Sample t.., luego completamos los datos como se ve

en la figura y clickeamos ok, ok

Page 39: Capítulo viii

8,6

45

6,3

40

9,2

)0(4,306,25)(

22

1

2

1

2

2

2

1212

n

s

n

s

uxxz

Resultados

Two-Sample T-Test and CI Sample N Mean StDev SE Mean

1 42 74,0 15,0 2,3

2 56 78,0 13,0 1,7

Difference = mu (1) - mu (2)

Estimate for difference: -4,00000

95% CI for difference: (-9,75807; 1,75807)

T-Test of difference = 0 (vs not =): T-Value = -1,38 P-Value = 0,171 DF = 81

Conclusión. Como (p = 0,171) > (α=0,05) luego no se rechaza Ho.

Ejercicio 2. Se realizó un estudio para comparar los años promedio de servicio de quienes se retiraron

en 2005 con los que se retiraron el año anterior en un hospital. Con un nivel de significancia de 0,01

¿podemos concluir que los trabajadores que se retiraron el 2005 trabajaron menos que los del 2004,

según la siguiente muestra?

Año 2004 2005

Media de la muestra 30,40 25,60

Desviación estándar muestra 3,6 2,9

Tamaño de la muestra 45,0 40,0

Solución.

HIPÓTESIS

Ho: μ 2 - μ 1 ≥ 0, (los trabajadores del 2005 trabajan igual o mas que los del 2004)

H1: μ 2 - μ 1 < 0, (los trabajadores del 2005 trabajan menos que los del 2004)

Concusión: Como (Z= -6,8) < (Z0,01= 2,3263) se rechaza Ho; luego los trabajadores del 2005

trabajan menos que los de 2004

Utilizando MINITAB

Page 40: Capítulo viii

22,10

40

8,12

35

9,33

1,157,3)(

2

2

2

1

2

1

2121

n

s

n

s

uxxz

Two-Sample T-Test and CI Sample N Mean StDev SE Mean

1 40 25,60 2,90 0,46

2 45 30,40 3,60 0,54

Difference = mu (1) - mu (2)

Estimate for difference: -4,80000

99% upper bound for difference: -3,12520

T-Test of difference = 0 (vs <): T-Value = -6,80 P-Value = 0,000 DF = 82

Conclusión: como (p-value=0,00)<(α=0,01), se rechaza Ho, es decir hay suficiente evidencia para

suponer que los trabajadores del 2005 trabajan menos que los del 2004.

Ejercicio 3. En un ensayo clínico para evaluar un hipotensor se compara un grupo placebo con el

grupo tratado. La variable medida es la disminución de la presión sistólica y se obtiene: grupo placebo

n = 35; x 3,7 mm de Hg. y Sha

= 33,9; grupo tratado n = 40; x 15,1 mm de Hg. y Sha

= 12,8. ¿Es

eficaz el tratamiento?

Solución.

Se trata de un contraste sobre diferencias de medias

H0: μ1 – μ2 ≤ 0 (no varia la presión)

H1: μ1 – μ2 > 0 (la presión disminuye)

Como no conocemos σ1 ni σ2 utilizamos la s1 y Sha y la distribución t, pero como la distribución t para

muestras n>30, se aproxima a Z utilizamos la distribución Z, los resultados serán iguales a la t de

Students.

Luego tenemos que (Z = – 10,22) < (Z0,05= – 1,645), entonces se ACEPTA la Ho, significa que la

presión con el nuevo tratamiento no ha disminuido.

Page 41: Capítulo viii

Utilizando MINITAB :

Two-Sample T-Test and CI Sample N Mean StDev SE Mean

1 35 3,70 5,82 0,98

2 40 15,10 3,58 0,57

Difference = mu (1) - mu (2)

Estimate for difference: -11,4000

95% lower bound for difference: -13,2998

T-Test of difference = 0 (vs >): T-Value = -10,04 P-Value = 1,000 DF = 54

Conclusión. De aquí tenemos que (p-valor =1) > (α=0,05) luego se acepta Ho. La presión no varía.

9.3.4 EJERCICIOS PROPUESTOS

Ejercicio 1. En la actualidad las calificaciones de eficiencia de 50 trabajadores de una empresa tienen

un valor promedio de 14.5 puntos y una desviación estándar de 1.6 puntos. Sin embargo, en fechas

recientes se evaluó a 64 trabajadores, que obtuvieron una puntuación media de 16.5 puntos y una

varianza de 9.

Dentro de un nivel de confianza del 95%, ¿puede decirse que la puntuación actuales de los

trabajadores de la empresa es menor que en fechas recientes?.

Ejercicio 2. Dos compañías que fabrican bloques de concreto desean comparar la compresión

promedio de sus bloques. El interés es determinar si las dos compañías tienen compresiones promedio

iguales, o si por el contrario, existen diferencias entre las mismas. Con base a un muestreo, pudo

determinarse la información que sigue. Utilizando un nivel de significación de 0,02, ¿es posible

concluir que hay diferencias entre la compresión promedio de los bloques de ambas compañías?

Compañía 1 Compañía 2

Compresión promedio(psi) 1070 1045 Desviación estándar (psi) 63,6 57,1 Tamaño Muestra 100 64

Ejercicio 3. Un producto químico especialmente diseñado para añadir peso al grano desea determinar

si es o no eficaz. Se tomaron dos grupos: el primer grupo fue formado con grano al cual no se le

aplicó el producto y el segundo grupo fue de grano al cual si se le aplicó el producto. Una muestra de

100 mazorcas de maíz no tratado con el producto tuvo un peso promedio de 15,2 onzas, con una

desviación de 1,2 onzas. Una muestra de 400 mazorcas de maíz tratado con el producto tuvo un peso

Page 42: Capítulo viii

promedio de 16 onzas, con una desviación de 1 onza. Utilizando una prueba de hipótesis con un 95%

de confiabilidad, ¿es posible concluir que el producto es eficaz?

Ejercicio 4. Las existencias de un medicamento se han surtido siempre en una farmacia un promedio

de 6,2 veces al año, con una desviación de 1,5 veces. Se sospecha que esta tasa ha cambiado en los

últimos meses. Una muestra de los últimos 36 meses reveló que ahora se surte 5,4 veces al año. ¿Ha

cambiado la tasa de surtido? Utilice un nivel de confiabilidad del 98%.

Ejercicio 5. Un fabricante de detergente afirma que su producto rinde más que los de la competencia,

para ello se tomaron 30 sabanas del mismo tamaño y color y se efectuó la prueba, encontrándose que

para un lavado perfecto se requirió de 800g de detergente con 15 de desviación estándar en un tiempo

dado, 30 sabanas del mismo tamaño y color se probaron para el detergente de la competencia

arrojando para un lavado perfecto en el mismo tiempo un promedio de 860g con desviación estándar

de 10. ¿Tiene razón el fabricante? Utilice un nivel de confianza del 99%.

Ejercicio 6. La cadena de McPato situadas en la ciudad de Piura afirma que su servicio es mas rápido

que cualquier otra cadena, una muestra de 42 atenciones demoró en promedio de 3 minutos con

desviación típica de 1 minuto. Una muestra de 45 atenciones de la cadena McPollo arrojó un tiempo

promedio de atención de 4 minutos con desviación de 0.8 minutos ¿Tiene McPato razón? Utilice una

prueba estadística con un nivel de significación de 0,10.

Ejercicio 7. Una muestra A de 49 observaciones muestrales reveló una media de 7.8, con una

desviación de 1,2. Otra muestra B de 36 observaciones arrojó una media igual a 12 y una varianza de

2. ¿La media de la muestra A es menor que la muestra B?

Ejercicio 8. 100 Empleados de una casa comercial matriz situado en la ciudad de lima ganan por

comisiones en promedio s/500 mensuales con desviación estándar de 12, 30 empleados en Huancayo

de una sucursal ganan por comisiones s/450 mensual con desviación típica de 10, con un nivel de

significación de 0.05 probar la hipótesis de que la sucursal paga menos que la casa matriz.

Ejercicio 9. Una empresa de bienes raíces está preparando un folleto que cree que puede ser de

interés para compradores de apartamentos en Las Palmeras y El Naranjal. Un elemento de interés es el

tiempo que el propietario que vende ha ocupado el inmueble. Una muestra de 40 apartamentos en las

Palmeras indicó un tiempo promedio de permanencia de 17,6 años, con una desviación de 2,3 años.

Una muestra de 55 casas en El Naranjal señaló un tiempo promedio de 18,1 años, con una desviación

de 2,9 años. Con un nivel de significación del 5%, ¿se puede concluir que los residentes de Las

palmeras tenían en propiedad sus casas por un período más corto?

Ejercicio 10. Un estudio se realiza para comparar el alquiler mensual de un departamento de una

habitación en la Avenida principal de provincias contra el costo en Lima.

Una muestra de 35 departamentos en la Avenida principal de provincias proporcionó un alquiler

mensual de S/. 370., con una desviación de S/. 30. Una muestra de 40 departamentos en Lima

demostró un valor promedio de S/. 680., con una desviación de S/.12. ¿Se puede concluir que existen

diferencias entre los alquileres?

Ejercicio 11. Se realiza una encuesta en dos zonas distintas de un país para conocer el grado de

implantación de Internet en los hogares. En la zona norte se visitaron 200 domicilios de las mismas

características seleccionados al azar y el 38% de ellos estaba dado de alta en Internet. Este número

descendía al 29% en la zona sur donde se visitaron 240 hogares. ¿Estaría justificado afirmar que en la

zona norte hay más gente conectada a Internet que en la zona sur? ¿Cuál debería haber sido el tamaño

de la muestra para poder detectar una diferencia de al menos 5 puntos porcentuales el 90% de las

veces, con un nivel de significación de 0,05?

Page 43: Capítulo viii

Ejercicio 12. Se quiere saber si el aumento del precio del petróleo genera incrementos en el uso de

electricidad. Para medir cambios experimentados desde el año anterior, se elige una muestra al azar de

40 casas en el mes de enero de 2004, y se compara con una muestra de 50 casas en el mes de enero

del 2005. los resultados muestrales son:

)2005(50305925,1

)2004(40298645,1

222

111

nkwhskwhx

nkwhskwhx

Realice una prueba con un nivel de significancia de 0,10 para verificar si el promedio de consumo de

electricidad por casa ha cambiado durante el mes de enero. ¿A que conclusión deberá llegar usted?

Ejercicio 13. La gerencia de una fábrica está considerando un nuevo método de aparado en la

fabricación de zapatos. El método actual requiere en promedio de 12,5 minutos de aparado y una

desviación típica de 3 para tres docena de zapatos. Se incorporó un nuevo método de aparado y sobre

una muestra de 32 zapatos requiere en promedio 9 minutos con varianza de 4, determinar si el nuevo

método es mas eficaz a un nivel de confianza de 99%.

Ejercicio 14. En una muestra aleatoria de 35 cabinas de Internet en la ciudad de amarilis ganan en

promedio diario S/200 con una varianza de 4. En Huánuco una muestra de 30 cabinas de Internet

dijeron que ganaban en promedio diario S/250 con una desviación típica de 2.2, a un nivel de

confianza de 90%, determinar si en las cabinas de Internet de Amariles se gana más que en las de

Huánuco.

Ejercicio 15. Las exportaciones de mangos del 2006 de 30 empresas fueron en promedio de 800

toneladas métricas, con una varianza de 200 toneladas métricas al cuadrado, el 2007 estas mismas

empresas exportaron 1000 toneladas con una varianza de 150, a un nivel de confianza de 95% se

puede afirmar que el 2007 se incremento las exportaciones de mango.

Page 44: Capítulo viii

2

2

2

1

2

1

21

nn

xxz

o

1

2

1

1

2

1

2/2121

1

2

1

1

2

1

2/21nn

zxxnn

zxx

9.4 PRUEBA DE HIPÓTESIS SOBRE LA DIFERENCIA ENTRE MEDIAS: MUESTRAS

PEQUEÑAS

9.4.1 INTRODUCCIÓN

Estas pruebas se utilizan cuando el muestreo destruye a los elementos, cuando resulta muy costoso o

cuando solo se puede obtener unos cuantos valores históricos.

Sea u1 y u2, las medias de dos poblaciones normales o aproximadamente normal; Se quiere probar la

hipótesis sobre la diferencia de medias bajo el supuesto que Ho es cierto es decir:

Hipótesis

Caso I Caso II Caso III Ho: μ1 – μ2 ≥ Δo H1 : μ1 – μ2 < Δo

Ho : μ1o – μ2 = Δo H1 : μ1 – μ2 ≠ Δo

Ho: μo – μ2 ≤ Δo H1: μ1 – μ2 > Δo

9.4.2 SUPOSICIONES

1. Las observaciones de las dos muestras son independientes

2. Las dos poblaciones son aproximadamente normales

3. Al menos una muestra es pequeña n < 30

Prueba Estadística..

Caso 1. Se conocen las desviaciones estándar de las poblaciones σ1 y σ2,.

Intervalo de Confianza. Del 100(1- )% para la diferencia de medias poblacionales 1- 2, es de la

forma:

Caso 2. Se desconoce 1 y 2 pero son iguales 1= 2= , se determina s la desviación estándar

combinada, en función de s1 y S2.

21

21

11

nns

xxt

o

Page 45: Capítulo viii

2

2

2

1

2

1

21

n

s

n

s

xxt

o

1

2

1

1

2

1

,2/2121

1

2

1

1

2

1

,2/21n

s

n

stxx

n

s

n

stxx

glgl

11

221,2/2121

11

221,2/21

1111

nnstxx

nnstxx

nnnn

Intervalo de Confianza. Del 100(1- )% para la diferencia de medias poblacionales 1- 2, es de la

forma:

Prueba t con n1+n2 – 2 grados de libertad

Donde s es un estimado conjunto de σ (desviación estándar común para ambas poblaciones (pooled

variance))

2

)1()1(

21

2

22

2

11

nn

snsns

Caso 3. Se desconoce 1 y 2 pero desiguales 1≠ 2 , se utiliza s1 y Sha, para estimar 1 y 2

respectivamente en este caso el método aproximado es la distribución t,

Los grados de libertad (gl) se determina con la fórmula siguiente.

2

1

1

1

12

2

2

2

2

2

1

2

1

1

2

2

2

2

1

2

1

n

s

nn

s

n

n

s

n

s

gl

Intervalo de Confianza. Del 100(1- )% para la diferencia de medias poblacionales 1- 2, es de la

forma:

Donde:

n1: Tamaño de la muestras 1; n2 : Tamaño de la muestras 2

1x : Media de la muestra 1,

2x : Media de la muestra 2

μ1 : Media de la población 2; μ2 : Media de la población 2;

1 : Desviación estándar poblacional 1 2 : Desviación estándar poblacional 2

s1 : desviación estándar de la muestra 1; Sha : desviación estándar de la muestra 2

s: desviación estándar combinada. gl : grados de libertad

Page 46: Capítulo viii

T(0,1;23)=-1,714 t(0,1;23) =1,714 t= 1,193

Zona de aceptación Ho

Zona

rechazo Ho

Zona

rechazo Ho

De tablas t para dos colas tenemos que:

t (α ; n1+n2-2) = t (0,1 ; 10+15-2) = t (0,1 ; 23) = 1,714

Nota: en caso gl no sea entero se aproxima al menor entero

9.4.3 EJERCICIOS RESUELTOS

Ejercicio 1. Como psicólogo de un hospital para enfermos mentales el lector obtiene calificaciones

para una prueba visual motora para cada uno de dos grupos de pacientes. La calificación media para el

grupo A (10 pacientes) es 80 con desviación estándar 18, y la correspondiente al grupo B (15

pacientes) es 70 con desviación estándar 22. El lector cree tener suficiente razones para considerar las

desviaciones estándar de población iguales, las poblaciones son normales. ¿Difieren

significativamente las calificaciones con nivel de significación 10%?.

Solución

Datos

nA = 10 nB = 15 80A

x 70B

x sA = 18 sB = 22 = 0.10

Hipótesis

Ho: μA - μB = 0 (las calificaciones no difieren)

H1: μA - μB ≠ 0 (las calificaciones si difieren)

193,1

15

1

10

15278.20

7080

11

BA

BA

nns

xxt

s = 5278.2021510

22)115(18)110(

2

)1()1(2222

BA

BBAA

nn

snsn

Decisión: como se observa en la figura el t esta dentro del área de aceptación de Ho., luego se acepta

Ho, es decir que las calificaciones no difieren

Utilizando MINITAB

Ejecutamos las opciones Stat/Basic statistics/2 Sample t.., luego completamos los datos como se ve

en la figura y clickeamos ok, ok

u1-

u2

H1

s1

s2

1x

2x

1= 2

n2

n1

Page 47: Capítulo viii

t=0,68 T(0,05;10)=1,812

Zona de rechazo Ho Zona de Aceptación Ho

Nota: Note que Assume equal viariances está activado esto se hace cuando las varianzas de las poblaciones son iguales

Two-Sample T-Test and CI Sample N Mean StDev SE Mean

1 10 80,0 18,0 5,7

2 15 70,0 22,0 5,7

Difference = mu (1) - mu (2)

Estimate for difference: 10,0000

90% CI for difference: (-4,3630; 24,3630)

T-Test of difference = 0 (vs not =): T-Value = 1,19 P-Value = 0,245 DF = 23

Both use Pooled StDev = 20,5278

Conclusión: Como (p-value = 0,245) > (α = 0,1) luego se acepta Ho.

Ejercicio 2. Para contrastar si mediante el proceso B se disminuye el tiempo de ejecución de ciertos

trabajos respecto del A, se ejecutaron 6 tareas con ambos procesos obteniéndose los siguientes

tiempos, medidos en horas:

A 2,5 7,1 5 8,5 7 8,1

B 2,3 7,1 4 8 6,6 5

Admitiéndose normalidad y con un nivel de confianza del 95% ¿qué conclusión puede derivarse de

estos datos?. Suponer que ambos procesos tienen la misma variabilidad.

Solución.

Ho: μA – μB ≤ 0 (Con el proceso B no se disminuye el tiempo de ejecución)

H1: μA – μB > 0 (Con el proceso B se disminuye el tiempo de ejecución)

37,66

1,875,851,75,2A

x 5,56

56,6841,73,2B

x

25,216

2)37,6(6)

2)1,8(

2)7(

2)5,8(

2)5(

2)1,7(

2)5,2((

As

13,216

2)5.5(8)

25

26,6

28

24

21,7

23,2(

Bs

t(0,05,10) = 1,812 una cola

68,0

6

1

6

16928.0

5,537,6

11

Bn

An

s

Bx

Ax

t

Page 48: Capítulo viii

6928.0266

13.2)5(25.2)5(

2

)1()1(2222

BA

BBAA

nn

snsn

Conclusión: En la gráfica vemos que t=0,68 esta en la

zona de aceptación de la Ho, luego Con el proceso B no se

disminuye el tiempo de ejecución

En MINITAB

Primero ingresamos los datos en la columna C1 (XA) y C2 (XB) como en la figura

Y ejecutamos las opciones Stat/Basic statistics/2 Sample t.., luego completamos los datos como se

ve en la figura y clickeamos ok, ok

Aquí los resultados.

Two-Sample T-Test and CI: XA; XB Two-sample T for XA vs XB

N Mean StDev SE Mean

XA 6 6,37 2,25 0,92

XB 6 5,50 2,13 0,87

Difference = mu (XA) - mu (XB)

Estimate for difference: 0,866667

95% lower bound for difference: -1,427686

T-Test of difference = 0 (vs >): T-Value = 0,68 P-Value = 0,255 DF = 10

Both use Pooled StDev = 2,1926

Conclusión. Como (p-value=0,255)>(α =0,05) se acepta Ho.

Ejercicio 3. Se quiere saber el trabajo afecta el rendimiento académico de los estudiantes de una

especialidad, para ello se evalúa a dos grupos independientes de estudiantes, supóngase que las

poblaciones son normales. El grupo 1 es el de estudiantes que trabajan y el grupo 2 es el de

estudiantes que no trabajan, los datos obtenidos en la investigación son los siguientes.

G1 5 12 8 11 12 13 8 11 G2 10 10 16 17 15 16 14 16

Page 49: Capítulo viii

Con un nivel de significancia de 0.01, puede afirmarse que el trabajo disminuye el rendimiento

académico.

Solución

1: media de estudiantes que trabajan 2: media de estudiantes que no trabajan

Primero: No se conocen las 1 y 2 además no sabemos si son o no iguales, para determinar si son

iguales aplicamos la prueba de la varianza.

Ho: 1 / 2 = 1 (la varianzas son iguales)

H1: 1 / 2 ≠ 1(la varianzas no son iguales)

Aplicamos Minitab

Los resultados fueron

Test for Equal Variances: g1, g2

99% Bonferroni confidence intervals for standard deviations

N Lower StDev Upper

g1 8 1.53600 2.72554 8.09028

g2 8 1.55800 2.76457 8.20614

F-Test (normal distribution)

Test statistic = 0.97, p-value = 0.971

Levene's Test (any continuous distribution)

Test statistic = 0.00, p-value = 1.000

Como (p.value=1)>0.01 se acepta la Ho, o sea que las varianzas de las poblaciones son iguales.

Además

S1=2.73 Sha=2.76

Segundo. Como son iguales las 1 y 2 aplicamos la prueba de student con varianza combinada.

2

1

1

1

21

nns

xxt

Hipótesis

Ho: 1 - 2 = 0 (el rendimiento académico no disminuye)

H1: 1 - 2 < 0 (el rendimiento académico disminuye)

Aplicando Minitab tenemos.

Two-Sample T-Test and CI: g2, g1

Two-sample T for g2 vs g1

N Mean StDev SE Mean

g2 8 14.25 2.76 0.98

g1 8 10.00 2.73 0.96

Page 50: Capítulo viii

2

2

2

1

2

1

2121)(

n

s

n

s

uxxt

Difference = mu (g2) - mu (g1)

Estimate for difference: 4.25000

99% upper bound for difference: 7.85228

T-Test of difference = 0 (vs <): T-Value = 3.10 P-Value = 0.996 DF = 14

Both use Pooled StDev = 2.7451

Nota: aquí hemos puesto g2 primero y luego g1, porque Sha>s1

Luego como (p-value=0.004)< ( =0.01) se rechaza Ho, o sea que el trabajo diminuye el rendimiento

académico de los estudiantes.

Ejercicio 4. Se determinó la contaminación de dos ríos A y B de una ciudad analizando el PH de 100

ml de agua, el río A esta ubicado en una zona industrial y el río B esta ubicada en una zona rural. Se

dice que el agua no esta contaminada si su PH esta cercano a 7

Los datos encontrados fueron

Río n x Sha

A 5 5 0.7 B 5 7 0.07

Con un =0.05 se desea saber si el río A esta más contaminado que B. Las distribuciones son

normales, pero no se sabe si las varianzas son iguales.

Solución

Primero. Debemos determinar si las varianzas son iguales.

Utilizamos la comparación de varianzas

Test for Equal Variances

95% Bonferroni confidence intervals for standard deviations

Sample N Lower StDev Upper

1 5 0.468406 0.836660 2.89447

2 5 0.148123 0.264575 0.91531

F-Test (normal distribution)

Test statistic = 10.00, p-value = 0.047

Como (p-valor=0.047) < 0.05 se rechaza Ho, luego las distribuciones No son iguales.

Como 1≠ 2 utilizamos la distribución

Ho: 1 = 2 (El río A no esta más contaminado que el río B)

H1: 1 < 2 (El río A esta más contaminado que el río B)

Page 51: Capítulo viii

Según minitab tenemos

Two-Sample T-Test and CI

Sample N Mean StDev SE Mean

1 5 5.000 0.700 0.31

2 5 7.0000 0.0700 0.031

Difference = mu (1) - mu (2)

Estimate for difference: -2.00000

95% upper bound for difference: -1.32930

T-Test of difference = 0 (vs <): T-Value = -6.36 P-Value = 0.002 DF = 4

Como p-value=0.002 < 0.05 luego se rechaza Ho, es decir el río A está mas contaminado que el río B.

Ejercicio 5. Dieciocho plantas de una misma variedad de naranjos fueron tratadas con fertilizantes. A

nueve de ellas se les aplicó una cierta dosis de nitrógeno (N) y al resto una de nitrógeno y fósforo

(NP). Se midió el rendimiento en Kg. por planta; los resultados obtenidos fueron:

N: X = 28 kg S² = 9 NP: X = 21 kg S² = 7

Interesa conocer si existen diferencias significativas entre los rendimientos de las plantas tratadas con

los dos tipos de fertilizante. (α = 0,01). Suponga varianzas iguales

Solución:

H0 : µ N = µ NP

H1 : µ N µ NP

Dado que las variancias poblacionales son iguales, de las cuales S²N y S²NP son estimaciones, se

calcula la variancia amalgmada. Si el supuesto no fuera válido debería verificarse primeramente la

homogeneidad de variancia a través del test F, en particular si las muestras de las poblaciones no son

iguales.

Donde 828427.2299

7)19(9)19(

2

)1()1(

21

2

22

2

11

nn

snsns

25.5

9

2828427.2

)2128(

11

)()(

NPN

NPNNPN

nns

XXt

El valor tabulado de t, para 16 grados de libertad y nivel de significación del 1% es igual a ± 2,921.

Como el valor de la estadística calculada supera al valor tabulado, se rechaza H0 .

Conclusión existen diferencias estadísticamente significativas entre los tratamientos, siendo superior

el promedio por planta de naranjo, de aquellas que reciben el tratamiento NP.

Ejercicio 6. Se quiso probar si la cirrosis de hígado hacia variar el índice de actividad de la

colinesterasa en suero. Se eligieron dos muestras aleatorias e independientes de individuos. Los

resultados fueron:

Individuos normales n1=20 8,11

x S1=0,4

Individuos cirroticos n2=25 66,02

x S2=0,2

Page 52: Capítulo viii

La cirrosis de hígado, ¿hace variar el índice de la colinesterasa en suero?

Solución:

Primero. Debemos determinar si las varianzas son iguales.

Utilizamos la comparación de varianzas

Test for Equal Variances

95% Bonferroni confidence intervals for standard deviations

Sample N Lower StDev Upper

1 20 0.293052 0.4 0.619718

2 25 0.150964 0.2 0.292749

F-Test (Normal Distribution)

Test statistic = 4.00, p-value = 0.002

Como (p-valor=0.002) < 0.05 se rechaza Ho, luego las distribuciones No son iguales.

Como 1 ≠ 2 utilizamos la distribución

2

2

2

1

2

1

2121)(

n

S

n

S

xxt 2

1

1

1

12

2

2

2

2

2

1

2

1

1

2

2

2

1

2

1

n

S

nn

S

n

n

S

n

S

gl

Hipótesis:

H0: 21 (No varía)

H1: 21 (Varía)

Según Minitab tenemos

Two-Sample T-Test and CI

Sample N Mean StDev SE Mean

1 20 1.800 0.400 0.089

2 25 0.660 0.200 0.040

Difference = mu (1) - mu (2)

Estimate for difference: 1.1400

95% CI for difference: (0.9386, 1.3414)

T-Test of difference = 0 (vs not =): T-Value = 11.64 P-Value = 0.000 DF = 26

Como P-Value = 0,000 < 0,05 luego se rechaza Ho, es decir el índice de la colinesterasa en suero no

hace variar la cirrosis de hígado.

Ejercicio 7. Muchos autores afirman que los pacientes con depresión tienen una función cortical por

debajo de lo normal debido a un riego sanguíneo cerebral por debajo de lo normal. A dos muestras de

individuos, unos con depresión y otros normales, se les midió un índice que indica el flujo sanguíneo

en la materia gris (dado en mg/(100g/min)) obteniéndose:

Page 53: Capítulo viii

Depresivo n1=19 471

x S1=7,8

Normales n2=22 8,532

x S2=6,1

¿Hay evidencia significativa a favor de la afirmación de los autores?

Solución:

Primero. Debemos determinar si las varianzas son iguales.

Utilizamos la comparación de varianzas

Test for Equal Variances

99% Bonferroni confidence intervals for standard deviations

Sample N Lower StDev Upper

1 19 5.27061 7.8 13.9551

2 22 4.22499 6.1 10.3540

F-Test (Normal Distribution)

Test statistic = 1.64, p-value = 0.279

Como (p-valor=0.279) < 0.05 se rechaza Ho, luego las distribuciones No son iguales.

Como 1 ≠ 2 utilizamos la distribución

2

2

2

1

2

1

2121)(

n

S

n

S

xxt 2

1

1

1

12

2

2

2

2

2

1

2

1

1

2

2

2

1

2

1

n

S

nn

S

n

n

S

n

S

gl

Hipótesis:

H0: 21 (función cortical Normal)

H1: 21 (Función cortical por debajo de lo normal)

Según Minitab tenemos

Two-Sample T-Test and CI

Sample N Mean StDev SE Mean

1 19 47.00 7.80 1.8

2 22 53.80 6.10 1.3

Difference = mu (1) - mu (2)

Estimate for difference: -6.80

95% lower bound for difference: -10.54

T-Test of difference = 0 (vs >): T-Value = -3.07 P-Value = 0.998 DF = 33

Como P-Value = 0,998 > 0,05 luego se acepta Ho, es decir no hay evidencia significativa a favor de la

afirmación de los autores.

Ejercicio 8. Un fabricante de llantas para bicicleta afirma que sus llantas duran más que los de la

competencia, para ello se tomaron 5 llantas y la duración promedio fue de 60.000 kilómetros y una

varianza de 100. 6 llantas de la competencia arrojo un tiempo promedio de duración de 58000

Page 54: Capítulo viii

kilómetros y una varianza de 90. Si las poblaciones se consideran normales de varianzas desconocidas

diferentes ¿tiene razón el fabricante? Utilice un nivel de confianza del 99%.

Solución:

Fabricante n1 = 5 600001

x V1 = 100

Competencia n2 = 6 580002

x V2 = 90

Utilizamos la distribución

2

2

2

1

2

1

2121)(

n

S

n

S

xxt 2

1

1

1

12

2

2

2

2

2

1

2

1

1

2

2

2

1

2

1

n

S

nn

S

n

n

S

n

S

gl

Hipótesis:

H0: 21 (No duran más)

H1: 21 (Duran más)

Según Minitab tenemos

Two-Sample T-Test and CI

Sample N Mean StDev SE Mean

1 5 60000.0 10.0 4.5

2 6 58000.00 9.49 3.9

Difference = mu (1) - mu (2)

Estimate for difference: 2000.00

99% lower bound for difference: 1982.86

T-Test of difference = 0 (vs >): T-Value = 338.01 P-Value = 0.000 DF = 8

Como P-Value = 0,000 < 0,01 luego se rechaza Ho, es decir que si tiene razón el fabricante que sus

llantas duran más.

9.4.4 EJERCICIOS PROPUESTOS

Ejercicio 1. Se mide la longitud de animales machos y hembras y se desea conocer si las longitudes

son diferentes.

Machos 44 48 36 32 51 45 54 56

Hembras 32 40 44 44 34 30 26

Ejercicio 2. Los pesos netos de las botellas de una muestra que llenó una máquina fabricada por Blue

y los pesos netos en una muestra de botellas llenadas por una máquina similar que manufactura Red,

Inc. fueron los siguientes:

Blue: 5 8 7 6 9 7 Red: 8 10 7 11 9 12 14 9

Pruebe al nivel de significación de 0.05 que el peso medio de las botellas que llena la máquina que

fabrica Red es mayor.

Page 55: Capítulo viii

Ejercicio 3. Una muestra de las calificaciones que presentaron hombres y mujeres en un examen de

Estadística se sintetiza a continuación:

Hombres Mujeres

Media muestral 11,33 10,50

Desviación estándar 3,45 2,35

Tamaño de la muestra 6 8

¿Son las calificaciones promedios iguales, o por el contrario, existe alguna diferencia entre ellas?

Responda a esta pregunta con una prueba estadística de hipótesis que tenga un nivel de confianza del

99%.

Ejercicio 4. Un profesor está comparando las notas de dos secciones de Estadística.

Ambas secciones tuvieron 60 estudiantes, pero el profesor quiere una conclusión rápida,

fundamentado en una muestra pequeña. Así que observó en su planilla las siguientes calificaciones:

Sección “A”: 12 05 13 16 15 10 Sección “B”: 09 12 11 10 10 11

¿Se puede concluir, dentro de un nivel de confianza del 95%, que el promedio de notas de las dos

secciones es igual?

Ejercicio 5. Para dos tipos de combustibles de automóvil se tomó el rendimiento por galón de cada

uno y se presenta a continuación:

Combustible A: 45 67 54 41 38 59 48 31 59 31 50

Combustible B: 79 82 69 84 76 77 81 65 73 70 69

Con base en la información anterior se puede concluir que el rendimiento promedio del combustible B

es superior al rendimiento del combustible A? Utilice un nivel de significancia del 1%.

Ejercicio 6. Se desea analizar si existen diferencias en el contenido de proteínas del salmón y el atún

enlatados. Para ello se tomaron dos muestras de 7 unidades para cada uno de los dos productos y se

realizó la determinación del contenido proteico en lo mismo. Los resultados se presentan a

continuación:

Contenido de proteínas en porcentaje Salmón 22.4 24.5 23.0 27.1 24.2 25.7 26.4

Atún 28.3 26.4 25.2 24.7 26.3 25.3 24.9

Esta información es suficiente para decir que ambos pescados enlatados tienen el mismo contenido de

proteína?

Ejercicio 7. Se comparan dos insecticidas A y B, pero como los niveles de interpretación son muy

variados en la plantación, se fumigó cada planta con ambos productos aplicándolos al azar en cada mitad

de la planta. Al tiempo se seleccionaron 10 hojas en cada mitad de cada planta fumigada y se registró el

número medio de insectos por hoja. Los datos son los siguientes:

Planta 1 2 3 4 5 6 7 8 Insecticida A 1.3 0.8 3.5 1.2 5.1 4.3 10.7 1.4 Insecticida B 2.1 1.5 3.9 1.8 5.0 5.4 12.9 1.1

a) Analizar la información planteando una prueba t de muestras apareadas.

b) Considerar ahora a las muestras como independientes (no apareadas) y aplicar la prueba t para esta

situación.

c) Compare los resultados obtenidos, comente sobre las ventajas y desventajas de uno y otro

procedimiento.

Page 56: Capítulo viii

Ejercicio 8. Al medir el diámetro transversal del corazón de los adultos del sexo masculino y

femenino se obtuvieron los siguientes resultados:

Grupo Tamaño de muestra Media muestral (cm) S en cm Hombres 12 13,21 1,05 Mujeres 9 11 1,01

Suponga que las varianzas de las dos poblaciones son iguales. ¿Proporcionan estos datos suficiente

evidencia que indique que el diámetro transversal promedio del corazón de los hombres es igual al de

las mujeres? Tome un nivel de significancia del 5%

Ejercicio 9. Se desea comparar la actividad motora espontánea de un grupo de 25 ratas control y otro

de 36 ratas desnutridas. Se midió el número de veces que pasaban delante de una célula fotoeléctrica

durante 24 horas. Los datos obtenidos fueron los siguientes:

Ratas de control n1=25 8,8691

x S1=106,7

Ratas desnutridas n2=36 4652

x S2=153,7

¿Se observan diferencias significativas entre el grupo control y el grupo desnutrido?

Ejercicio 10. Se quiso probar si la cirrosis de hígado hacia variar el índice de actividad de la

colinesterasa en suero. Se eligieron dos muestras aleatorias e independientes de individuos. Los

resultados fueron:

Individuos normales n1=20 8,11

x S1=0,4

Individuos cirroticos n2=25 66,02

x S2=0,2

La cirrosis de hígado, ¿hace variar el índice de la colinesterasa en suero?

Ejercicio 11. Los siguientes datos corresponden a la longitud medida en centímetros de 18 pedazos de

cable sobrantes en cada rollo utilizado: 9, 3,41, 6,13, 1,99, 6,92, 3,12, 7,86, 2,01, 5,98, 4,15, 6,87,

1,97, 4,01, 3,56, 8,04, 3,24, 5,05, 7,37. Basados en estos datos ¿podemos decir que la longitud media

de los pedazos de cable es mayor de 4 cm? Suponga población normal y tome el nivel de significancia

0,05.

Ejercicio 12. Un agrónomo mide el contenido promedio de humedad en cierta variedad de trigo que

fue secado especialmente en una muestra de 16 toneladas: 7,2, 6,8, 7,3, 7, 7,3, 7,3, 7,5, 7,3, 7,4, 7,2,

7,6, 7,1, 7,4, 6,7, 7,4, 6,9. Si el promedio de humedad excede de 7,1 el secado debe continuar.

¿Debería continuarse con el proceso de secado, de acuerdo con esta evidencia? Tome un nivel de

significancia del 5%.

Ejercicio 14. Se quiere medir el rendimiento de un automóvil, para ello se determinó el número de

km por galón de gasolina, los resultados fueron

45 67 54 41 38 59 48 31 59 31

Con esta información se puede concluir que el rendimiento promedio del combustible es superior a 50

km/galón? Utilice un nivel de significancia del 1%.

Ejercicio 15. Se presume que el consumo de gerentes por año es igual a 20 mil dólares, para ello se

tomó la siguiente información de una muestra de 11 Gerentes:

Consumo anual en miles de $: 36 22 26 18 22 14 34 25 25 18 18

Con base en los resultados anteriores considera que la presunción es cierta.

Page 57: Capítulo viii

n

S

Ddt

d n

dd

i

1

22

n

dndS

i

d

n

std

n

std

d

nd

d

n 1,2/1,2/

9.5 PRUEBAS DE HIPÓTESIS PARA MEDIAS: MUESTRAS DEPENDIENTES

9.5.1 INTRODUCCIÓN

Las muestras dependientes o apareadas aparecen como distintas observaciones realizadas sobre los

mismos individuos.

Dos muestras son dependientes cuando se obtienen de sujetos comunes. También se denominan

muestras apareadas o equiparadas.

Un ejemplo de observaciones apareadas consiste en considerar a un conjunto de n personas a las que

se le aplica un tratamiento y se mide por ejemplo el nivel de estrés antes X1 y después del tratamiento

X2; la producción de una maquina en el turno mañana x1 y la producción de la misma máquina en el

turno tarde x2.

En las pruebas de datos pareados no hay necesidad de suponer que las dos poblaciones de que se trata

tienen varianzas iguales. Las hipótesis a considerar:

Hipótesis

Caso I Caso II Caso III Ho: μd ≤ D Ho: μd = D Ho: μd ≥ D H1 : μd > D H1 : μd ≠ D H1 : μd < D

3.5.2 SUPUESTOS

1. Las observaciones de las muestras son aleatorios

2. Las muestras deben tener distribuciones normales

Prueba estadísticas

Intervalo de Confianza. Del 100(1- )% para la diferencia de medias poblacionales d es de la

forma:

Donde:

µd : Media de las diferencias poblacional

d : Media de la diferencia de los datos de las muestras apareadas

Sd : Desviación estándar de las diferencias de los datos de las muestras apareadas

n : Número de pares de datos

Page 58: Capítulo viii

95,3)031()(

846.7

10

81.24

dd

t

t(0,05;9)=1,8331 t=3,9

Zona de rechazo Ho Zona de Aceptación Ho

n

S

dt

d

d

9.5.3 EJERCICIOS RESUELTOS

Ejercicio 1. Se pretende demostrar que cierto tratamiento practicado durante un mes, ayuda a reducir

el colesterol. Para ello se realiza un estudio con una muestra aleatoria simple de 10 personas. Los

resultados se muestran a continuación.

Antes 200 210 330 240 260 300 245 210 190 225 Después 150 200 275 250 200 250 200 180 190 205

¿Que podemos concluir de estos datos.

Solución: Obsérvese que las mediciones se realizan sobre las mismas personas, por tanto no tenemos

dos muestras aleatorias independientes, sino una sola, en la cual lo que nos interesa es la diferencia

producida entre el colesterol antes del tratamiento y después del mismo. Para ello introducimos una

nueva variable que expresa la diferencia existente entre el colesterol antes del tratamiento y después

del mismo: D = Xant − Xdes

Antes 200 210 330 240 260 300 245 210 190 225 Después 150 200 275 250 200 250 200 180 190 205 Diferencia 50 10 55 -10 60 50 45 30 0 20

Encontrar evidencia a favor de que el tratamiento surgen el efecto deseado (baja el colesterol) es lo

mismo que encontrar evidencia estadísticamente significativa en el contraste:

Ho: μd = 0

H1 : μd > 0

Esto es de nuevo un contraste para una media, que se realiza sobre la variable

diferencia. El estadístico que usamos es:

De tablas tenemos que: t(0,05;9) = 1, 8331, para un α=5% y n-1=9 grados de libertad

Luego si suponemos que la hipótesis nula es cierta y que la variable diferencia sigue una distribución

normal de parámetros desconocidos, tenemos:

3110

200...10551050d , 81.24

1

22

n

dnd

dS

Conclusión: El valor experimental se encuentra claramente en la región de rechazo por tanto

concluimos que existe evidencia estadísticamente significativa en contra de la hipótesis nula (se

rechaza) y a favor de la hipótesis alternativa (al menos con un nivel de significación del 5%).

En MINITAB

Ejecutamos las opciones Stat/Basic statistics/ Paired t.., luego completamos los datos como se ve en

la figura y clickeamos ok, ok

Page 59: Capítulo viii

Se obtiene los siguientes resultados

Paired T-Test and CI: Antes; Después

Paired T for Antes - Despise

N Mean StDev SE Mean

Antes 10 241,000 45,019 14,236

Despise 10 210,000 37,491 11,856

Difference 10 31,0000 24,8104 7,8457

95% lower bound for mean difference: 16,6179

T-Test of mean difference = 0 (vs > 0): T-Value = 3,95 P-Value = 0,002

De aquí concluimos que (pvalue=0,002)<(α=0,05) entonces se rechaza Ho.

Ejercicio 2. Un fabricante deseaba comparar la resistencia al desgaste de dos tipos distintos de

neumáticos A y B. Para hacer la comparación, se asignó al azar un neumático del tipo A y uno del

tipo B a las ruedas posteriores de 20 automóviles.

Los autos recorrieron un número específico de kilómetros y se observó el desgaste de cada neumático.

Estos valores aparecen en la siguiente tabla.

A 10.6 9.8 12.3 9.7 8.8 10 9.9 9 12.1 8.9 10.1 11 11.8 9.9 12.2 12.3 10.5 8.8 8.6

9.2

B 10.2 9.4 11.8 9.1 8.3 10.1 9.2 11.2 11 8.2 10.1 10 10.3 10.4 11.1 11.3 9.3 8.5 10.3 11

Presentan los datos suficiente evidencia para concluir que hay diferencia en el desgaste promedio de

los dos tipos de neumáticos?

Solución

A 10.6 9.8 12.3 9.7 8.8 10 9.9 9 12.1 8.9 10.1 11 11.8 9.9 12.2 12.3 10.5 8.8 8.6 9.2

B 10.2 9.4 11.8 9.1 8.3 10.1 9.2 11.2 11 8.2 10.1 10 10.3 10.4 11.1 11.3 9.3 8.5 10.3 11

d 0.4 0.4 0.5 0.6 0.5 -0.1 0.7 -2.2 1.1 0.7 0 1 1.5 -0.5 1.1 1 1.2 0.3 -1.7 -1.8

24.020

)8.1()7.1(3.0...5.04.04.0d ,

d=0, 7.4)8.1()7.1(...4.04.0d

2)8.1(

2)7.1(...

25.0

24.0

24.0

2d 21.6

Page 60: Capítulo viii

64.4

20

04.1

6.21

n

S

dt

d

d

04.119

2)7.4(20)6.21(

1

22

n

dnd

dS

Hipótesis

Ho: μd = 0 (no hay diferencia)

H1: μd ≠ 0 (hay diferencia)

De la tabla t de estuden para dos colas, para un =0.05 ( /2=0.025)

t(0.025,19)= 2.093

Como (t(0.025,19)= 2.093 < t=4.64) se rechaza la Ho.

Luego hay suficiente evidencia que hay diferencia en el desgaste de los neumáticos.

Ejercicio 3. Un grupo de empresarios desean conocer la diferencia que hay entre el rendimiento de un

galón de gasolina del mismo octanaje entre dos establecimientos de servicio A y B. para esto

contrataron a un Ingeniero que haga el estudio, este asignó al azar un galón de la estación A y un

galón de la estación B a 9 automóviles.

Los autos recorrieron a una determinada velocidad hasta consumir totalmente el galón de gasolina.

Estos valores aparecen en la siguiente tabla

Auto 1 2 3 4 5 6 7 8 9 Est A 32 28 29.7 28 27 29 27 31 28.9 Est B 31 32.2 30.2 31.1 30.8 30 30.2 30.2 31.0

Si las poblaciones son normales, presentan los datos suficiente evidencia para concluir que hay

diferencia en el rendimiento de la gasolina según establecimiento.

Solución

Hipótesis

HO : 1= 2 (No hay diferencia de rendimiento)

H1 : 1≠ 2 (hay diferencia de rendimiento)

Aplicando minitab.

Paired T-Test and CI: A, B

Paired T for A - B

N Mean StDev SE Mean

A 9 28.9556 1.7133 0.5711

B 9 30.8222 0.7710 0.2570

Difference 9 -1.86667 2.02176 0.67392

95% CI for mean difference: (-3.42073, -0.31261)

T-Test of mean difference = 0 (vs not = 0): T-Value = -2.77 P-Value = 0.024

Según los datos, se tiene que (p–value = 0.024 < 0.05), entonces rechazamos Ho, luego hay

diferencia de rendimientos.

Page 61: Capítulo viii

70.3)01.2()(

566.0

10

79.1

dd

t

t=-3.70 t(0,05;9)=1,8331

Zona de rechazo Ho Zona de Aceptación Ho

Ejercicio 4. Se pretende demostrar que cierto tratamiento practicado durante un mes a un grupo de

alumnos de la FIIS, ayuda a incrementar el rendimiento académico. Para ello se realiza un estudio con

una muestra aleatoria simple de 10 personas. Los resultados se muestran a continuación.

Antes 15 11 12 10 8 13 9 5 16 14 Después 15 13 14 13 11 14 12 11 17 14

¿Que podemos concluir de estos datos.

Solución:

Obsérvese que las mediciones se realizan sobre las mismas personas, por tanto no tenemos dos

muestras aleatorias independientes, sino una sola, en la cual lo que nos interesa es la diferencia

producida entre el colesterol antes del tratamiento y después del mismo. Para ello introducimos una

nueva variable que expresa la diferencia existente entre el rendimiento académico antes del

tratamiento y después del mismo: D = Xant − Xdes

Antes 15 11 12 10 8 13 9 5 16 14

Después 15 13 14 13 11 14 12 11 17 14

Diferencia 0 -2 -2 -3 -3 -1 -3 -6 -1 0

Encontrar evidencia a favor de que el tratamiento incremente el rendimiento es lo mismo que

encontrar evidencia estadísticamente significativa en el contraste:

Ho: μd = 0 (el tratamiento no incremente el rendimiento)

H1 : μd < 0 (el tratamiento incremente el rendimiento)

Esto es de nuevo un contraste para una media, que se realiza sobre la variable diferencia. El

estadístico que usamos es:

De tablas tenemos que: t(0,05;9) = 1, 8331, para un α=5% y n-1=9 grados de libertad

Luego si suponemos que la hipótesis nula es cierta y que la variable diferencia sigue una distribución

normal de parámetros desconocidos, tenemos:

1,210

0)1(...)3()2()2(0d , 79.1

1

22

n

dnd

dS

Conclusión: El valor experimental se encuentra claramente en la región de aceptación por tanto

concluimos que existe evidencia estadísticamente significativa a favor de la hipótesis nula.

Page 62: Capítulo viii

183.2)0125.1()(

515.0

8

457.1

dd

t

t=-2.183 t(0,05;7)=1,895

Zona de rechazo Ho Zona de Aceptación Ho

Ejercicio 5. Se pretende demostrar que la capacitación a un grupo de docentes de la FIIS, ayuda a

incrementar el nivel de enseñanza. Para ello se realiza un estudio con una muestra aleatoria simple de

8 docentes. Los resultados se muestran a continuación.

Antes 12 11 12 15 10 14 9 13 Después 13 12 12 14 13 14 12 15

¿Que podemos concluir de estos datos.

Solución: Obsérvese que las mediciones se realizan sobre las mismas personas, por tanto no tenemos

dos muestras aleatorias independientes, sino una sola, en la cual lo que nos interesa es la diferencia

producida entre la enseñanza antes de la capacitación y después del mismo. Para ello introducimos

una nueva variable que expresa la diferencia existente entre el nivel de enseñanza antes de la

capacitación y después del mismo: D = Xant − Xdes

Antes 12 11 12 15 10 14 9 13 Después 13 12 12 14 13 14 12 15 Diferencia -1 -1 0 1 -3 0 -3 -2

Encontrar evidencia a favor de que la capacitación incrementa el nivel de enseñanza es lo mismo que

encontrar evidencia estadísticamente significativa en el contraste:

Ho: μd = 0

H1 : μd < 0

Esto es de nuevo un contraste para una media, que se realiza sobre la variable diferencia. El

estadístico que usamos es:

De tablas tenemos que: t(0,05;9) = 1, 8331, para un α=5% y n-1=7 grados de libertad

Luego si suponemos que la hipótesis nula es cierta y que la variable diferencia sigue una distribución

normal de parámetros desconocidos, tenemos:

125.18

)2()3(...)1()0()1(1d , 457.1

1

22

n

dnd

dS

Conclusión: El valor experimental se encuentra claramente en la región de aceptación por tanto

concluimos que existe evidencia estadísticamente significativa a favor de la hipótesis nula.

Ejercicio 6. Una empresa consultora realiza pruebas del rendimiento de un determinado software

según el uso por horas a la semana que se le da en dos empresas diferentes. Se obtiene una muestra

aleatoria de ocho semanas con la siguiente información.

Dia 1 2 3 4 5 6 7 8

Page 63: Capítulo viii

Empresa A 80 90 88 90 80 87 90 80 Empresa B 82 87 89 90 95 88 90 90

Para 0.05 de nivel de significancia, ¿puede la empresa consultora concluir que existe una diferencia en

el rendimiento de uso del software?

Solución:

Empresa A 80 90 88 90 80 87 90 80 Empresa B 82 87 89 90 95 88 90 90 d -2 3 -1 0 -15 -1 0 -10

n = 8 26d 3402

d 25.3d 0d

04.618

2)25.3(8340

1

22

n

dndS

d

Hipótesis:

H0: 0d

(No hay diferencia)

H1: 0d

(Hay Diferencia)

52.1

8

04.6

025.3

n

S

dt

d

d

De la tabla t de Estudent para dos colas, para un =0.05 ( /2=0.025)

t(0.025,7)= 2.365

Como (t(0.025,7)= -2.365 < t= -1.52 < t(0.025,7)= 2.365) se acepta la Ho.

Luego no hay diferencia en el rendimiento de uso.

Ejercicio 7. Se sometieron a 10 personas a un examen de programación realizado bajo Visual Basic

.NET “ORCAS”, antes y después de recibir cierta preparación intensiva en dicho herramienta, los

resultados fueron como sigue:

Individuo 1 2 3 4 5 6 7 8 9 10

Antes 70 84 88 110 105 100 110 67 79 86 Después 115 148 176 191 158 178 179 140 161 157

¿Proporcionan estos datos evidencia suficiente para decir que la preparación fue efectiva? Tome un

nivel de significancia del 1%.

Solución:

Antes 70 84 88 110 105 100 110 67 79 86 Después 115 148 176 191 158 178 179 140 161 157

Page 64: Capítulo viii

d -45 -64 -88 -81 -53 -78 -69 -73 -82 -71

n = 10 704d 511742

d 4.70d 0d

83.13110

2)4.70(1051174

1

22

n

dndS

d

Hipótesis:

H0: 0d

(No es efectiva)

H1: 0d

(Si es efectiva)

63.16

10

38.13

04.70

n

S

dt

D

D

De la tabla t de Estudent, para un =0.01

t(0.01,9)= -2.821

Como (t= -16.63 < t(0.01,9)= -2.821) se rechaza la Ho.

Luego hay suficiente evidencia para decir que la preparación fue efectiva.

Ejercicio 8. El área de logística de la UNHEVAL está realizando cotizaciones para la compra de

nuevas computadoras, para esta licitación se presentaron 2 tiendas comerciales locales, cada tienda

presentó una lista de 8 marcas conocidas de computadoras con sus respectivos precios, que se

muestran a continuación:

Para 0.05 de nivel de significancia, ¿puede el área de logística concluir que existe una diferencia en

los costos?

Solución:

108

402030500204020d

Marca Tienda 1 Tienda 2 Diferencia

HP 420 400 20

IBM 560 520 40

ACER 450 430 20

SONY 480 480 0

TOSHIBA 370 320 50

INTEL 450 480 -30

LEXMARK 410 390 20

MAXTOR 460 500 -40

Page 65: Capítulo viii

61.2218

2)10(84360

1

22

n

dndS

d

25.1

8

61.22

010

n

S

dt

D

D

Conclusión:

El valor experimental se encuentra aceptación por tanto concluimos aceptamos la H0 que no existe

diferencia en los costos.

9.5.4 EJERCICIOS PROPUESTOS

Ejercicio 1. Una empresa compara el rendimiento de una unidad de gasolina con su auto (km/un),

obtiene la gasolina en el grifo A y en el grifo B. Se obtiene una muestra aleatoria de ocho días con la

siguiente información.

Dia 1 2 3 4 5 6 7 8 Grifo A 80 90 88 90 80 87 90 80 Grifo B 82 87 89 90 95 88 90 90

Para 0.05 de nivel de significancia, ¿puede la empresa concluir que existe una diferencia en el

rendimiento de gasolina según los grifos?

Ejercicio 2. Se sometieron a 10 personas a un test antes y después de recibir cierta instrucción los

resultados fueron como sigue:

Individuo 1 2 3 4 5 6 7 8 9 10

Antes 70 84 88 110 105 100 110 67 79 86 Después 115 148 176 191 158 178 179 140 161 157

¿Proporcionan estos datos evidencia suficiente para decir que la instrucción fue efectiva? Tome un

nivel de significancia del 1%.

Ejercicio 3. Para comprobar si un tratamiento con ácidos grasos es eficaz en pacientes con eczema

atípico, se tomaron 10 pacientes con eczema de más de 9 meses y se les sometió durante 3 semanas a

un tratamiento ficticio (placebo) y durante las tres siguientes a un tratamiento con ácidos grasos.

Tras cada periodo, un médico ajeno al proyecto evaluó la importancia del eczema en una escala de 0

(no eczema) a 10 (tamaño máximo de eczema).

Los datos fueron los siguientes:

Placebo 6 8 4 8 5 6 5 6 4 5

Tratamiento 5 6 4 5 3 6 6 2 2 6

¿Es eficaz el tratamiento?

t(0,05;8)=1,860

Zona de rechazo Ho Zona de Aceptación Ho

t =1,25

Page 66: Capítulo viii

Ejercicio 4. En un programa de Control de Enfermedades Crónicas, la hipertensión Está incluida

como la primera patología a controlar. 15 pacientes hipertensos son sometidos al programa y

controlados en su tensión asistólica antes y después de 6 meses de tratamiento. Los datos son los

siguientes:

Individuo 180 200 160 170 180 190 190 180 190 160 170 190 200 210 220

Fin 140 170 160 140 130 150 140 150 190 170 120 160 170 160 150

¿Es efectivo el tratamiento?

Ejercicio 5. La tabla siguiente muestra los efectos de un placebo y de la hidroclorotiacida sobre la

presión sanguínea sistólica de 11 pacientes.

Placebo 211 210 210 203 196 190 191 177 173 170 163 H-cloro 181 172 196 191 167 161 178 160 149 119 156

Según estos datos experimentales, ¿podemos afirmar que existe diferencia en la presión sistólica

media durante la utilización de estos dos fármacos?

Ejercicio 6. a) Dos grupos de 7 cerdos fueron alimentados durante un cierto número de días con dos

alimentos A y B. Con los datos de incremento de pesos adjuntos, pruebe la hipótesis de que los alimentos

son equivalentes.

Alimento A 33 53 34 29 39 41 31 Alimento B 31 47 33 30 39 38 29

b) Supongamos ahora que el peso inicial de los animales es un factor que podría incidir en los aumentos

de peso y por ello se consideró que las raciones se aplicaran a parejas de cerdos de igual peso.

Suponiendo ahora que los datos que aparecen en la tabla corresponden a datos apareados, volvamos a

realizar la prueba que corresponde a esta nueva situación para ver si los alimentos son equivalentes o no.

Ejercicio 7. Se desea saber si existe diferencia de criterio entre dos profesores, respecto a la

calificación de un examen escrito. Para eso se hace calificar a cada profesor, separadamente, los

exámenes escritos de 14 alumnos. Las calificaciones aparecen en la tabla. Determine si existe

diferente criterio entre los profesores para colocar la nota. Use nivel de significación 0,05.

Alumno 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Profesor A 13 14 18 14 17 15 16 17 13 11 15 15 18 16 Profesor B 14 13 17 15 16 17 17 18 14 12 18 15 20 15

Ejercicio 8. Sometieron a 10 estudiantes a un test de aptitud matemática bajo dos condiciones; Una

sala en silencio y una sala con música ambiente. Los puntajes obtenidos fueron.

Estudiantes 1 2 3 4 5 6 7 8 9 10

Ptje sin música 114 121 136 102 99 114 127 150 129 130

Ptje con música 112 122 141 107 96 109 121 146 127 128

¿Hay diferencias en los puntajes?

Ejercicio 9. A una empresa le ofrecen impartir un curso de capacitación para aumentar el rendimiento

de sus trabajadores. La empresa decide enviar a quince de sus trabajadores elegidos al azar de toda la

plantilla. Para comprobar si el curso es beneficioso, se controla el tiempo que tardaban estos

trabajadores en realizar un trabajo antes de realizar el curso y después de realizar el curso. Los

resultados se reflejan en la tabla adjunta.

Page 67: Capítulo viii

Trab 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Ant 23.5 12.0 21.0 22.0 19.1 21.5 22.1 20.4 18.3 21.6 23.3 21.0 22.1 23.0 12.0

Desp 17.4 20.4 20.0 20.0 18.4 18.6 18.6 15.3 16.5 18.0 16.3 18.0 12.8 15.5 18.0

Ejercicio 10. En una universidad, la encargada de bienestar social piensa que la responsabilidad por

los estudios de los estudiantes de primer año hace que disminuyan la actividad física. Como esta está

muy correlacionada con un correcto peso corporal, tomó una muestra de los pesos de 12 estudiantes,

al comenzar el primer año y al finalizar. Los pesos fueron (en kilogramos):

Antes 85 70 54 56 72 103 88 77 76 69 45 91 Después 73 51 56 73 125 87 85 75 60 46 107 87

Dentro de un nivel de confianza del 99%, ¿puede afirmarse que ha aumentado el peso corporal de los

estudiantes durante el primer año, considere las muestras independientes?