respuestas de ejercicios
TRANSCRIPT
PRUEBAS DE HIPÓTESIS DE LAS VARIANCIAS DE DOS
POBLACIONES NORMALES
Cuando se trata de comparar las variancias se utiliza la variable F=S²1/S²2, que
como se sabe está relacionada con la distribución F con (n1-1, n2-1) grados de
libertad.
Se recomienda colocar siempre en el numerador la variancia muestral
asociada a la variancia poblacional mayor estos es,
a. Si H1: ²1 > ²2 La estadística de prueba se toma como F=S²1/S²2 .
b. Si H1: ²2 > ²1 La estadística de prueba se toma como F=S²2/S²1.
c. Si H1: ²1 ²2 La estadística de prueba se toma de tal manera que
la mayor de las variancias muestrales aparezca en el numerador.
Las tablas de la distribución F generalmente proporcionan los puntos de la
cola superior de la distribución F así que para encontrar valor de
la cola inferior, debe utilizarse
, donde f es el valor tabulado de F
[Vuelve a índice]
Ejemplo 1: Se comparó la eficacia de dos tipos de aceites para evitar el
desgaste en ciertas piezas sometidas a intenso trabajo. En trece piezas se
utilizó el aceite 1 y en otras trece el aceite 2. Las variancias muestrales fueron
S²1 = 64, S²2 = 16. Se desea verificar la hipótesis nula según la cual las
variancias de las dos poblaciones son iguales. ( = 0,05)
H0: ²1 = ²2
H1: ²1 ²2
n1 = n2 = 13, = 0,05
Como el valor calculado de F =4 supera el valor tabulado de la cola superior
de la distribución, no puede concluirse, al nivel del 5% que las variancias sean
iguales.
Siguiendo el criterio de colocar en el numerador siempre la variancia mayor,
es suficiente considerar el valor tabulado de la zona derecha de la distribución
F.
[Vuelve a índice]
CONTRASTE DE HIPÓTESIS REFERENTE A DOS MEDIAS
POBLACIONALES: MUESTRAS INDEPENDIENTES
Los desvíos de las poblaciones son conocidos
Los supuestos que se deben cumplir son que las medias
poblacionales 1 y 2 son normales, los desvíos poblacionales y
conocidos y las muestras, independientes, de tamaño n1 y n2 respectivamente,
estableciendo las siguientes hipótesis:
H0 ) 1 - 2 = 0 ó 1 = 2
a ) H1 ) 1 2
b) H1 ) 1 > 2
c) H1 ) 1 < 2
= 0,05
En cualquiera de estos casos el test estadístico que se utiliza es
que se distribuye como una N ( 0,1).
Si y son iguales, lo que equivale a decir que hay una sola variancia, la
fórmula anterior se puede reemplazar por la siguiente:
En el contraste a) valores grandes y pequeños de( )y por lo tanto
pequeños de Z son suficientes para confirmar H1. Por lo tanto para un ensayo
bilateral con nivel de significación , la hipótesis H0 se rechaza si :
Z < ó Z >
En el contraste b) sólo valores grandes de ( ) y de Z confirman la
hipótesis H1. En un ensayo unilateral, rechazamos H0 cuando:
Z > Z 1 -
En el contraste c) valores pequeños de la diferencias de medias muestrales y
por lo tanto valores pequeños de Z confirman H1 y rechazamos H0 cuando:
Z < Z
[Vuelve a índice]
Ejemplo 2: El porcentaje de calcio de dos muestras de soja se determinó por
dos métodos de mineralización: (A) cenizas secas y (B) mineralización
húmeda. Los datos obtenidos fueron:
(A): 0,32 3,32 0,36 0,29 0,27 0,29 0,28
(B): 0,35 0,35 0,34 0,36 0,31 0,28 0,28
Se sabe, por experiencias anteriores que 1 = 1 = 0,03. Se desea verificar si
ambos métodos producen los mismos resultados. ( = 0,05).
H0 ) A = B ó A - B = 0
H1 ) A B
Por ser un test bilateral, los valores críticos de la distribución normal, para =
0,05 son –1,96 y 1,96. Como el valor de la estadística calculada cae entre los
valores críticos, no hay evidencias como para rechazar la hipótesis nula. Por lo
tanto las media de los dos metodos de mineralización no difieren.
[Vuelve a índice]
Los desvíos de las poblaciones son desconocidos:
a) Se suponen iguales ( ):
Los supuestos que se deben cumplir son: datos extraídos de dos muestras
aleatorias independientes de tamaño n1 y n2 respectivamente, cuyas
poblaciones son normales con medias poblacionales 1 y 2. Las variancias
poblacionales no se conocen y se supone que son iguales. Primero se
debería docimar la igualdad de dichas varianzas, en particular si los tamaños
de las muestras son distintos, a través de la prueba de F de Snedecor. Si son
estadísticamente iguales, aplicamos el siguiente test estadístico:
donde
que se distribuye aproximadamente como una t de Student con n1 + n2 -2
grados de libertad. (tn1 + n2 - 2)
[Vuelve a índice]
Ejemplo 3: Dieciocho plantas de una misma variedad de naranjos fueron
tratadas con fertilizantes. A nueve de ellas se les aplico una cierta dosis de
nitrógeno (N) y al resto una de nitrógeno y fósforo (NP). Se midió el
rendimiento en Kg. por planta; los resultados obtenidos fueron:
_
N: X = 28 kg S² = 9
_
NP: X = 21 kg S² = 7
Interesa conocer si existen diferencias significativas entre los rendimientos de
las plantas tratadas con los dos tipos de fertilizante. ( = 0,01).
H0 ) N = NP ó N - NP = 0
H1 ) N NP
Suponiendo que las variancias poblacionales son iguales, de las cuales S²N y
S²NP son estimaciones, se calcula la variancia amalgmada. Si el supuesto no
fuera válido debería verificarse primeramente la homogneidad de varinacia a
través del test F, en particular si las muestras de las poblaciones no son
iguales.
Donde
El valor tabulado de t, para 16 grados de libertad y nivel de significación del
1% es igual a 2,921. Como el valor de la estadística calculada supera al
valor tabulado, se rechas H0 . Conclusión existen diferencias estadísticamente
significativas entre los tratamientos, siendo superior el promedio por planta de
naranjo, de aquellas que reciben el tratamiento NP.
[Vuelve a índice]
b) se suponen distintos ( )
Los supuestos son los mismos, pero el test estadístico es:
estadística que se distribuye aproximadamente como una t de Student con
grados de libertad que se obtienen mediante la fórmula de Satterwitte:
Gráficamente podemos representar la zona de aceptación y rechazo en la
distribución t
si t < -t t > t si t -t ó t t
Se rechaza H0 Se rechaza H0 Se rechaza H0
[Vuelve a índice]
CONTRASTE DE HIPÓTESIS REFERENTE A DOS MEDIAS
POBLACIONALES: MUESTRAS APAREADAS
Esta estrategia de la investigacióm surge cuando cada observación para un
tratamiento está apareada con otra observación para el otro tratamiento. Este
par está compuesto por las mismas unidades experimentales observadas dos
veces en distintos momentos de la investigación, o por unidades semejantes.
El procedimeinto consiste en buscar pares de unidades experimentales con
características similares y asignar aleatoriamente cada unidad del par a cada
uno de los dos tratamientos en estudio. Por ejemplo parejas de gemelos
pueden ser asignadas al azar para que reciban dos tratamientos, de tal manera
que los miembros de una sola pareja, reciban tratamientos distintos. Pueden
así mismo ensayarse dos raciones distintas en dos lotes de terneros formando
pares de raza de la misma edad, sexo, etc. y ocurrir que al cabo de un tiempo ,
exista diferencia significativa o no, entre los promedios de ganancia de peso
de ambos lotes, (se elimina la influencia diferencia de calidad entre los lotes).
También puede ocurrir que al estudiar en dos lotes de plantas homogéneas de
a pares, la aplicación de herbicidas (uno en cada lote), para ciertas plagas (se
obtenga diferencias de resistencia entre los lotes de plantas).
La hipótesis planteada es:
H0 ) ó H0) ó H0)
H1 ) H1) > 0 H1) < 0
= 0,05
Como se establece una hipotesis de un único parámetro poblaciona (se podría
pensar en una sola muestra) , el número de grados de liberatd es (n - 1)
el test estadístico es:
donde
luego se compara el tc con tn -1 . Las reglas de decisión son:
No se rechaza H0 cuando -t < t < t
Rechazar H0 si t < -t ó t > t
[Vuelve a índice]
Ejemplo 4: La siguiente tabla muestra los niveles de colesterol en suero para
12 individuos , al principio del programa (ANTES) y al final del mismo
(DESPUES).
INDIVIDUO ANTES XI DESPUES YI di di2
1
2
3
4
5
6
7
8
9
10
11
12
201
231
221
260
228
237
226
235
210
267
284
201
200
236
216
233
224
216
296
195
207
247
210
209
- 1
+ 5
- 5
- 27
- 4
- 21
- 30
- 40
- 33
- 20
- 74
+ 8
1
25
25
625
16
441
900
1600
1089
400
5176
64
TOTAL -242 10.766
La pregunta que se plantea es: ¿proporcionan los datos suficiente evidencia
cómo para concluir que el programa es efectivo en la reducción de los niveles
de colesterol en suero?
Aplicar un test de hipótesis para llegar a una decisión al repecto, utilizando
un del 0,05.
Las hipótesis planteadas son:
H0)
H1) < 0
= 0,05
t (11; 0,05) = - 1,7959 (valor de tabla)
Se rechaza H0 ya que -3,02 es menor que -1,7959
Conclusión: Se rechaza la hipótesis nula, existen diferencias altamente
significativas entre ANTES y DESPUES. El programa es efectivo.
[Vuelve a índice]
PRUEBA DE HIPÓTESIS REFERENTE A DOS PROPORCIONES
POBLACIONALES
Sean y las proporciones muestrales de dos grandes muestras de
tamaños n1 y n2 extraídas de poblaciones que tienen proporciones P1 y
P2 respectivamente. Considérese la H0 de que no hay diferencias entre los
parámetros poblacionales, es decir:
H0 : P1 = P2, implica que (P1 – P2) = 0
H1: P1 P2
Una estimación de la proporción poblacional se puede obtener como:
La distribución muestral de la diferencia de proporciones se distribuye
aproximadamente normal con media y variancia dadas por:
p1-p2 = 0 ²p1-p2 = pq(1/n1+1/n2) (los p de los subíndice tienen sombrero)
y
Por lo tanto la estadística de prueba esta dada por:
N(0, 1)
[Vuelve a índice]
Ejemplo 5: Sobre parcelas sembradas con dos variedades distintas de maíz (A
y B), se aplicó un herbicida que resultó ser nocivo en el sentido que destruyó
gran parte de las plantas. De un total de 500 plantas de la primera variedad
fueron destruidas 200 y de 570 plantas de la segunda variedad, murieron
también 200. ¿Se puede considerar que el herbicida es igualmente nocivo para
las dos variedades?. ( = 0,05).
H0 : PA = PB, implica que (PA – PB) = 0 H1: PA PB
Por ser una prueba bilateral, los valores críticos de la distribución normal son
–1,96 y 1,96 ( =0,05), como el valor de Z = 1,l8 cae entre estos valores, no
se rechaza la hipótesis nula.
Conclusión: Se puede considerar que el herbicida es igualmente nocivo para
las dos variedades.
CONTRASTE DE HIPÓTESIS RESPECTO A UNA MEDIA
POBLACIONAL ( desconocido)
Las hipótesis se plantean de forma similar al caso en que es conocido, pero
la estadística de prueba es la "t" de Student.
Ejemplo: Para estimar el rendimiento de parcelas plantadas con papa de una
cierta variedad, se cosecharon ocho de ellas, obteniéndose la siguiente
información expresada en kg/parcela:
4,5 5,3 5,4 4,9 5,3 5,7 6,2 4,8
¿Se puede asegurar, con =0,05, de que esta variedad de papas tiene un
rendimiento promedio de 5,25 kg?
H0 : = 5,25
H1 : 5,25
A partir de los datos se calcula y S², para este ejemplo = 5,5625 y S²
=0,2884.
=
Como el valor de t calculado cae entre –2,365 y 2,365 (valor tabulado de t
para 7 grados de libertad y = 0,025, no se rechaza la hipótesis nula.
Conclusión: No hay duficiente evidencia, a partir de los datos de la muestra,
para decir que el rendimiento de papa por parcela no es igual a 5,25.
[Vuelve al índice]
CONTRASTE DE HIPÓTESIS REFERENTES A UNA PROPORCIÓN
POBLACIONAL (P)
Las hipótesis formuladas son:
H0: P P0
H1: P < P0
: 0,05
En el caso del parámetro poblacional "P", cuando el tamaño de la muestra es
grande, la variable aleatoria proporción muestral "p" se distribuye
aproximadamente normal con esperanza igual a P y desviación estandar
igual
Por eso se puede utilizar "p" como criterio de test para probar la hipótesis con
respecto al parámetro proporción poblacional. El test estadísto z se calcula:
Gráficamente podemos establecer la correspondiente región de rechazo de
H0 en la cola de la distribución normal
Ejemplo: Se supone que en un cierto partido de la provincia de Buenos Aires,
el 90% de los productores cultivan maíz. De 110 productores de la zona que
se encuestaron, 95 hacen maíz. ¿Está este resultado en conformidad con el
valor supuesto?. ( = 0,05)
H0: P = 0,90
H1: P 0,90
Como el valor calculado de Z = –0,97 reside entre los valores tabulados –1,96
y 1,96 (valores críticos de la distribucion normal ) no se rechaza H0.
Conclusión, la información proporcionada por la muestra no es suficiente
como para decir que la proporción de productes de tal partido que cultivan
maíz es distinto de 90%.
[Vuelve al índice]
CONTRASTE DE HIPÓTESIS REFERENTES AL PARÁMETRO
VARIANZA POBLACIONAL
Por ejemplo, un operador en la bolsa de cereales, aconseja a un cliente con
respecto a una inversión de compra y destaca la poca variabilidad de dicha
cotización. De acuerdo a lo estipulado por él, esta acción presentaría una
varianza en las cotizaciones diarias = 0,2.
El cliente, quien debe realizar una fuerte inversión, decide poner a prueba la
hipótesis del operador, estableciendo las siguientes hipótesis estadísticas:
H0) 0,2
H1) > 0,2
Fijamos: = 0,05, como nivel de significación.
Para probar esta hipótesis selecciona una muestra de 15 días donde se registra
la cotización diaria. El cálculo de la varianza en la muestra es S2 = 0,4.
El test estadístico es:
que se distribuye como una con (n - 1) grados de libertad.
Se calcula el valor del estadístico planeado:
Gráficamente se tendrá:
Como se puede observar, el estadístico utilizado como criterio para realizar el
test, cae en la zona de rechazo de la hipótesis nula.
Conclusión: La evidencia muestral parece indicar que el operador estaba
equivocado y que en realidad la cotización diaria es bastante más variable de
lo que él cree.
EJERCICIO 1
Un criador de pollos sabe por
experiencia que el peso de los
pollos de cinco meses es 4,35
libras. Los pesos siguen una
distribución normal. Para tratar
de aumentar el peso de dichas
aves se le agrega un aditivo al
alimento. En una muestra de
pollos de cinco meses se
obtuvieron los siguientes pesos
( en libras).
4,41 4,37 4,33 4,35 4,30 4,39 4,36 4,38 4,40
4,39
En el nivel 0,01, el aditivoa ha
aumentado el peso medio de los
pollos? Estime el valor de p.
EJERCICIO 2
Una empresa que se dedica a
hacer en cuestas se queja de
que un agente realiza en
promedio 53 encuestas por
semana. Se ha introducido una
forma más moderna de realizar
las encuetas y la empresa quiere
evaluar su efectividad. Los
números de encuestas
realizadas en una semana por
una muestra aleatoria de
agentes son:
53 57 50 55 58 54 60 52 59 62 60 60
51 59 56
En el nivel de significancia
0,05, puede concluirse que la
cantidad media de entrevistas
realizadas por los agentes es
superior a 53 por semana?
Evalúe el valor p.
EJERCICIO 3
Lisa Monnin es directora de
presupuesto en la empresa New
Process Company, desea
comparar los gastos diarios de
transporte del equipo de ventas
y del personal de cobranza.
Recopiló la siguiente
información muestral ( importe
en dólares).
Ventas ($) 131 135 146 165 136 142
Cobranza ($) 130 102 129 143 149 120 139
Al nivel de significancia de 0,10,
puede concluirse que los gastos
medios diarios del equipo de
ventas son mayores? cuál es el
valor p?
EJERCICIO 4
De una población se toma una
muestra de 40 observaciones.
La media muestral es de 102 y
la desviación estándar 5. De
otra población se toma una
muestra de 50 observaciones.
La media mustral es ahora 99 y
la desviación estándar es 6.
Realice la siguiente prueba de
hipótesis usando como nivel de
significancia 0,04.
Ho: u1 = u2
Ho: u1 ≠ u2
a) Es esta una prueba de una o
de dos colas?
Esta es una prueba de
hipótesis de dos colas
b ) Establezca la regla de
decisión
Si Z > que le valor crítico, se
rechaza la hipótesis nula y se
acepta la hipótesis alternativa
c) Calcule el valor del
estadístico de prueba
Si Z > que el valor crítico, se rechaza la hipótesis nula y se acepta H1
d) Cuál es su decisión respecto
a la hipótesis nula?
Como su valor calculado Z
(2,59) > 2,05; se rechaza la
hipótesis nula y se acepta la
hipótesis alternativa
Si Z tabulada es 0,5 - 0,02 =
0,48 este valor en la tabla es
2,05
e) Cuál es el valor p?
Z = 2,59 Area 0,4952
0,5 - 0,4952 = 0,0048 *
2 = 0,0096