pruebas de hipotesis · de una muestra aleatoria, ... (una media con varianza conocida) un...
TRANSCRIPT
PRUEBAS DE HIPOTESIS
Es posible estimar un parámetro a partir de datos muestrales, biensea una estimación puntual o un intervalo de confianza. Pero:
¿Si mi objetivo no es estimar un parámetro, sino determinar el¿Si mi objetivo no es estimar un parámetro, sino determinar el
cumplimiento de una hipótesis sobre el parámetro?
R=/ Pruebas de Hipótesis
PRUEBAS DE HIPOTESIS
Población (N)
µ
Muestra (n)
Resultados Decisión
lX
Parece que
lµ =
lµ = lµ >O
Hipótesis
µ? Evidencia
lX
l X
Al parecer
lµ >
PRUEBAS DE HIPOTESIS
Definición: Procedimiento estadístico que, a través del estudiode una muestra aleatoria, permite determinar el cumplimiento deuna hipótesis planteada sobre alguna característica de lapoblación.
Características:Características:
• La decisión se toma partiendo de la evidencia que se recaba a través deuna muestra aleatoria
• Determina mediante calculo de probabilidades si el cumplimiento de lahipótesis es razonable
PRUEBAS DE HIPOTESIS
Algunas Definiciones:
Hipótesis de investigación: Idea o conjetura que se tiene a priori yque se desea contrastar a través de la realidad.
“Es la suposición de una verdad que aún no se ha establecido, es decir, una
conjetura que se hace sobre la realidad que aún no se conoce y que se haconjetura que se hace sobre la realidad que aún no se conoce y que se haformulado precisamente con el objeto de llegar a conocimiento de nuevoshechos” Grasseau. Teoria de la Ciencia. Pag 103.
Ejemplos:
H1. La Planta de tratamiento de aguas residuales (PTAR) remueve un30% de las bacterias que llegan en los vertimientos.
H2.El tiempo de vida promedio de determinada bacteria es menor a10 días.
PRUEBAS DE HIPOTESIS
Algunas Definiciones:
Hipótesis Estadística: Representación de la hipótesis deinvestigación en forma de ecuación matemática y en función deparámetros poblacionales.
Ejemplo:Ejemplo:
H1: P = 0.30 La Planta de tratamiento de aguas residuales (PTAR) remueveun 30% de las bacterias que llegan en los vertimientos.
H2: El tiempo de vida promedio de determinada bacteria es menora 10 días.
10<µ
Las hipótesis de investigación pueden desglosarse en dos hipótesisestadísticas que se denominan Hipótesis nula e Hipótesis Alterna:
PRUEBAS DE HIPOTESIS
La hipótesis nula siempre debe plantearse en términos deigualdad, mientras que la hipótesis alterna dependerá delconocimiento que tenga el investigar del problema o de lahipotesis de investigación.
Ejemplo:
Caso 1. La Planta de tratamiento de aguas residuales (PTAR) remueve un30% de las bacterias que llegan en los vertimientos.
(H0): P = 0.3 vs (H1): P≠0.3 ó P>0.3 ó P<0.3
Caso 2. El tiempo de vida promedio de determinada bacteria es menora 10 días.
(H0): vs (H1):10<µ
Ejemplo:
10=µ
Bajo que criterio acepto o no acepto la hipótesis nula?
�La verdad o falsedad de la hipótesis NO puede conocerse contotal seguridad a menos que pueda examinarse toda lapoblación
�La única herramienta de la cual se dispone es aceptar orechazar la hipótesis nula con base en lo que se observe en una
0.250.25 0.30 0.30 0.350.35
Región Crítica Región de aceptación Región Crítica
Se acepta H1 Se acepta H0 Se acepta H1
P ≠ 0. 30 P = 0.30 P ≠ 0.30
Valores CríticosValores Críticos
rechazar la hipótesis nula con base en lo que se observe en unamuestra aleatoria. Es decir el valor del estimador dará algunaevidencia sobre el valor que asume el parámetro.
PRUEBAS DE HIPOTESIS
“Se debe entender que la aceptación de una hipótesisimplica tan solo que los datos no arrojaron suficienteevidencia que indique que esta no se cumple”.
ERRORES EN LAS PRUEBA DE HIPOTESIS
Condición realDecisión H0 verdadera H0 falsa
Rechazar H0 Error Tipo I ok
Aceptar H0 ok Error Tipo II
TIPOS DE ERROR EN PRUEBAS DE HIPOTESIS
Error Tipo I: Rechazar una hipótesis nula cuando es verdadera
Error Tipo II: No rechazar una hipótesis nula cuando es falsa
P(Error Tipo I) = = Nivel de significanciaα
βP(Error Tipo II) =
Potencia de la Prueba = 1- P(Error Tipo II)
Capacidad que tiene la prueba de rechazar una hipótesis nula cuando esta es falsa.
β
Lo ideal seria que tanto como sean muy pequeños, pero esto solo se logra aumentando el tamaño de la muestra
α β
ERRORES EN PRUEBAS DE HIPOTESIS
HH0 0 verdaderaverdadera HH00 FalsaFalsa
Valor Critico
No acepto H0Acepto H0
αβ
Nótese como los errores en pruebas de hipótesis están relacionados de manera inversa
EJECUCION DE UNA PRUEBA DE HIPOTESIS
1. Plantear una hipótesis de investigación.
2. Traducir la hipótesis de investigación en hipótesis estadísticas
3. Fijar Nivel de Significancia
4. Determinar un estadístico de prueba con distribución conocida (verificar supuestos).
α
(verificar supuestos).
5. Determinar región de aceptación y región de rechazo
6. Evaluar el estadístico de prueba en la muestra obtenidaaleatoriamente.
7. Contrastar estadístico de prueba versus región de aceptación y rechazo.
8. Decisión. Rechaza Ho si el valor del estadístico de prueba cae en la
región de rechazo
Estadísticos de prueba y sus distribuciones
H0 H1 SupuestosEstadístico de Prueba
Distribución
Varianza conocida
Varianza desconocida0µµ =
0µµ ≠
Caso 1 Comparación contra un valor objetivo
0µµ >
n
XZ
σ
µ0
−= Z
Varianza desconocida0µµ = 0µµ >
0µµ <
0PP =
0PP ≠
0PP >
0PP <
nS
XT 0
µ−=
n
PP
PPZ
oo )1(
0
−
−=
)1( −nt
Z
0σσ =0σσ ≠
0σσ >
0σσ <2
0
2
2 )1(
σ
SnX
−= 2
)1( −nχ
Estadísticos de prueba y sus distribuciones
H0 H1 SupuestosEstadístico de
PruebaDistribución
Varianzas conocidas
Varianzas desconocidas d=−µµ
2
2
2
1
2
1
2121 )()(
nn
xxZ
σσ
µµ
+
−−−=
Caso 2 Comparación de 2 poblaciones
Zd≠− 21 µµ
2121)()( xx
T−−−
=µµd>− 21 µµ Varianzas desconocidas
e iguales
Varianzas desconocidas y diferentes
Tamaño de muestra grande
Normalidad
d=− 21 µµ
Z
21
2121
11
)()(
nnS
xxT
p +
−−−=
µµ
2
*)1(*)1(
21
2
22
2
11
−+
−+−=
nn
SnSnS p 1
)(
1
)(
2
2
2
2
2
1
2
1
2
2
2
2
1
2
1
1
−+
−
+
=
n
nS
n
nS
n
S
n
S
V
)2( 21 −+ nntd>− 21 µµ
d<− 21 µµ
)(vt
dPP =−21
dPP ≠− 21
dPP >− 21
dPP <− 21
2
2
2
1
S
SF =
( ) ( )
2
22
1
11
2121
)ˆ1(ˆ)ˆ1(ˆ
ˆˆ
n
pp
n
pp
PPppZ
−+
−
−−−=
)1,1( 21 −− nnF12
2
2
1 =σ
σ1
2
2
2
1 ≠σ
σ
Forma de la Región de Rechazo
La forma región de rechazo depende de cómo se plantee lahipótesis alterna:
1. Hipótesis alterna unilateral (Una sola cola)
2. Hipótesis Alterna Bilaterales (dos colas)
Ejemplo
ASOFONDOS es la asociación que regula los fondos depensiones. Esta entidad sugiere que la edad de jubilacióndebe incrementarse, debido a que las condiciones de riesgode los individuos en la actualidad ha disminuido, lograndoincrementar su esperanza de vida, que hasta hace algunosaños se había calculado en 70 años, con una desviaciónaños se había calculado en 70 años, con una desviaciónestándar de 8.9 años. Su afirmación la planteafundamentándose en una muestra de 100 registros demuertes que dio como resultado una edad promedio demuerte de 71,8 años Que opina usted sobre la afirmación.
Determine el valor P.
Valor P como Criterio de Decisión
Definición: Probabilidad de que el estadístico de prueba arroje un resultado tan extremo o más extremo que el observado cuando la Hipótesis nula es verdadera
Criterio de Decisión
Si el valor P es relativamente grande (valor p > significancía)Si el valor P es relativamente grande (valor p > significancía)
Es razonable pensar que la Hipótesis nula puede ser cierta (se acepta Ho)
Si el valor P es muy pequeño (valor p < significancía) se rechaza la Hipótesis nula
“De forma ligera puede verse como la probabilidad de que la Hipótesis Nula sea Verdadera”
SOLUCIÓN
Paso 1. Planteamiento de Hipótesis de Investigación
La edad promedio de muerte es superior a 70 años
Paso 2. Planteamiento de Hipótesis Estadísticas
0 1: 70 VS : 70H Hµ µ= >
70µ >
Paso 3. Selección nivel de significancia
Paso 4. Selección y calculo del estadístico de prueba
0 1: 70 VS : 70H Hµ µ= >
05.0=α
02.21009.8
708.710 =−
=−
=n
xzc
σ
µ
SOLUCIÓN
Paso 5. Determinación Región de Aceptación, Rechazo
Región de rechazo
0.051.64z =
Paso 6. Contraste del estadístico de Prueba
Paso 7. Decisión
Rechazo Ho Parece lógico pensar que la esperanza de vida ha aumentado
Paso 8. Calculo del Valor P
2.02c
z =
0217.0)02.2( =>zp
Ejemplos
Ejemplo 1: (una media con varianza conocida)
Un fabricante de sistemas de aspersión utilizados para protección de incendiosen edificios de oficina, afirma que el verdadero valor promedio de activación delsistema es de 130°F. Una muestra de 9 sistemas, produce un promedio muestralde temperatura de activación de 131.08°F. Si la distribución de los tiempos deactivación es normal con desviación de 1.5°F, ¿Los datos contradicen laafirmación del fabricante al nivel de significancia del 0.01?afirmación del fabricante al nivel de significancia del 0.01?
Estadístico de prueba Distribución Referencia
n
XZ
σ
µ0−=
Z
Ejemplos
Ejemplo 2: (Una media con varianza desconocida)
Históricamente se ha observado que la cantidad promedio de oxigeno disuelto encierto rió es de 4,7 mg/lt. En los últimos días se ha instalado una nueva fabricaque arroja sus vertimientos sobre este rió y se tiene la idea de que estosvertimientos están contaminándolo. Para probar lo anterior se han tomadomuestras de agua durante 15 días, y se les mide la cantidad de oxigeno disuelto,observando un valor promedio de 3.8 con una desviación estándar de 0.9 mg/l.observando un valor promedio de 3.8 con una desviación estándar de 0.9 mg/l.Será necesario tomar correctivos frente a esta fabrica?. Asuma que lo datosproviene de una distribución normal.
Estadístico de prueba Distribución Referencia
ns
XT 0µ−
= )1( −nt
Ejemplos
Ejemplo 3: (Comparación de medias de 2poblaciones independientes, Varianzas conocidas)
Se investiga la resistencia a la tensión de ruptura del hilo proporcionado por dosfabricantes. De la experiencia con los procesos de los fabricantes, se sabe quepsi y psi. Una muestra aleatoria de 30 especímenes de prueba provenientede cada fabricante arroja como resultados psi, S=5 yfdfdfdfdd psi, S = 4, respectivamente. ¿Existe alguna evidencia que apoye la
51
=σ 42 =σ881 =x
912
=xfdfdfdfdd psi, S = 4, respectivamente. ¿Existe alguna evidencia que apoye laafirmación de que el hilo del fabricante 2 tiene mayor resistencia media?
912
=x
Estadístico de prueba Distribución Referencia
21
2121
11
)()(
nnS
xxT
p +
−−−=
µµ2
*)1(*)1(
21
2
22
2
11
−+
−+−=
nn
SnSnS p
)2( 21 −+nnt
EjemplosEjemplo 4: (Comparación de medias de 2poblaciones relacionadas (apareadas))
En un programa de control de enfermedades crónicas, la hipertensión estáincluida como la primera patología a controlar. 15 pacientes hipertensos sonsometidos al programa y controlados en su presión antes y después de 6 mesesde tratamiento. Los datos son los siguientes:
¿Se puede decir a un nivel de significación del 5% que el tratamiento es efectivoy logra disminuir en un promedio superior a 15 mmHg ?
Estadístico de prueba Distribución Referencia
1( 1)nt −
Inic. 180 200 160 170 180 190 190 180 190 160 170 190 200 210 220
Fin. 140 170 160 140 130 150 140 150 190 170 120 160 170 160 150
d
d
dT
S n
µ−=
EjemplosEjemplo 5: (Comparación de medias de kpoblaciones independientes)
Un ingeniero de desarrollo tiene interés en investigar la resistencia a la tensiónde una fibra sintética nueva que se usará para hacer telas de camisa paracaballero. Por experiencia se sabe que la calidad de la tela se ve afectada porla composición de algodón, el cual debe variar entre el 10% y 40% de lamezcla. Por tanto decide probar cinco niveles de algodón (15,20,25,30 y 35%)y como necesita valoración de la variabilidad decide hacer 5 replicaciones pory como necesita valoración de la variabilidad decide hacer 5 replicaciones porcada nivel.
Identifique:
a) Factor (es) de diseñob) Niveles del factor de diseñoc) Posibles Factores Perturbadoresd) Unidades Experimentalese) Cual seria su estrategia para eliminar un posible efecto de factoresperturbadores