Download - ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006
ANÁLISIS E INTERPRETACIÓN DE ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS RESULTADOS ESTADISTICOS
Dr. Carlos Calderón Cabada
Lima, Junio 2006Lima, Junio 2006
PRUEBAS ESTADISTICAS
PARAMETRICAS
Prueba “t”
de Student
¿QUE ES LA PRUEBA “t” ?
ES UNA PRUEBA ESTADISTICA PARA
EVALUAR SI DOS GRUPOS DIFIEREN ENTRE SI DE
MANERA SIGNIFICATIVA RESPECTO DE SUS MEDIAS.
SIMBOLO
“ t “
)1(
/
ntóndistribucitienenS
xt
SE CALCULA PARA MUESTRAS PEQUEÑAS DE DISTRIBUCION NORMAL
SE CALCULA PARA MUESTRAS GRANDES DE DISTRIBUCION NORMAL
2211
21
// 22 NSNS
xxt
HIPOTESIS A PROBAR
Se trata de comparar dos grupos:
La hipótesis alternativa plantea que los grupos difieren
significativamente entre si y la hipótesis nula propone que los
grupos no difieren significativamente entre si.
VARIABLE INVOLUCRADA
LA COMPARACION SE REALIZA SOBRE LA VARIABLE INDEPENDIENTE, SI
EXISTEN OTRAS SE DEBE EFECTUAR VARIAS PRUEBAS “t” UNA POR CADA
VARIABLE.
EL NIVEL DE MEDICION DE LAS VARIABLES ES EL DE INTERVALO
O RAZON
INTERPRETACION
PARA GRUPOS PEQUEÑOS (n < 30)
X la media del grupo. µ la media poblacional S la Desv. Estandar n = tamaño de muestra
)1(
/
ntóndistribucitienenS
xt
INTERPRETACION
Para saber si el valor “t” es significativo, se aplica la formula y se calculan los grados de libertad.
La prueba “t” se basa en una distribución muestral o poblacional de diferencia de medias conocidas como la “t de Student”,
Esta distribución es identificada por los grados de libertad, los cuales constituyen el numero de maneras como los datos pueden variar libremente.
RECOMENDACION
Mientras mayor sea el numero de grados de libertad la distribución “t de Student” se acerca mas a ser una distribución normal.
Si los grados de libertad exceden los 120 la Distribución Normal es utilizada como una aproximación adecuada de la “t de Student”.
Calculado “t” y los gl (grados de libertad) SE ELIGE el nivel de significancia y se compara el valor obtenido con el mostrado en la Tabla
Distribución t-Student
0 t1-
t(v)
)1(/
ntóndistribucitienenS
xT
Para muestras pequeñas de población normal
PRUEBA “t”
CALCULO DE LOS GRADOS DE LIBERTAD
gl = (N1 + N2) – 2
N1 y N2 representan al tamaño de cada grupo comparado.
EVALUACION DE RESULTADOS
Si nuestro valor calculado es igual o mayor que el de la Tabla, se acepta la hipótesis alternativa.
Pero si el valor es menor se acepta la hipótesis nula.
USO DE LA TABLA……..
EJERCICIOS
Tomar la Tabla “t” y calcular: Media Muestral = Media Poblacional = α = n = gl. (t-1) =
DESCANSO
HIPOTESIS A CONTRASTAR
datos de la muestra
Se definen:
Las hipótesis nula y alternativa con una distribución de probabilidad conocida
Regla de decisión(nivel de significación )
Valor crítico o tabulado
Se calcula una medidaasociada a la hipótesis
que se desea docimar
Se comparan los valores calculado con tabulado
¿se rechaza Ho?
NOSIH1
Se extraen conclusiones
Utilizar prueba de ZSi
No
Si
Utilizar prueba de Z
No
¿Se conoce ?
¿Se conoce ?
Utilizar prueba de Z
Utilizar prueba de t
¿Se conoce?
¿Se conoce?
Si
No
Es n ≥ 30? Es n ≥ 30?
No
Si
Utilizar prueba de Z (por el teorema central del límite)
¿Se conoce?¿Se conoce?
Utilizar prueba de Z (por el teorema central del límite)
Si
¿Se sabe q la población es normal?
¿Se sabe q la población es normal?
No
Si
Es n ≥ 30?Es n ≥ 30?Utilizar una prueba no paramétrica
Se acepta la hipótesis nula si el estadístico de la prueba cae dentro de esta región.
Se rechaza la hipótesis nula
Se rechaza la hipótesis nula
Area A = área B y (A+B) = el nivel deseado de significancia
Valor critico
Valor teórico de la diferencia
+ Valor critico
Area A Area B
Esquema cuando se comprar la diferencia entre dos medias o proporciones muéstrales
Númerode
grupos
Esquema de selección de pruebas estadísticas cuando la variable dependiente es continua u ordinal
1 Grupo
2 Grupos
3 a más Grupos
Independientes
n > = 30
Prueba Z para la media
n > = 30
Distribución normal
Prueba Z para la diferencia de medias
Prueba de Mann-Whitney paracomparación de poblaciones
n > = 30
Prueba Z para la media de la diferenciaen datos apareados
Independientes
Distribuci ónnormal
Prueba T para la media de ladiferencia en datos apareados
Prueba del signo o de Wilcoxonpara datos apareados
Distribuciónnormal c/varian-zas semejantes
ANVA - Comparación de tratamientos
Prueba de Kruskal-Wallis - Comparac. de Trat.
Distribuciónnormal c/varian-zas semejantes
ANVA en Bloque - Comparac. de Tratam.
Prueba de Friedman - Comparac. de Tratam.
Distribuciónnormal
Prueba T para la media
Prueba del signo para la mediana
Varianzasiguales
Prueba T paradiferencia de medias
Prueba T con ajustede grados de libertad
Si
No
Si
No
Si
No
Si
No
Si
No
Si
No
Si
No
Si
No
Si
No
No
Si
Si
No
Escala demedición
para ambasvariables
Esquema de selección de pruebas estadísticas para medirrelación entre variables
Continua
Coeficiente de Correlación por rangos de Spearman
Coeficiente de correlación lineal de Pearson
Cada variabletiene dos
categorías(tablas 2x2)
- Prueba Ji-Cuadrado (Coeficiente )- Riesgo Relativo (Estudios de cohorte)- Odds Ratio (Estudios de Casos-control)- Coeficiente de concordancia Kappa (Comparación de métodos)
Prueba Ji-Cuadrado para Independenciade variables (Coeficiente de
Contingencia)
Si
No
Ordinal y/onumérica
Nominal
Hipótesis estadística según Hipótesis estadística según Número de grupo y tipo de variableNúmero de grupo y tipo de variable
Número de Grupos
Un grupo Dos grupos Tres o más grupos
Variablecuantitativa
Variablecategórica
Variablecuantitativa
Variablecaategórica
Variablecuantitativa
Variablecategórica
Hipótesis:= 0
Parámetro
media
Hipótesis: P=P 0
ParámetroProporción
Hipótesis:=2
Parámetrosmedias
Hipótesis:2
1=22
Parámetrosvarianzas
Hipótesis: P 1 = P 2
ParámetrosProporciones
Hipótesis:=...= kParámetros
k medias
Hipótesis:2
122=
...= 2k
Parámetrosk varianzas
Hipótesis: P 1 = P 2 =
....= P kParámetrosk Proporciones
Hipótesis:2 < 2
0
Parámetro:
varianza
Prueba de Correlación de Prueba de Correlación de Rango de SPEARMANRango de SPEARMAN
El coeficiente de correlación por rango se define como:
Donde:N: # de observaciones, # de individuos o fenómenos
clasificados por rango.
di: Diferencia en los rangos atribuida a dos características diferentes del i-ésimo individuo o fenómeno.
)1N(N
d61r 2
2i
s
)1N(N
d61r 2
2i
s
PRUEBA DE CORRELACION DE RANGO DE SPEARMANPRUEBA DE CORRELACION DE RANGO DE SPEARMAN
La correlación por rangos de Spearman mide la relación entre dos variables que han sido clasificadas por orden de menos a mayor (o de mayor a menor)
La correlación por rangos de Spearman mide la relación entre dos variables que han sido clasificadas por orden de menos a mayor (o de mayor a menor)
Una empresa contrató a 7 técnicos en informática, que fueron sometidos a un examen de conocimientos básicos. Luego de un año de servicio, se calificó su rendimiento en el trabajo. A continuación, se muestran los resultados:
EJEMPLOEJEMPLO
TécnicoPuntuación en el
examenClasificación por
rendimiento
J. Manzo 82 4
M. Contreras 73 7
C. Gutarra 60 6
F. Olaechea 80 3
D. Barrientos 67 5
F. Estombelo 94 1
J. Cordova 89 2
Se utiliza la correlación por rangos de Spearman para determinar, si hay relación entre las calificaciones del examen y el rendimiento en el trabajo
1º Se elabora la clasificación de las puntuaciones del examen
1º Se elabora la clasificación de las puntuaciones del examen
Técnico Puntuación en el examen
Clasificación por el examen (X)
Clasificación por rendimiento (Y)
J. Manzo 82 3 4 -1 1
M. Contreras 73 5 7 -2 4
C. Gutarra 60 7 6 1 1
F. Olaechea 80 4 3 1 1
D. Barrientos 67 6 5 1 1
F. Estombelo 94 1 1 0 0
J. Cordova 89 2 2 0 0
idYX 2i
2 d)YX(
2º Se calcula del coeficiente de correlación por rangos de Spearman rs:
2º Se calcula del coeficiente de correlación por rangos de Spearman rs:
857.0)17(7
861
)1N(N
d61r 22
2i
s
857.0)17(7
861
)1N(N
d61r 22
2i
s
Un coeficiente de correlación oscila entre -1 y 1; los resultados muestran una fuerte relación positiva entre las puntuaciones de examen de cada técnico y su rendimiento en le trabajo
Un coeficiente de correlación oscila entre -1 y 1; los resultados muestran una fuerte relación positiva entre las puntuaciones de examen de cada técnico y su rendimiento en le trabajo
Contrastando la hipotes:Contrastando la hipotes:
H0: ρs = 0, no hay relación entre las dos variables
H1: ρs ≠ 0, hay relación entre las dos variables
H0: ρs = 0, no hay relación entre las dos variables
H1: ρs ≠ 0, hay relación entre las dos variables
Tabla N, con α=0.10, n=7; los valores críticos serían: ± 0.6786
Como rs está fuera de la región de aceptación, rechazamos la H0. Se concluye, al 90% de confianza, existe relación entre las puntuaciones del examen y el orden de rendimiento en el trabajo
Como rs está fuera de la región de aceptación, rechazamos la H0. Se concluye, al 90% de confianza, existe relación entre las puntuaciones del examen y el orden de rendimiento en el trabajo
-0.6786Valor critico
+0.6786Valor critico
0.8570.857
0.050.05
Se Rechaza
Se Rechaza
Se acepta
Intervalo de confianza para la diferencia de medias
b) Si las varianzas 12 y 2
2 son desconocidas
Para muestras grandes
donde
212/121 )( xxSZxxL
2
22
1
21
21 ns
ns
S xx
Cambiar de tema
ANALISISNO
PARAMETRICO
CONSIDERACIONES
La mayoría no de estos análisis no requiere de presupuestos acerca de la forma de la Distribución Poblacional.
Las Variables no necesariamente deben estar medidas en un nivel de intervalo (orden y categoría cero no real) o de razón ( el cero es real) .
Pueden analizarse datos nominales (sin orden ni categoría -Sexo) u ordinales (orden de mayor a menor- primero, segundo).
En todo caso la variables deben ser categóricas.( en días, meses, años, etc.)
METODOS O PRUEBAS NO PARAMETRICAS MAS
EMPLEADAS 1) LA Ji CUADRADA – CHI-CUADRADA 2) COEFICIENTES DE CORRELACION E
INDEPENDNENCIA PARA TABULACIONES CRUZADAS.
3) LOS COEFICIENTES DE CORRELACION PARA RANGOS ORDENADOS DE SPERMAN Y KENDALL
Ji - CUADRADA
Es una prueba estadística para evaluar hipótesis acerca de la relación entre dos variables.
Se simboliza por : ²א Prueba hipotesis Correlacionales Variables involucradas : dos ( no considera
relaciones causales) Nivel de medicion de variables: Nominal y
Ordinal.
Ji - CUADRADA
La Chi – Cuadrada se calcula a traves de una Tabla de contingencia o Tabulacion
cruzada, que constituye una Tabla de dos dimensiones o matriz de dos x dos.
Cada dimension contiene una variable.
Cada variable se subdivide en dos o mas categorias.
La Prueba Ji-CuadradoDistribución Ji-Cuadrado
n21 Z , ... , Z , ZSupóngase que se tiene una serie de variables aleatorias independientes con distribución normal estándar, , entonces la variable aleatoria , sigue una distribución Ji-Cuadrado.
2n
21 Z...ZX
2χ
La Prueba Ji-Cuadrado
FUNCIÓN DE DENSIDAD MEDIA Y VARIANZA.2χ
Hipótesis nula:Las variables son independientes
Se construye o se obtiene una tabla de tabulación cruzada para las frecuencias reales
observadas (Oij )
Procedimientos para usar el análisis de ji cuadrada y Procedimientos para usar el análisis de ji cuadrada y probar la independencia de dos variables nominales probar la independencia de dos variables nominales
Suponiendo que las variables son independientes, se construye una tabla de
tabulación cruzada para las frecuencias teóricas ( Eij)
Se determina el nivel de significado deseado en la prueba.
Se determina el valor calculado del estadístico ji
cuadrada
r
1i
c
1j ij
2ijij2
E
EO
Tabla 4. Distribución de ji-cuadrado
Probabilidad de un valor superior
Grados de libertad 0,1 0,05 0,025 0,01 0,005
1 2,71 3,84 5,02 6,63 7,88
2 4,61 5,99 7,38 9,21 10,60
3 6,25 7,81 9,35 11,34 12,84
4 7,78 9,49 11,14 13,28 14,86
5 9,24 11,07 12,83 15,09 16,75
6 10,64 12,59 14,45 16,81 18,55
7 12,02 14,07 16,01 18,48 20,28
8 13,36 15,51 17,53 20,09 21,95
9 14,68 16,92 19,02 21,67 23,59
10 15,99 18,31 20,48 23,21 25,19
USO DE LA TABLA
α]χχ[P 2n,α
2
2n,αχ
α
El área sombreada de naranja representa la probabilidad que se determinada por , donde:
es el valor critico del margen superior de la tabla, y son los grados de libertad del margen izquierdo de la tabla.
n
Tabla 4. Distribución de ji-cuadrado
Probabilidad de un valor superior
Grados de libertad 0,1 0,05 0,025 0,01 0,005
1 2,71 3,84 5,02 6,63 7,88
2 4,61 5,99 7,38 9,21 10,60
3 6,25 7,81 9,35 11,34 12,84
4 7,78 9,49 11,14 13,28 14,86
5 9,24 11,07 12,83 15,09 16,75
6 10,64 12,59 14,45 16,81 18,55
7 12,02 14,07 16,01 18,48 20,28
8 13,36 15,51 17,53 20,09 21,95
9 14,68 16,92 19,02 21,67 23,59
10 15,99 18,31 20,48 23,21 25,19
Uso de la tabla Ji-Cuadrado
10.0]10n | χ99.15 [ P 2
05.0]5n | χ07.11 [ P 2
Martha Revilla, directora de mantenimiento de la calidad en MEGA, elige 29 bicicletas y halla una varianza en la distancia entre ejes de 32.7 pulgadas cuadradas. Si la señora Revilla tienen que garantizar que la variación no supere 27 pulgadas cuadradas ¿indica esto que se cumplen las normas de producción? (α=0.05)
EJEMPLOEJEMPLO
HipótesisHipótesisHipótesisHipótesis 27H 27H 21
20 27H 27H 2
12
0
Prueba de una cola a la derechaPrueba de una cola a la derecha
277.32s
29n
2
2
91.33
277.32129s1n
2
22
91.33
277.32129s1n
2
22
0.05
41.33733.91
2
2f
Como X2=33.91<41.337 la señora Revilla no rechazará la H0 y confiará al 95% en que se cumplen las normas de producción
Como X2=33.91<41.337 la señora Revilla no rechazará la H0 y confiará al 95% en que se cumplen las normas de producción
337.41228;05.0 337.412
28;05.0
¿Que pasaría, si las instrucciones de la señora Revilla fueran que la variación se mantuviera inferior a 27 pulgadas cuadradas?
27H 27H 21
20 27H 27H 2
12
0
Prueba de una cola a la izquierdaPrueba de una cola a la izquierda
33.91
2
2f
0.05
X2 =33.91, la señora Revilla no rechazará la H0 y confiará al 95% en que se cumplen las normas de producción
X2 =33.91, la señora Revilla no rechazará la H0 y confiará al 95% en que se cumplen las normas de producción
16.928
928.16228;95.0 928.162
28;95.0
La señora Revilla, ahora elabora un intervalo de confianza del 90% para la varianza de la distancia entre ejes.
16.928 2
2f
0.05
Revilla puede confiar al 90% en que la varianza de la distancia entre ejes se encuentra entre 22.15 y 54.09 pulgadas cuadradas
Revilla puede confiar al 90% en que la varianza de la distancia entre ejes se encuentra entre 22.15 y 54.09 pulgadas cuadradas
0.050.90
41.3370.95
2
28;95.0
22
228;05.0
2 s1ns1n
2
28;95.0
22
228;05.0
2 s1ns1n
09.5415.22
928.167.32129
337.417.32129
2
2
09.5415.22
928.167.32129
337.417.32129
2
2
Prueba Ji-Cuadrado de Independencia
Y
X Categ. 1 ...... Categ. s Total
Cat. 1 O11 ...... O1s R1
......... ....... ...... ....... .....
Cat. r Or1 ...... Ors Rr
Total C1 ...... Cs n
H0: Las variables X e Y son independientes H1: Existe asociación entre X e Y
Prueba Ji-Cuadrado de Independencia
Estadística
0
1 0
2 0
3 0
4 0
5 0
6 0
7 0
8 0
A l t o M e d i o B a j o
S i N o
r
1i
c
1j ij
2ijij2
E
)EO(
n
CRE,donde ji
ij
21
2
.C.R
Ejemplo de Prueba Ji-Cuadrado de independencia
Para verificar la suposición de que la fabricación de cierto producto está asociado con enfermedades respiratorias, a 450 trabajadores de una empresa que fabrica el producto se evaluó respecto a la presencia de síntomas de alteraciones respiratorias y se los clasificó a su vez de acuerdo al nivel de exposición al producto. Los resultados se presentan en la tabla siguiente:
Presencia de Síntoma
Nivel de ExposiciónTotal
Alto Medio Bajo
Si 175 43 27 245
No 90 60 55 205
Total 265 103 82 450
H1: Las alteraciones respiratorias están asociadas a la exposición al producto
H1: Las alteraciones respiratorias están asociadas a la exposición al producto
H0: Las alteraciones respiratorias son independientes de la exposición al producto.
H0: Las alteraciones respiratorias son independientes de la exposición al producto.
Frecuencias Esperadas:
n
CRE ji
ij n
CRE ji
ij
4.37
45082205
nCR
E 3223 Por ejemplo:
Presencia de Síntoma
Nivel de ExposiciónTotal
Alto Medio Bajo
Si 144.3144.3 56.156.1 44.644.6 245
No 120.7120.7 46.946.9 37.437.4 205
Total 265 103 82 450
Estadística
0
1 0
2 0
3 0
4 0
5 0
6 0
7 0
8 0
A l t o M e d i o B a j o
S i N o
2
1i
3
1j ij
2ijij2
E
)EO(
n
CRE,donde ji
ij
21
205.0
.C.R
4.364504.37
55...
3.144175
nE
O
22
2
1i
3
1j ij
2ij2
4.364504.37
55...
3.144175
nE
O
22
2
1i
3
1j ij
2ij2
Que sigue una distribución Ji-cuadrado con (n-1)*(C-1)=( 2-1)*(3-1)=2 grados de libertad
Que sigue una distribución Ji-cuadrado con (n-1)*(C-1)=( 2-1)*(3-1)=2 grados de libertad
005.0250.000000014.36Pp 22 005.0250.000000014.36Pp 2
2
En conclusión, se rechaza la H0 (p < 0.05), es decir las alteraciones respiratorias están asociadas a la exposición al producto
En conclusión, se rechaza la H0 (p < 0.05), es decir las alteraciones respiratorias están asociadas a la exposición al producto
Distribución F de SnedecorSi y son variables Ji-cuadrado distribuidas en forma independiente con y grados de libertad, respectivamente, la variable
sigue la distribución F con y grados de libertad.
2X
22
11
kZkZ
F 1X
1k 2k
1k 2k
Tabla F de Fisher
α=0.05 con letra normal.
α=0.01 con letra negrita
Ejemplo de uso de la tabla F de Fisher
Ejemplo de Aplicación
De dos aulas de 5ª año de secundaria se tomaron muestras de tamaños 10 y 15 de las notas promedios de alumnos para probar si la dispersión de las notas es la misma para las dos aulas. Los resultados obtenidos son los siguientes:
Aula 1: 15, 16, 12, 14, 14, 15, 16, 13, 14, 15. Aula 2: 12, 14, 15, 16, 16, 17, 15, 16, 18, 14, 12, 15, 16, 14, 13.
40.14x1
87.14x2 600.1S2
1
981.2S22
10n1
15n2
Deseamos probar las hipótesis:
22
210 :H 2
2211 :H
Luego
Si , entonces para las cuantilas y
5367.0981.2600.1
F 05.0
)14,9(F 2/ 2/1
26.0F )14,9( 025.0 21.3F )14,9( 025.0
025.0 025.0
5367.0
Luego concluimos que la dispersión de las notas entre los alumnos para las dos aulas de 5ª año son las mismas, pues no se encuentra diferencia significativa.
26.0 21.3
La compañía llantera Good Year del Perú, ha efectuado un estudio sobre los hábitos de manejo de varios grupos ocupacionales. En una muestra de 35 profesores universitarios, el número promedio de kilómetros recorridos al año fue de 14,500 con una desviación standart de 3,200 km. En una muestra de 40 dentistas, el kilometraje fue de 13,400, con una desviación standart de 1,950 km.
EJEMPLOEJEMPLO
Se tieneSe tieneSe tieneSe tiene04n ,950,1s ,450,13X
35n ,200,3s ,500,14X
222
111
Primero se verificará la condición siguiente: 1 2
04n 3802500,s ,950,1s ,450,13X35n 10240000,s ,200,3s ,500,14X
22122
12111
Planteamos las Hipótesis:
22
211
22
210 :H :H
22
211
22
210 :H :H
693.23802500
10240000F 693.2
380250010240000
F
Para α=0.05
0.515
0.0250.95
1.9
0.025
9.1F )39,34( 975.0 515.0F )39,34( 025.0
Se rechaza la H0, es decir que 1 2 Se rechaza la H0, es decir que 1 2
2.693
Valores críticosValores críticosValores críticosValores críticos
3.220,10
6.62296.10s*Z0
21 XX
3.220,106.62296.10
s*Z021 XX
211210 :H :H 211210 :H :H
6.62240950,1
35200,3
ns
ns
s22
2
22
1
21
XX 21
6.622
40950,1
35200,3
ns
ns
s22
2
22
1
21
XX 21
Y los valores críticos son: -1,220.3 y +1,220.3Y los valores críticos son: -1,220.3 y +1,220.3Y los valores críticos son: -1,220.3 y +1,220.3Y los valores críticos son: -1,220.3 y +1,220.3
Diferencia de lasmedias muestrales .Km050,1450,13500,14XX 21
Luego, se prueba la hipótesis:
-1220.3Valor critico
+1220.3Valor critico
+1050 = diferencia observada entre las medias muestrales.
millas 6.622s
2X1X
021 XX
Z= -1.96 Z= +1.96Área =0.025Área =0.025
Se Rechaza Se Rechaza
Se acepta la hipótesis nula
Ejercicio
Como la diferencia entre las medias muestrales es de 1050 millas y se acepta un margen de error de 1220 millas, en consecuencia, no hay diferencias significativas entre los dos grupos
Freddy Lopez, operador de la cadena de restaurantes “Las Tejas””, ha hecho una encuesta entre los clientes en dos ciudades, pues desea averiguar si les gustaría que en el menú se incluyeran sandwiches de jamón y queso. De las 500 personas encuestadas en la capital, 200 contestaron afirmativamente, mientras que 150 de las 300 encuestadas en una ciudad cercana también contestaron afirmativamente. Freddy quiere saber si, en un nivel de 0.05 esos resultados son significativamente diferente.
EJEMPLOEJEMPLO
En resumenEn resumenEn resumenEn resumen030n ,50.0300/150P
500n ,40.0500/200P
22
11
Primero se determinará si se cumple lo siguiente: 1 ≠ 2
Se tieneSe tieneSe tieneSe tiene
Planteamos las Hipótesis:
22
211
22
210 :H :H
22
211
22
210 :H :H
576.00.000830.00048
F 576.00.000830.00048
F
00083.0
30050.050.0
s ,030n ,50.0300/150P
00048.0500
60.040.0s 500,n ,40.0500/200P
2222
2111
Para α=0.05
0.0250.95
0.576
0.025
228.1F )299,499( 975.0 8184.0F )299,499( 025.0
Se rechaza la H0, es decir que 1 ≠ 2 Se rechaza la H0, es decir que 1 ≠ 2
0.8184 1.228
Valores críticosValores críticosValores críticosValores críticos
071.000362.096.10
s*Z021 PP
071.000362.096.10
s*Z021 PP
211210 P P :H P P :H 211210 P P :H P P :H
0362.0n1
n1
P1Ps
n,n de valoreslos como asi
s de fórmula laen 0.4375 p mplazandoRe
4375.0300500
50.030040.0500nn
PnPnP
21PP
21
PP
21
2211
21
21
0362.0n1
n1
P1Ps
n,n de valoreslos como asi
s de fórmula laen 0.4375 p mplazandoRe
4375.0300500
50.030040.0500nn
PnPnP
21PP
21
PP
21
2211
21
21
Y los valores críticos son: -0.071 y +0.071Y los valores críticos son: -0.071 y +0.071Y los valores críticos son: -0.071 y +0.071Y los valores críticos son: -0.071 y +0.071
Diferencia de lasproporciones muestrales
10.050.040.0PP 21
Luego, se prueba la hipótesis:
Se acepta la hipótesis nula
Se rechaza Se rechaza
Z= -1.96 Z= +1.96Área =0.025Área =0.025
021 PP
0362.0s21 PP
-0.071Valor critico
+0.071Valor critico
Diferencia observada entre las proporciones muestrales = (0.40-.050) =-0.10
Ejercicio
Como la diferencia entre las proporciones muestrales es de -0.10 y se acepta un margen de error de 0.0710.071, en consecuencia, si hay diferencias significativas entre los dos grupos
FIN
MUCHAS GRACIAS