Download - ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006
![Page 1: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/1.jpg)
ANÁLISIS E INTERPRETACIÓN DE ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS RESULTADOS ESTADISTICOS
Dr. Carlos Calderón Cabada
Lima, Junio 2006Lima, Junio 2006
![Page 2: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/2.jpg)
PRUEBAS ESTADISTICAS
PARAMETRICAS
Prueba “t”
de Student
![Page 3: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/3.jpg)
¿QUE ES LA PRUEBA “t” ?
ES UNA PRUEBA ESTADISTICA PARA
EVALUAR SI DOS GRUPOS DIFIEREN ENTRE SI DE
MANERA SIGNIFICATIVA RESPECTO DE SUS MEDIAS.
![Page 4: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/4.jpg)
SIMBOLO
“ t “
![Page 5: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/5.jpg)
)1(
/
ntóndistribucitienenS
xt
SE CALCULA PARA MUESTRAS PEQUEÑAS DE DISTRIBUCION NORMAL
![Page 6: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/6.jpg)
SE CALCULA PARA MUESTRAS GRANDES DE DISTRIBUCION NORMAL
2211
21
// 22 NSNS
xxt
![Page 7: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/7.jpg)
HIPOTESIS A PROBAR
Se trata de comparar dos grupos:
La hipótesis alternativa plantea que los grupos difieren
significativamente entre si y la hipótesis nula propone que los
grupos no difieren significativamente entre si.
![Page 8: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/8.jpg)
VARIABLE INVOLUCRADA
LA COMPARACION SE REALIZA SOBRE LA VARIABLE INDEPENDIENTE, SI
EXISTEN OTRAS SE DEBE EFECTUAR VARIAS PRUEBAS “t” UNA POR CADA
VARIABLE.
EL NIVEL DE MEDICION DE LAS VARIABLES ES EL DE INTERVALO
O RAZON
![Page 9: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/9.jpg)
INTERPRETACION
PARA GRUPOS PEQUEÑOS (n < 30)
X la media del grupo. µ la media poblacional S la Desv. Estandar n = tamaño de muestra
)1(
/
ntóndistribucitienenS
xt
![Page 10: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/10.jpg)
INTERPRETACION
Para saber si el valor “t” es significativo, se aplica la formula y se calculan los grados de libertad.
La prueba “t” se basa en una distribución muestral o poblacional de diferencia de medias conocidas como la “t de Student”,
Esta distribución es identificada por los grados de libertad, los cuales constituyen el numero de maneras como los datos pueden variar libremente.
![Page 11: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/11.jpg)
RECOMENDACION
Mientras mayor sea el numero de grados de libertad la distribución “t de Student” se acerca mas a ser una distribución normal.
Si los grados de libertad exceden los 120 la Distribución Normal es utilizada como una aproximación adecuada de la “t de Student”.
Calculado “t” y los gl (grados de libertad) SE ELIGE el nivel de significancia y se compara el valor obtenido con el mostrado en la Tabla
![Page 12: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/12.jpg)
Distribución t-Student
0 t1-
t(v)
)1(/
ntóndistribucitienenS
xT
Para muestras pequeñas de población normal
PRUEBA “t”
![Page 13: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/13.jpg)
CALCULO DE LOS GRADOS DE LIBERTAD
gl = (N1 + N2) – 2
N1 y N2 representan al tamaño de cada grupo comparado.
![Page 14: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/14.jpg)
EVALUACION DE RESULTADOS
Si nuestro valor calculado es igual o mayor que el de la Tabla, se acepta la hipótesis alternativa.
Pero si el valor es menor se acepta la hipótesis nula.
USO DE LA TABLA……..
![Page 15: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/15.jpg)
EJERCICIOS
Tomar la Tabla “t” y calcular: Media Muestral = Media Poblacional = α = n = gl. (t-1) =
![Page 16: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/16.jpg)
DESCANSO
![Page 17: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/17.jpg)
HIPOTESIS A CONTRASTAR
datos de la muestra
Se definen:
Las hipótesis nula y alternativa con una distribución de probabilidad conocida
Regla de decisión(nivel de significación )
Valor crítico o tabulado
Se calcula una medidaasociada a la hipótesis
que se desea docimar
Se comparan los valores calculado con tabulado
¿se rechaza Ho?
NOSIH1
Se extraen conclusiones
![Page 18: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/18.jpg)
Utilizar prueba de ZSi
No
Si
Utilizar prueba de Z
No
¿Se conoce ?
¿Se conoce ?
Utilizar prueba de Z
Utilizar prueba de t
¿Se conoce?
¿Se conoce?
Si
No
Es n ≥ 30? Es n ≥ 30?
No
Si
Utilizar prueba de Z (por el teorema central del límite)
¿Se conoce?¿Se conoce?
Utilizar prueba de Z (por el teorema central del límite)
Si
¿Se sabe q la población es normal?
¿Se sabe q la población es normal?
No
Si
Es n ≥ 30?Es n ≥ 30?Utilizar una prueba no paramétrica
![Page 19: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/19.jpg)
Se acepta la hipótesis nula si el estadístico de la prueba cae dentro de esta región.
Se rechaza la hipótesis nula
Se rechaza la hipótesis nula
Area A = área B y (A+B) = el nivel deseado de significancia
Valor critico
Valor teórico de la diferencia
+ Valor critico
Area A Area B
Esquema cuando se comprar la diferencia entre dos medias o proporciones muéstrales
![Page 20: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/20.jpg)
Númerode
grupos
Esquema de selección de pruebas estadísticas cuando la variable dependiente es continua u ordinal
1 Grupo
2 Grupos
3 a más Grupos
Independientes
n > = 30
Prueba Z para la media
n > = 30
Distribución normal
Prueba Z para la diferencia de medias
Prueba de Mann-Whitney paracomparación de poblaciones
n > = 30
Prueba Z para la media de la diferenciaen datos apareados
Independientes
Distribuci ónnormal
Prueba T para la media de ladiferencia en datos apareados
Prueba del signo o de Wilcoxonpara datos apareados
Distribuciónnormal c/varian-zas semejantes
ANVA - Comparación de tratamientos
Prueba de Kruskal-Wallis - Comparac. de Trat.
Distribuciónnormal c/varian-zas semejantes
ANVA en Bloque - Comparac. de Tratam.
Prueba de Friedman - Comparac. de Tratam.
Distribuciónnormal
Prueba T para la media
Prueba del signo para la mediana
Varianzasiguales
Prueba T paradiferencia de medias
Prueba T con ajustede grados de libertad
Si
No
Si
No
Si
No
Si
No
Si
No
Si
No
Si
No
Si
No
Si
No
No
Si
Si
No
![Page 21: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/21.jpg)
Escala demedición
para ambasvariables
Esquema de selección de pruebas estadísticas para medirrelación entre variables
Continua
Coeficiente de Correlación por rangos de Spearman
Coeficiente de correlación lineal de Pearson
Cada variabletiene dos
categorías(tablas 2x2)
- Prueba Ji-Cuadrado (Coeficiente )- Riesgo Relativo (Estudios de cohorte)- Odds Ratio (Estudios de Casos-control)- Coeficiente de concordancia Kappa (Comparación de métodos)
Prueba Ji-Cuadrado para Independenciade variables (Coeficiente de
Contingencia)
Si
No
Ordinal y/onumérica
Nominal
![Page 22: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/22.jpg)
Hipótesis estadística según Hipótesis estadística según Número de grupo y tipo de variableNúmero de grupo y tipo de variable
Número de Grupos
Un grupo Dos grupos Tres o más grupos
Variablecuantitativa
Variablecategórica
Variablecuantitativa
Variablecaategórica
Variablecuantitativa
Variablecategórica
Hipótesis:= 0
Parámetro
media
Hipótesis: P=P 0
ParámetroProporción
Hipótesis:=2
Parámetrosmedias
Hipótesis:2
1=22
Parámetrosvarianzas
Hipótesis: P 1 = P 2
ParámetrosProporciones
Hipótesis:=...= kParámetros
k medias
Hipótesis:2
122=
...= 2k
Parámetrosk varianzas
Hipótesis: P 1 = P 2 =
....= P kParámetrosk Proporciones
Hipótesis:2 < 2
0
Parámetro:
varianza
![Page 23: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/23.jpg)
Prueba de Correlación de Prueba de Correlación de Rango de SPEARMANRango de SPEARMAN
![Page 24: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/24.jpg)
El coeficiente de correlación por rango se define como:
Donde:N: # de observaciones, # de individuos o fenómenos
clasificados por rango.
di: Diferencia en los rangos atribuida a dos características diferentes del i-ésimo individuo o fenómeno.
)1N(N
d61r 2
2i
s
)1N(N
d61r 2
2i
s
PRUEBA DE CORRELACION DE RANGO DE SPEARMANPRUEBA DE CORRELACION DE RANGO DE SPEARMAN
La correlación por rangos de Spearman mide la relación entre dos variables que han sido clasificadas por orden de menos a mayor (o de mayor a menor)
La correlación por rangos de Spearman mide la relación entre dos variables que han sido clasificadas por orden de menos a mayor (o de mayor a menor)
![Page 25: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/25.jpg)
Una empresa contrató a 7 técnicos en informática, que fueron sometidos a un examen de conocimientos básicos. Luego de un año de servicio, se calificó su rendimiento en el trabajo. A continuación, se muestran los resultados:
EJEMPLOEJEMPLO
TécnicoPuntuación en el
examenClasificación por
rendimiento
J. Manzo 82 4
M. Contreras 73 7
C. Gutarra 60 6
F. Olaechea 80 3
D. Barrientos 67 5
F. Estombelo 94 1
J. Cordova 89 2
![Page 26: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/26.jpg)
Se utiliza la correlación por rangos de Spearman para determinar, si hay relación entre las calificaciones del examen y el rendimiento en el trabajo
1º Se elabora la clasificación de las puntuaciones del examen
1º Se elabora la clasificación de las puntuaciones del examen
Técnico Puntuación en el examen
Clasificación por el examen (X)
Clasificación por rendimiento (Y)
J. Manzo 82 3 4 -1 1
M. Contreras 73 5 7 -2 4
C. Gutarra 60 7 6 1 1
F. Olaechea 80 4 3 1 1
D. Barrientos 67 6 5 1 1
F. Estombelo 94 1 1 0 0
J. Cordova 89 2 2 0 0
idYX 2i
2 d)YX(
![Page 27: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/27.jpg)
2º Se calcula del coeficiente de correlación por rangos de Spearman rs:
2º Se calcula del coeficiente de correlación por rangos de Spearman rs:
857.0)17(7
861
)1N(N
d61r 22
2i
s
857.0)17(7
861
)1N(N
d61r 22
2i
s
Un coeficiente de correlación oscila entre -1 y 1; los resultados muestran una fuerte relación positiva entre las puntuaciones de examen de cada técnico y su rendimiento en le trabajo
Un coeficiente de correlación oscila entre -1 y 1; los resultados muestran una fuerte relación positiva entre las puntuaciones de examen de cada técnico y su rendimiento en le trabajo
![Page 28: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/28.jpg)
Contrastando la hipotes:Contrastando la hipotes:
H0: ρs = 0, no hay relación entre las dos variables
H1: ρs ≠ 0, hay relación entre las dos variables
H0: ρs = 0, no hay relación entre las dos variables
H1: ρs ≠ 0, hay relación entre las dos variables
Tabla N, con α=0.10, n=7; los valores críticos serían: ± 0.6786
Como rs está fuera de la región de aceptación, rechazamos la H0. Se concluye, al 90% de confianza, existe relación entre las puntuaciones del examen y el orden de rendimiento en el trabajo
Como rs está fuera de la región de aceptación, rechazamos la H0. Se concluye, al 90% de confianza, existe relación entre las puntuaciones del examen y el orden de rendimiento en el trabajo
-0.6786Valor critico
+0.6786Valor critico
0.8570.857
0.050.05
Se Rechaza
Se Rechaza
Se acepta
![Page 29: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/29.jpg)
Intervalo de confianza para la diferencia de medias
b) Si las varianzas 12 y 2
2 son desconocidas
Para muestras grandes
donde
212/121 )( xxSZxxL
2
22
1
21
21 ns
ns
S xx
![Page 30: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/30.jpg)
Cambiar de tema
![Page 31: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/31.jpg)
ANALISISNO
PARAMETRICO
![Page 32: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/32.jpg)
CONSIDERACIONES
La mayoría no de estos análisis no requiere de presupuestos acerca de la forma de la Distribución Poblacional.
Las Variables no necesariamente deben estar medidas en un nivel de intervalo (orden y categoría cero no real) o de razón ( el cero es real) .
Pueden analizarse datos nominales (sin orden ni categoría -Sexo) u ordinales (orden de mayor a menor- primero, segundo).
En todo caso la variables deben ser categóricas.( en días, meses, años, etc.)
![Page 33: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/33.jpg)
METODOS O PRUEBAS NO PARAMETRICAS MAS
EMPLEADAS 1) LA Ji CUADRADA – CHI-CUADRADA 2) COEFICIENTES DE CORRELACION E
INDEPENDNENCIA PARA TABULACIONES CRUZADAS.
3) LOS COEFICIENTES DE CORRELACION PARA RANGOS ORDENADOS DE SPERMAN Y KENDALL
![Page 34: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/34.jpg)
Ji - CUADRADA
Es una prueba estadística para evaluar hipótesis acerca de la relación entre dos variables.
Se simboliza por : ²א Prueba hipotesis Correlacionales Variables involucradas : dos ( no considera
relaciones causales) Nivel de medicion de variables: Nominal y
Ordinal.
![Page 35: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/35.jpg)
Ji - CUADRADA
La Chi – Cuadrada se calcula a traves de una Tabla de contingencia o Tabulacion
cruzada, que constituye una Tabla de dos dimensiones o matriz de dos x dos.
Cada dimension contiene una variable.
Cada variable se subdivide en dos o mas categorias.
![Page 36: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/36.jpg)
La Prueba Ji-CuadradoDistribución Ji-Cuadrado
n21 Z , ... , Z , ZSupóngase que se tiene una serie de variables aleatorias independientes con distribución normal estándar, , entonces la variable aleatoria , sigue una distribución Ji-Cuadrado.
2n
21 Z...ZX
2χ
![Page 37: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/37.jpg)
La Prueba Ji-Cuadrado
FUNCIÓN DE DENSIDAD MEDIA Y VARIANZA.2χ
![Page 38: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/38.jpg)
Hipótesis nula:Las variables son independientes
Se construye o se obtiene una tabla de tabulación cruzada para las frecuencias reales
observadas (Oij )
Procedimientos para usar el análisis de ji cuadrada y Procedimientos para usar el análisis de ji cuadrada y probar la independencia de dos variables nominales probar la independencia de dos variables nominales
Suponiendo que las variables son independientes, se construye una tabla de
tabulación cruzada para las frecuencias teóricas ( Eij)
Se determina el nivel de significado deseado en la prueba.
Se determina el valor calculado del estadístico ji
cuadrada
r
1i
c
1j ij
2ijij2
E
EO
![Page 39: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/39.jpg)
Tabla 4. Distribución de ji-cuadrado
Probabilidad de un valor superior
Grados de libertad 0,1 0,05 0,025 0,01 0,005
1 2,71 3,84 5,02 6,63 7,88
2 4,61 5,99 7,38 9,21 10,60
3 6,25 7,81 9,35 11,34 12,84
4 7,78 9,49 11,14 13,28 14,86
5 9,24 11,07 12,83 15,09 16,75
6 10,64 12,59 14,45 16,81 18,55
7 12,02 14,07 16,01 18,48 20,28
8 13,36 15,51 17,53 20,09 21,95
9 14,68 16,92 19,02 21,67 23,59
10 15,99 18,31 20,48 23,21 25,19
USO DE LA TABLA
α]χχ[P 2n,α
2
2n,αχ
α
El área sombreada de naranja representa la probabilidad que se determinada por , donde:
es el valor critico del margen superior de la tabla, y son los grados de libertad del margen izquierdo de la tabla.
n
![Page 40: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/40.jpg)
Tabla 4. Distribución de ji-cuadrado
Probabilidad de un valor superior
Grados de libertad 0,1 0,05 0,025 0,01 0,005
1 2,71 3,84 5,02 6,63 7,88
2 4,61 5,99 7,38 9,21 10,60
3 6,25 7,81 9,35 11,34 12,84
4 7,78 9,49 11,14 13,28 14,86
5 9,24 11,07 12,83 15,09 16,75
6 10,64 12,59 14,45 16,81 18,55
7 12,02 14,07 16,01 18,48 20,28
8 13,36 15,51 17,53 20,09 21,95
9 14,68 16,92 19,02 21,67 23,59
10 15,99 18,31 20,48 23,21 25,19
Uso de la tabla Ji-Cuadrado
10.0]10n | χ99.15 [ P 2
05.0]5n | χ07.11 [ P 2
![Page 41: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/41.jpg)
Martha Revilla, directora de mantenimiento de la calidad en MEGA, elige 29 bicicletas y halla una varianza en la distancia entre ejes de 32.7 pulgadas cuadradas. Si la señora Revilla tienen que garantizar que la variación no supere 27 pulgadas cuadradas ¿indica esto que se cumplen las normas de producción? (α=0.05)
EJEMPLOEJEMPLO
HipótesisHipótesisHipótesisHipótesis 27H 27H 21
20 27H 27H 2
12
0
Prueba de una cola a la derechaPrueba de una cola a la derecha
![Page 42: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/42.jpg)
277.32s
29n
2
2
91.33
277.32129s1n
2
22
91.33
277.32129s1n
2
22
0.05
41.33733.91
2
2f
Como X2=33.91<41.337 la señora Revilla no rechazará la H0 y confiará al 95% en que se cumplen las normas de producción
Como X2=33.91<41.337 la señora Revilla no rechazará la H0 y confiará al 95% en que se cumplen las normas de producción
337.41228;05.0 337.412
28;05.0
![Page 43: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/43.jpg)
¿Que pasaría, si las instrucciones de la señora Revilla fueran que la variación se mantuviera inferior a 27 pulgadas cuadradas?
27H 27H 21
20 27H 27H 2
12
0
Prueba de una cola a la izquierdaPrueba de una cola a la izquierda
33.91
2
2f
0.05
X2 =33.91, la señora Revilla no rechazará la H0 y confiará al 95% en que se cumplen las normas de producción
X2 =33.91, la señora Revilla no rechazará la H0 y confiará al 95% en que se cumplen las normas de producción
16.928
928.16228;95.0 928.162
28;95.0
![Page 44: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/44.jpg)
La señora Revilla, ahora elabora un intervalo de confianza del 90% para la varianza de la distancia entre ejes.
16.928 2
2f
0.05
Revilla puede confiar al 90% en que la varianza de la distancia entre ejes se encuentra entre 22.15 y 54.09 pulgadas cuadradas
Revilla puede confiar al 90% en que la varianza de la distancia entre ejes se encuentra entre 22.15 y 54.09 pulgadas cuadradas
0.050.90
41.3370.95
2
28;95.0
22
228;05.0
2 s1ns1n
2
28;95.0
22
228;05.0
2 s1ns1n
09.5415.22
928.167.32129
337.417.32129
2
2
09.5415.22
928.167.32129
337.417.32129
2
2
![Page 45: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/45.jpg)
Prueba Ji-Cuadrado de Independencia
Y
X Categ. 1 ...... Categ. s Total
Cat. 1 O11 ...... O1s R1
......... ....... ...... ....... .....
Cat. r Or1 ...... Ors Rr
Total C1 ...... Cs n
H0: Las variables X e Y son independientes H1: Existe asociación entre X e Y
![Page 46: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/46.jpg)
Prueba Ji-Cuadrado de Independencia
Estadística
0
1 0
2 0
3 0
4 0
5 0
6 0
7 0
8 0
A l t o M e d i o B a j o
S i N o
r
1i
c
1j ij
2ijij2
E
)EO(
n
CRE,donde ji
ij
21
2
.C.R
![Page 47: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/47.jpg)
Ejemplo de Prueba Ji-Cuadrado de independencia
Para verificar la suposición de que la fabricación de cierto producto está asociado con enfermedades respiratorias, a 450 trabajadores de una empresa que fabrica el producto se evaluó respecto a la presencia de síntomas de alteraciones respiratorias y se los clasificó a su vez de acuerdo al nivel de exposición al producto. Los resultados se presentan en la tabla siguiente:
Presencia de Síntoma
Nivel de ExposiciónTotal
Alto Medio Bajo
Si 175 43 27 245
No 90 60 55 205
Total 265 103 82 450
![Page 48: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/48.jpg)
H1: Las alteraciones respiratorias están asociadas a la exposición al producto
H1: Las alteraciones respiratorias están asociadas a la exposición al producto
H0: Las alteraciones respiratorias son independientes de la exposición al producto.
H0: Las alteraciones respiratorias son independientes de la exposición al producto.
Frecuencias Esperadas:
n
CRE ji
ij n
CRE ji
ij
4.37
45082205
nCR
E 3223 Por ejemplo:
Presencia de Síntoma
Nivel de ExposiciónTotal
Alto Medio Bajo
Si 144.3144.3 56.156.1 44.644.6 245
No 120.7120.7 46.946.9 37.437.4 205
Total 265 103 82 450
![Page 49: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/49.jpg)
Estadística
0
1 0
2 0
3 0
4 0
5 0
6 0
7 0
8 0
A l t o M e d i o B a j o
S i N o
2
1i
3
1j ij
2ijij2
E
)EO(
n
CRE,donde ji
ij
21
205.0
.C.R
![Page 50: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/50.jpg)
4.364504.37
55...
3.144175
nE
O
22
2
1i
3
1j ij
2ij2
4.364504.37
55...
3.144175
nE
O
22
2
1i
3
1j ij
2ij2
Que sigue una distribución Ji-cuadrado con (n-1)*(C-1)=( 2-1)*(3-1)=2 grados de libertad
Que sigue una distribución Ji-cuadrado con (n-1)*(C-1)=( 2-1)*(3-1)=2 grados de libertad
005.0250.000000014.36Pp 22 005.0250.000000014.36Pp 2
2
En conclusión, se rechaza la H0 (p < 0.05), es decir las alteraciones respiratorias están asociadas a la exposición al producto
En conclusión, se rechaza la H0 (p < 0.05), es decir las alteraciones respiratorias están asociadas a la exposición al producto
![Page 51: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/51.jpg)
Distribución F de SnedecorSi y son variables Ji-cuadrado distribuidas en forma independiente con y grados de libertad, respectivamente, la variable
sigue la distribución F con y grados de libertad.
2X
22
11
kZkZ
F 1X
1k 2k
1k 2k
![Page 52: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/52.jpg)
Tabla F de Fisher
α=0.05 con letra normal.
α=0.01 con letra negrita
![Page 53: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/53.jpg)
Ejemplo de uso de la tabla F de Fisher
![Page 54: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/54.jpg)
Ejemplo de Aplicación
De dos aulas de 5ª año de secundaria se tomaron muestras de tamaños 10 y 15 de las notas promedios de alumnos para probar si la dispersión de las notas es la misma para las dos aulas. Los resultados obtenidos son los siguientes:
Aula 1: 15, 16, 12, 14, 14, 15, 16, 13, 14, 15. Aula 2: 12, 14, 15, 16, 16, 17, 15, 16, 18, 14, 12, 15, 16, 14, 13.
40.14x1
87.14x2 600.1S2
1
981.2S22
10n1
15n2
Deseamos probar las hipótesis:
22
210 :H 2
2211 :H
![Page 55: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/55.jpg)
Luego
Si , entonces para las cuantilas y
5367.0981.2600.1
F 05.0
)14,9(F 2/ 2/1
26.0F )14,9( 025.0 21.3F )14,9( 025.0
025.0 025.0
5367.0
Luego concluimos que la dispersión de las notas entre los alumnos para las dos aulas de 5ª año son las mismas, pues no se encuentra diferencia significativa.
26.0 21.3
![Page 56: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/56.jpg)
La compañía llantera Good Year del Perú, ha efectuado un estudio sobre los hábitos de manejo de varios grupos ocupacionales. En una muestra de 35 profesores universitarios, el número promedio de kilómetros recorridos al año fue de 14,500 con una desviación standart de 3,200 km. En una muestra de 40 dentistas, el kilometraje fue de 13,400, con una desviación standart de 1,950 km.
EJEMPLOEJEMPLO
Se tieneSe tieneSe tieneSe tiene04n ,950,1s ,450,13X
35n ,200,3s ,500,14X
222
111
![Page 57: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/57.jpg)
Primero se verificará la condición siguiente: 1 2
04n 3802500,s ,950,1s ,450,13X35n 10240000,s ,200,3s ,500,14X
22122
12111
Planteamos las Hipótesis:
22
211
22
210 :H :H
22
211
22
210 :H :H
693.23802500
10240000F 693.2
380250010240000
F
![Page 58: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/58.jpg)
Para α=0.05
0.515
0.0250.95
1.9
0.025
9.1F )39,34( 975.0 515.0F )39,34( 025.0
Se rechaza la H0, es decir que 1 2 Se rechaza la H0, es decir que 1 2
2.693
![Page 59: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/59.jpg)
Valores críticosValores críticosValores críticosValores críticos
3.220,10
6.62296.10s*Z0
21 XX
3.220,106.62296.10
s*Z021 XX
211210 :H :H 211210 :H :H
6.62240950,1
35200,3
ns
ns
s22
2
22
1
21
XX 21
6.622
40950,1
35200,3
ns
ns
s22
2
22
1
21
XX 21
Y los valores críticos son: -1,220.3 y +1,220.3Y los valores críticos son: -1,220.3 y +1,220.3Y los valores críticos son: -1,220.3 y +1,220.3Y los valores críticos son: -1,220.3 y +1,220.3
Diferencia de lasmedias muestrales .Km050,1450,13500,14XX 21
Luego, se prueba la hipótesis:
![Page 60: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/60.jpg)
-1220.3Valor critico
+1220.3Valor critico
+1050 = diferencia observada entre las medias muestrales.
millas 6.622s
2X1X
021 XX
Z= -1.96 Z= +1.96Área =0.025Área =0.025
Se Rechaza Se Rechaza
Se acepta la hipótesis nula
![Page 61: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/61.jpg)
Ejercicio
Como la diferencia entre las medias muestrales es de 1050 millas y se acepta un margen de error de 1220 millas, en consecuencia, no hay diferencias significativas entre los dos grupos
![Page 62: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/62.jpg)
Freddy Lopez, operador de la cadena de restaurantes “Las Tejas””, ha hecho una encuesta entre los clientes en dos ciudades, pues desea averiguar si les gustaría que en el menú se incluyeran sandwiches de jamón y queso. De las 500 personas encuestadas en la capital, 200 contestaron afirmativamente, mientras que 150 de las 300 encuestadas en una ciudad cercana también contestaron afirmativamente. Freddy quiere saber si, en un nivel de 0.05 esos resultados son significativamente diferente.
EJEMPLOEJEMPLO
En resumenEn resumenEn resumenEn resumen030n ,50.0300/150P
500n ,40.0500/200P
22
11
![Page 63: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/63.jpg)
Primero se determinará si se cumple lo siguiente: 1 ≠ 2
Se tieneSe tieneSe tieneSe tiene
Planteamos las Hipótesis:
22
211
22
210 :H :H
22
211
22
210 :H :H
576.00.000830.00048
F 576.00.000830.00048
F
00083.0
30050.050.0
s ,030n ,50.0300/150P
00048.0500
60.040.0s 500,n ,40.0500/200P
2222
2111
![Page 64: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/64.jpg)
Para α=0.05
0.0250.95
0.576
0.025
228.1F )299,499( 975.0 8184.0F )299,499( 025.0
Se rechaza la H0, es decir que 1 ≠ 2 Se rechaza la H0, es decir que 1 ≠ 2
0.8184 1.228
![Page 65: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/65.jpg)
Valores críticosValores críticosValores críticosValores críticos
071.000362.096.10
s*Z021 PP
071.000362.096.10
s*Z021 PP
211210 P P :H P P :H 211210 P P :H P P :H
0362.0n1
n1
P1Ps
n,n de valoreslos como asi
s de fórmula laen 0.4375 p mplazandoRe
4375.0300500
50.030040.0500nn
PnPnP
21PP
21
PP
21
2211
21
21
0362.0n1
n1
P1Ps
n,n de valoreslos como asi
s de fórmula laen 0.4375 p mplazandoRe
4375.0300500
50.030040.0500nn
PnPnP
21PP
21
PP
21
2211
21
21
Y los valores críticos son: -0.071 y +0.071Y los valores críticos son: -0.071 y +0.071Y los valores críticos son: -0.071 y +0.071Y los valores críticos son: -0.071 y +0.071
Diferencia de lasproporciones muestrales
10.050.040.0PP 21
Luego, se prueba la hipótesis:
![Page 66: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/66.jpg)
Se acepta la hipótesis nula
Se rechaza Se rechaza
Z= -1.96 Z= +1.96Área =0.025Área =0.025
021 PP
0362.0s21 PP
-0.071Valor critico
+0.071Valor critico
Diferencia observada entre las proporciones muestrales = (0.40-.050) =-0.10
![Page 67: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/67.jpg)
Ejercicio
Como la diferencia entre las proporciones muestrales es de -0.10 y se acepta un margen de error de 0.0710.071, en consecuencia, si hay diferencias significativas entre los dos grupos
![Page 68: ANÁLISIS E INTERPRETACIÓN DE RESULTADOS ESTADISTICOS Dr. Carlos Calderón Cabada Lima, Junio 2006](https://reader034.vdocuments.net/reader034/viewer/2022051400/552f7f545503465c348b4596/html5/thumbnails/68.jpg)
FIN
MUCHAS GRACIAS