seminario 10
TRANSCRIPT
SEMINARIO 10
Salud Benítez García Grupo 1
Problema 1 En un municipio español se ha realizado una pequeña encuesta que ha
preguntado por el nº de personas que habitan en un hogar y el nº de habitaciones del mismo.
Si ambas variables se distribuyen normalmente:
1. Averiguar si existe correlación entre ambas variables en la población de donde derivan los datos. Calcular el coef. De correlación de Pearson.
2. Averiguar si el coeficiente de correlación es significativo. Realizar las hipótesis.
3. Incluir los datos en SSPS y realizar gráfico dispersión simple, realizar la correlación de Pearson y evaluar los resultados.
Tenemos que comprobar si existe normalidad o no en la muestra
- Utilizamos R Pearson si se distribuye normalmente
- Utilizamos Rho de Spearman si no se distribuye normalmente Para realizar las pruebas de normalidad utilizamos SPSS
o Utilizamos el test Kolmogorov- Smirnov: Si el tamaño muestral es superior a 50
o Test de Shapiro-Wilks: Si el tamaño muestral es inferior a 50
Comprobamos si las variables se distribuyen normalmente en SPSS
1. Metemos los datos en SPSS
2. Pinchamos en Analizar Estadísticos descriptivos Explorar
3. Seleccionamos las variables y pinchamos en “Gráficos”
Si el resultado de la sig. es mayor
que 0,05
se acepta la Ho, o lo que es lo
mismo, se acepta que el
conjunto de datos sigue una
distribución normal
Si el resultado de la sig. es menor
que 0,05
se rechaza la Ho, o lo que es
lo mismo, se rechaza que el
conjunto de datos siga una
distribución normal
Como vemos, la sig. es mayor de 0,05 por lo tanto aceptamos la Ho, la muestra sigue una distribución normal
Como la muestra es menor de 50, nos fijamos enShapiro-Wilks
Coeficiente de correlación de Pearson
Mide la asociación entre dos variables cuantitativas
Requiere que las variables tengan una distribución normal, por lo tanto antes de calcularlo tenemos que comprobar si la muestra sigue una distribución normal como hemos hecho anteriormente.
Mide el grado de asociación
Es adimensional Solo toma valores entre
-1 y 1 a partir de 0,8 es una correlación fuerte
Hacemos la fórmula
r = coeficiente de correlacion de pearson
Σxy= sumatorio de los productos de ambas variables
Σx: sumatoria de los valores de la variable independiente
Σy: sumatoria de los valores de la variable dependiente
Σx2: sumatoria de los valores al cuadrado de la variable independiente
Σy2= sumatoria de los valores al cuadrado de la variable dependiente
N: tamaño de la muestra en función de parejas
x y X2 Y2 xy
3 2 9 4 6
5 3 25 9 15
4 4 16 16 16
6 4 36 16 24
5 3 25 9 15
4 3 16 9 12
Σx=27 Σy=19 Σx2
=127Σy2=63 Σxy=88
Nº personas XNº habitaciones Y N= 6
r==0,633
Si el resultado nos da:• O La correlación en esa
población será 0• ≠ 0 Si existe correlación, y
hay que estudiarla mediante la T de Student para ver si la relación es al azar o no
Como el resultado de la correlación es 0,633≠ 0 hay que estudiarlo. Y para eso hay que hacer la T de Student. Con N-2 grados de libertad, siendo N: numero de muestra
Pearson puede ser 0 o ≠ 0 (hay una cierta relación entre variables)
T de Student te dice si la relación se a producido al azar o no.
N-2 grados de libertad, siendo N: numero de muestra gl=4
Ahora vamos a comparar el valor obtenido en T de Student con las tablas
Una vez que hemos hecho el coeficiente de correlación de Pearson y nos ha salido ≠ 0, vamos a ver si el resultado es significativo mediante la T de Student
Buscamos en la tabla de distribución de T de Student, para ello vamos a suponer que tenemos un nivel de confianza del 95%, fijándonos también que el grado de libertad es 4.
• Si T calculada > T tablas, rechazamos hipótesis nula por tanto las variables están relacionadas.• Si T calculada < T tablas, aceptamos la hipótesis nulapor tanto no existe relación significativa entre las variables
• Hipótesis nula (H0): No hay diferencia entre nº de personas que habitan en un hogar y el nº de habitaciones del mismo o que la diferencia encontrada se debe al azar• Hipótesis alternativa (H1): Hay diferencia estadísticamente significativa entre el nº de personas que habitan en un hogar y el nº de habitaciones del mismo. • La T tabla es 2,132
>1,635 que es la T calculada, por tanto aceptamos la H0 .
Respuesta: No existe diferencia significativa entre el nº de personas que habitan en un hogar y el nº de habitaciones del mismo, y si existe diferencia se debe al azar.
En SPSS…
1. Metemos los datos en SPSS
2. Realizamos un gráfico de dispersión simple
3. Señalamos las dos variables
Y este es el gráfico de dispersión simple
4. Ahora hacemos la correlación de Pearson
5. Señalamos las variables y pinchamos en “Pearson”
Podemos observar que 0,177>0,05, por lo tanto aceptamos la H0, aceptando entonces que no existe diferencia significativa entre las variables, y si existe es debido al azar