seminario 10

23
SEMINARIO 10 Salud Benítez García Grupo 1

Upload: salud-benitez-garcia

Post on 17-Jun-2015

587 views

Category:

Education


0 download

TRANSCRIPT

Page 1: Seminario 10

SEMINARIO 10

Salud Benítez García Grupo 1

Page 2: Seminario 10

Problema 1 En un municipio español se ha realizado una pequeña encuesta que ha

preguntado por el nº de personas que habitan en un hogar y el nº de habitaciones del mismo.

Si ambas variables se distribuyen normalmente:

1. Averiguar si existe correlación entre ambas variables en la población de donde derivan los datos. Calcular el coef. De correlación de Pearson.

2. Averiguar si el coeficiente de correlación es significativo. Realizar las hipótesis.

3. Incluir los datos en SSPS y realizar gráfico dispersión simple, realizar la correlación de Pearson y evaluar los resultados.

Page 3: Seminario 10

Tenemos que comprobar si existe normalidad o no en la muestra

- Utilizamos R Pearson si se distribuye normalmente

- Utilizamos Rho de Spearman si no se distribuye normalmente Para realizar las pruebas de normalidad utilizamos SPSS

o Utilizamos el test Kolmogorov- Smirnov: Si el tamaño muestral es superior a 50

o Test de Shapiro-Wilks: Si el tamaño muestral es inferior a 50

Page 4: Seminario 10

Comprobamos si las variables se distribuyen normalmente en SPSS

1. Metemos los datos en SPSS

Page 5: Seminario 10

2. Pinchamos en Analizar Estadísticos descriptivos Explorar

Page 6: Seminario 10

3. Seleccionamos las variables y pinchamos en “Gráficos”

Page 7: Seminario 10
Page 8: Seminario 10
Page 9: Seminario 10

Si el resultado de la sig. es mayor

que 0,05

se acepta la Ho, o lo que es lo

mismo, se acepta que el

conjunto de datos sigue una

distribución normal

Si el resultado de la sig. es menor

que 0,05

se rechaza la Ho, o lo que es

lo mismo, se rechaza que el

conjunto de datos siga una

distribución normal

Como vemos, la sig. es mayor de 0,05 por lo tanto aceptamos la Ho, la muestra sigue una distribución normal

Como la muestra es menor de 50, nos fijamos enShapiro-Wilks

Page 10: Seminario 10

Coeficiente de correlación de Pearson

Mide la asociación entre dos variables cuantitativas

Requiere que las variables tengan una distribución normal, por lo tanto antes de calcularlo tenemos que comprobar si la muestra sigue una distribución normal como hemos hecho anteriormente.

Mide el grado de asociación

Es adimensional Solo toma valores entre

-1 y 1 a partir de 0,8 es una correlación fuerte

Page 11: Seminario 10

Hacemos la fórmula

r = coeficiente de correlacion de pearson

Σxy= sumatorio de los productos de ambas variables

Σx: sumatoria de los valores de la variable independiente

Σy: sumatoria de los valores de la variable dependiente

Σx2: sumatoria de los valores al cuadrado de la variable independiente

Σy2= sumatoria de los valores al cuadrado de la variable dependiente

N: tamaño de la muestra en función de parejas

x y X2 Y2 xy

3 2 9 4 6

5 3 25 9 15

4 4 16 16 16

6 4 36 16 24

5 3 25 9 15

4 3 16 9 12

Σx=27 Σy=19 Σx2

=127Σy2=63 Σxy=88

Nº personas XNº habitaciones Y N= 6

Page 12: Seminario 10

r==0,633

Si el resultado nos da:• O La correlación en esa

población será 0• ≠ 0 Si existe correlación, y

hay que estudiarla mediante la T de Student para ver si la relación es al azar o no

Como el resultado de la correlación es 0,633≠ 0 hay que estudiarlo. Y para eso hay que hacer la T de Student. Con N-2 grados de libertad, siendo N: numero de muestra

Pearson puede ser 0 o ≠ 0 (hay una cierta relación entre variables)

T de Student te dice si la relación se a producido al azar o no.

Page 13: Seminario 10

N-2 grados de libertad, siendo N: numero de muestra gl=4

Ahora vamos a comparar el valor obtenido en T de Student con las tablas

Una vez que hemos hecho el coeficiente de correlación de Pearson y nos ha salido ≠ 0, vamos a ver si el resultado es significativo mediante la T de Student

Page 14: Seminario 10

Buscamos en la tabla de distribución de T de Student, para ello vamos a suponer que tenemos un nivel de confianza del 95%, fijándonos también que el grado de libertad es 4.

• Si T calculada > T tablas, rechazamos hipótesis nula por tanto las variables están relacionadas.• Si T calculada < T tablas, aceptamos la hipótesis nulapor tanto no existe relación significativa entre las variables

• Hipótesis nula (H0): No hay diferencia entre nº de personas que habitan en un hogar y el nº de habitaciones del mismo o que la diferencia encontrada se debe al azar• Hipótesis alternativa (H1): Hay diferencia estadísticamente significativa entre el nº de personas que habitan en un hogar y el nº de habitaciones del mismo. • La T tabla es 2,132

>1,635 que es la T calculada, por tanto aceptamos la H0 .

Respuesta: No existe diferencia significativa entre el nº de personas que habitan en un hogar y el nº de habitaciones del mismo, y si existe diferencia se debe al azar.

Page 15: Seminario 10

En SPSS…

Page 16: Seminario 10

1. Metemos los datos en SPSS

Page 17: Seminario 10

2. Realizamos un gráfico de dispersión simple

Page 18: Seminario 10
Page 19: Seminario 10

3. Señalamos las dos variables

Page 20: Seminario 10

Y este es el gráfico de dispersión simple

Page 21: Seminario 10

4. Ahora hacemos la correlación de Pearson

Page 22: Seminario 10

5. Señalamos las variables y pinchamos en “Pearson”

Page 23: Seminario 10

Podemos observar que 0,177>0,05, por lo tanto aceptamos la H0, aceptando entonces que no existe diferencia significativa entre las variables, y si existe es debido al azar