Download - Seminario 10 primera parte
![Page 1: Seminario 10 primera parte](https://reader034.vdocuments.net/reader034/viewer/2022050922/55ab8adb1a28abb1568b489d/html5/thumbnails/1.jpg)
SEMINARIO 10. PRIMERA PARTELaura Moreno García. Subgrupo 6.
![Page 2: Seminario 10 primera parte](https://reader034.vdocuments.net/reader034/viewer/2022050922/55ab8adb1a28abb1568b489d/html5/thumbnails/2.jpg)
1)Queremos saber si existe relación entre el peso y la alturaNuestra hipótesis alternativa ( H1), será: Existe relación entre el peso y la altura.
Para saber si en variables cuantitativas podemos utilizar la R de Pearson, o en su defecto la Rho de Spearman, debemos comprobar si hay una relación lineal y una distribución normal con respecto a las variables.
Para ello, mediante el diagrama de puntos podemos comprobar si hay una tendencia lineal:
En SPSS para realizar el diagrama de puntos, seleccionaremos las siguientes pestañas:
GRAFICOSCUADRO DE DIALOGO ANTIGUODISPERSION/PUNTODISPERSION SIMPLE.
![Page 3: Seminario 10 primera parte](https://reader034.vdocuments.net/reader034/viewer/2022050922/55ab8adb1a28abb1568b489d/html5/thumbnails/3.jpg)
Como podemos observar en el gráfico, sigue una distribución lineal, por lo que se cumple la primera asunción para la R de Pearson.
![Page 4: Seminario 10 primera parte](https://reader034.vdocuments.net/reader034/viewer/2022050922/55ab8adb1a28abb1568b489d/html5/thumbnails/4.jpg)
Explorar la normalidad.
• El segundo paso es explorar la normalidad: lo que se podría hacer de modo grafico o mediante pruebas( Kolmogorov-smirnof y Shapiro-Wilk).
• Debemos explorar la normalidad de las dos variables que estamos analizando: Peso y Talla.
• Para ello en SPSS, seleccionamos: ANALIZAR ESTADISTICOS DESCRIPTIVOS EXPLORAR e incluiremos las variables peso y talla dentro de la lista de dependientes.
• Por otro lado, dentro de la misma pestaña seleccionaremos los gráficos de histograma y los gráficos con pruebas de normalidad.
• A continuación, nos saldrá, primero la tabla de control y seguidamente las pruebas de normalidad de Kolmogorov y de Shapiro.
![Page 5: Seminario 10 primera parte](https://reader034.vdocuments.net/reader034/viewer/2022050922/55ab8adb1a28abb1568b489d/html5/thumbnails/5.jpg)
La casilla denominada en este caso significación, es la p, o el error tipo 1. Al ser menor de 0,05 quiere decir que aceptamos la hipótesis alternativa, es decir, existe relación entre el peso y la talla, y existen diferencias respecto a la distribución normal. Al haber aceptado la hipótesis alternativa, podríamos decir que nuestra hipótesis es distinta a la hipótesis de normalidad. (PARA ACEPTAR LA HIPOTESIS NULA, LA P DEBE SER MAYOR A 0,05 Y PARA ACEPTAR LA ALTERNATIVA DEBE SER MENOR A 0,05).
Según esta prueba estadística no podríamos aplicar la R de Pearson, ya que, las variables siguen una tendencia lineal pero no una distribución normal. Sin embargo, también podemos explorar la normalidad de forma grafica, que es lo que procederemos a ver ahora:
![Page 6: Seminario 10 primera parte](https://reader034.vdocuments.net/reader034/viewer/2022050922/55ab8adb1a28abb1568b489d/html5/thumbnails/6.jpg)
Observando el histograma de la variable peso con la curva normal, identificamos una leve asimetría hacia la izquierda.
![Page 7: Seminario 10 primera parte](https://reader034.vdocuments.net/reader034/viewer/2022050922/55ab8adb1a28abb1568b489d/html5/thumbnails/7.jpg)
En este grafico, el gráfico Q-Q, observamos que por debajo, hay ciertas puntuaciones que se alejan de la línea, que representaría la normalidad.
![Page 8: Seminario 10 primera parte](https://reader034.vdocuments.net/reader034/viewer/2022050922/55ab8adb1a28abb1568b489d/html5/thumbnails/8.jpg)
En el gráfico de cajas, también se representan algunas puntuaciones alejadas como el individuo 24
![Page 9: Seminario 10 primera parte](https://reader034.vdocuments.net/reader034/viewer/2022050922/55ab8adb1a28abb1568b489d/html5/thumbnails/9.jpg)
Con los gráficos, respecto a la talla, también se observan las diferencias
En los dos últimos gráficos, apreciamos bastante simetría, por lo que podríamos decir, que al menos la talla si se asemeja más, a diferencia con el peso, a la distribución normal. En el peso, hay un leve incumplimiento
![Page 10: Seminario 10 primera parte](https://reader034.vdocuments.net/reader034/viewer/2022050922/55ab8adb1a28abb1568b489d/html5/thumbnails/10.jpg)
Normalidad
• Sin embargo, en muestras grandes, las muestras tienden a ser significativas por lo que, las pruebas de normalidad realizadas no funcionan bien, ya que nuestra muestra es muy grande
( N= 569).
Aunque hemos hecho las pruebas de normalidad, no deberíamos haberlas hecho, por el tamaño de la población escogida, ya que con una N por encima de 100, directamente tienden a la distribución normal.
De esta manera nuestra muestra es lineal y normal.
![Page 11: Seminario 10 primera parte](https://reader034.vdocuments.net/reader034/viewer/2022050922/55ab8adb1a28abb1568b489d/html5/thumbnails/11.jpg)
Conclusión
• Por tanto, podemos aplicar la R de Pearson: En el programa SPSS seleccionaríamos lo siguiente:
• ANALIZAR CORRELACIONES BIVARIADAS.
![Page 12: Seminario 10 primera parte](https://reader034.vdocuments.net/reader034/viewer/2022050922/55ab8adb1a28abb1568b489d/html5/thumbnails/12.jpg)
![Page 13: Seminario 10 primera parte](https://reader034.vdocuments.net/reader034/viewer/2022050922/55ab8adb1a28abb1568b489d/html5/thumbnails/13.jpg)
Correlaciones
• La correlación del peso con el peso y de la talla con la talla es obviamente 1. Cuando se compara una variable consigo mismo el resultado siempre será 1.
• El peso con la talla, según Pearson es 0,65 Hay una alta correlación. El error tipo 1 es 0, es decir, se acepta la hipótesis alternativa, porque es menor a 0,05EXISTE RELACION ENTRE EL PESO Y LA TALLA.
• En la diapositiva anterior, se representaba también las correlaciones no paramétricas que aunque no eran necesarias en este caso, la hemos pedido. La Rho de Spearman el resultado es muy parecido a Pearson, en cambio la tau b de kendall es más conservadora.
![Page 14: Seminario 10 primera parte](https://reader034.vdocuments.net/reader034/viewer/2022050922/55ab8adb1a28abb1568b489d/html5/thumbnails/14.jpg)
Variables categóricas
• Ahora veremos la segunda parte, que es para variables categóricas, ya que antes hemos visto para variables cuantitativas u ordinales. En este caso, utilizaremos la correlacion puntual biserial, coeficiente phi, contingencia y v de cramer.
![Page 15: Seminario 10 primera parte](https://reader034.vdocuments.net/reader034/viewer/2022050922/55ab8adb1a28abb1568b489d/html5/thumbnails/15.jpg)
Correlación puntual biserial
• Se utiliza cuando queremos relacionar una variable binaria o categórica y una variable cuantitativa.
• Variable binaria: Sexo
• Variable cuantitativa: Frecuencia de ejercicio físico.
• H1: Existe relación entre el sexo y la frecuencia de ejercicio físico.
• H0: No existe relación entre el sexo y la frecuencia de ejercicio físico.
![Page 16: Seminario 10 primera parte](https://reader034.vdocuments.net/reader034/viewer/2022050922/55ab8adb1a28abb1568b489d/html5/thumbnails/16.jpg)
Normalidad
• Lo primero que debemos de hacer es explorar la normalidad de la variable cuantitativa, pero no lo vamos a hacer porque nuestra muestra es grande y asumimos que es normal, por lo que directamente nos vamos a explorar la relación.
![Page 17: Seminario 10 primera parte](https://reader034.vdocuments.net/reader034/viewer/2022050922/55ab8adb1a28abb1568b489d/html5/thumbnails/17.jpg)
Correlación
• La puntual biserial no es más que un coeficiente de la R de Pearson.
• ANALIZARCORRELACIONES BIVARIADASPEARSON
El tamaño del efecto es medio puesto que la r es 0,3, es decir, la relación entre el sexo y el ejercicio físico es 0,3. El signo es negativo( RELACION NEGATIVA) es decir, a más sexo menos ejercicio, como habíamos puesto que el 1 era chico y el 2 era chica, quiere decir que cuando pasamos de chico a chica se reduzca la frecuencia de ejercicio.
![Page 18: Seminario 10 primera parte](https://reader034.vdocuments.net/reader034/viewer/2022050922/55ab8adb1a28abb1568b489d/html5/thumbnails/18.jpg)
Coeficiente de Phi
• Se utilizaba para ver la relación entre dos variables categóricas dicotómicas.: por ejemplo, Sexo y consumo de tabaco.
•
• H1 sería: Existe relación entre sexo y el consumo de tabaco.
• Para ver la relación, utilizamos tablas de contingencia.
• ANALIZAR ESTADISTICOS DESCRIPTIVOSTABLAS CRUZADAS
• ESTADISTICOS CASILLAS OBSERVADO Y ESPERADO
![Page 19: Seminario 10 primera parte](https://reader034.vdocuments.net/reader034/viewer/2022050922/55ab8adb1a28abb1568b489d/html5/thumbnails/19.jpg)
El coeficiente de phi es muy bajo, es menor de 0,1, por lo que el tamaño del efecto es muy bajo. La p es mayor a 0,05, por lo que aceptamos la hipótesis nula:
No existe relación entre sexo y consumo de tabaco.
![Page 20: Seminario 10 primera parte](https://reader034.vdocuments.net/reader034/viewer/2022050922/55ab8adb1a28abb1568b489d/html5/thumbnails/20.jpg)
No hay apenas diferencia entre las frecuencias observadas y las esperadas.
![Page 21: Seminario 10 primera parte](https://reader034.vdocuments.net/reader034/viewer/2022050922/55ab8adb1a28abb1568b489d/html5/thumbnails/21.jpg)
Coeficiente de contingencia y V de Cramer
• Variables categóricas pero con más de dos categorías, nominales
• H1: Existe relación entre el grado APGAR( 3 categorias) y la frecuencia del consumo de tabaco.
![Page 22: Seminario 10 primera parte](https://reader034.vdocuments.net/reader034/viewer/2022050922/55ab8adb1a28abb1568b489d/html5/thumbnails/22.jpg)
La correlación es baja ya que es 0,20 y Es positiva, de manera que cuanto más funcional es la familia, más personas fuman todos los días. Además si observamos el recuento observado y esperado, podemos apreciar, que se afirma con más frecuencia a la que se esperaba que fuma tabaco todos los días
![Page 23: Seminario 10 primera parte](https://reader034.vdocuments.net/reader034/viewer/2022050922/55ab8adb1a28abb1568b489d/html5/thumbnails/23.jpg)
Gracias.