coeficiente de correlacion de pearson y spearman
TRANSCRIPT
INSTITUTO UNIVERSITARIO SANTIAGO MARIÑOINGENIERIA INDUSTRIAL
ESTADISTICA ISECCION: YV
coeficiente de correlacion de pearson y spearman
Participante:Michelly Calzadilla C.I 26.146.835
Profesor:Ramón A. Aray López
Febrero 2015 Barcelona
Coeficiente de correlación de Pearson
En estadística, el coeficiente de correlación de Pearson es una medida de la relación lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.
De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas.
En el caso de que se esté estudiando dos variables aleatorias X y Y sobre una población;
el coeficiente de correlación de Pearson se simboliza con la letra , siendo la expresión que
nos permite calcularlo:
Coeficiente de correlación de Pearson
Donde: es la covarianza de es la desviación típica de la variable
es la desviación típica de la variable
Coeficiente de correlación de Pearson
De manera análoga podemos calcular este coeficiente sobre un estadístico muestral denotado como a:
InterpretaciónEl valor del índice de correlación varía en el intervalo [-1,1]:Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en proporción constante.Si 0 < r < 1, existe una correlación positiva.Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las variables son independientes: pueden existir todavía relaciones no lineales entre las dos variables.Si -1 < r < 0, existe una correlación negativa.Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre las dos variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en proporción constante.
Cómo usar el coeficiente de correlación de Pearson
El coeficiente de correlación de Person, normalmente denotado como "r", es un valor estadístico que mide la relación linear entre dos variables. Los rangos de valor van de +1 a -1, lo que indica una perfecta relación linear positiva y negativa respectivamente entre ambas variables. El cálculo del coeficiente de correlación normalmente se realiza con programas de estadística, como SPSS y SAS, para dar los valores posibles más precisos en estudios científicos. Su interpretación y uso varía de acuerdo con el contexto y propósito del respectivo estudio en donde se calcula.
Instrucciones Identifica el dependiente variable que se probará entre dos observaciones derivadas
independientemente. Uno de los requisitos del coeficiente de correlación de Pearson es que las dos variables que se comparan deben observarse o medirse de manera independiente para eliminar cualquier resultado sesgado.
Calcula el coeficiente de correlación de Pearson. Para cantidades grandes de información, el calculo puede ser tedioso. Además de los varios programas de estadística, muchas calculadoras científicas pueden calcular el valor.
Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación linear entre las
dos variables. Conforme el coeficiente de correlación se acerque al 0, los valores se vuelven menos
correlacionados, lo que identifica las variables que no pueden ser relacionadas entre sí.
Reporta un valor de correlación cercano al 1 como indicador de que existe una relación linear positiva
entre las dos variables. Un valor mayor a cero que se acerque a 1 da como resultado una mayor
correlación positiva entre la información. Conforme una variable aumenta cierta cantidad, la otra aumenta
en cantidad correspondiente. La interpretación debe determinarse de acuerdo con el contexto del
estudio.
Reporta un valor de correlación cercano a -1 como indicador de que hay una relación linear negativa
entre las dos variables. Conforme el coeficiente se acerca a -1, las variables se vuelven negativamente
más correlacionadas, lo que indica que conforme una variable aumenta, la variable disminuye por una
cantidad correspondiente. La interpretación, de nuevo, debe determinarse de acuerdo con el contexto del
estudio.
Cómo usar el coeficiente de correlación de Pearson
Interpreta el coeficiente de correlación de acuerdo con el contexto de los datos particulares. El valor de
correlación es esencialmente un valor arbitrario que debe aplicarse de acuerdo con las variables que se
comparan. Por ejemplo, un valor r de 0.912 indica una relación linear positiva muy fuerte entre las dos
variables. En un estudio donde se comparan dos variables que normalmente se identifican como
relacionadas, estos resultados dan evidencia de que una variable puede afectar de manera positiva a la
otra, lo que resulta un caso para mayor investigación entre las dos. Sin embargo, el mismo valor r en un
estudio que compara dos variables donde está probado que tienen una relación linear positiva puede
identificar un error en la información u otros problemas potenciales en el diseño experimental. Por ello, es
importante entender el contexto de la información cuando se reporta e interpreta el coeficiente de
correlación de Pearson.
Cómo usar el coeficiente de correlación de Pearson
Determina la importancia de los resultados. Esto se logra con el uso del coeficiente de
correlación, grados de libertad y una tabla de valores críticos del coeficiente de correlación.
Los grados de libertad se calculan como el número de las dos observaciones menos 2.
Con este valor, identifica el valor crítico correspondiente en la tabla de correlación para una
prueba de 0.05 y 0.01 que identifique 95 y 99 por ciento de nivel de confiabilidad
respectivamente. Compara el valor crítico al coeficiente de correlación previamente
calculado. Si el coeficiente de correlación es mayor, los resultados son importantes.
CÓMO USAR EL COEFICIENTE DE CORRELACIÓN DE
PEARSON
VENTAJAS Y DESVENTAJAS
Ventajas requiere datos de cantidad solo del periodo base
Desventajas no refleja cambios en los patrones de compra conforme pasa el tiempo
USOS DE ENFOQUES PEARSON A PROBLEMAS ESTADÍSTICOS
En la perspectiva de Pearson, para establecer el nivel de significación estadística habría que atender al
impacto de cada tipo de error en el objetivo del investigador, y a partir de ahí se decidirá cual de ellos es
preferible minimizar.
Pearson llamaron alfa al error tipo l y beta al error tipo ll; a partir de este ultimo topo de error,
introdujeron el concepto de «poder de una prueba estadística, el cual se refiere a su capacidad para
evitar el error tipo ll, y esta definido por 1-beta, y en estrecha relación con este se ha desarrollado el
concepto de «tamaño del efecto» que algunos han propuesto como sustituto de los valores p en los
informes de investigación científica.
Las pruebas paramétricas mas conocidas y usadas son la prueba T de Student, la prueba F llamada así
en honor a Fisher, y el coeficiente de correlación de Pearson, simbolizado por r.
Coeficiente de correlación de Spearman
En estadística, el coeficiente de correlación de Spearman, ρ (rho) es una medida de la correlación (la asociación o interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo orden.El estadístico ρ viene dado por la expresión:
donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el número de parejas.Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstancia
Coeficiente de correlación de Spearman
Para muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximación a la distribución t de Student
La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia. La tau de Kendall es un coeficiente de correlación por rangos, inversiones entre dos ordenaciones de una distribución normal bivariante.
cómo usar el coeficiente de correlacion de spearman
El coeficiente de correlación de Spearman permite identificar si dos variables se relacionan en una función monótona (es decir, cuando un número aumenta, el otro también o viceversa).
Dibuja tu tabla. Esta organizará la información que necesitas para calcular el coeficiente de correlación de Spearman. Necesitarás:6 columnas con encabezados como se muestra a continuación.Las filas necesarias para poner los pares de datos que tengas.
cómo usar el coeficiente de correlacion de spearman
Llena las primeras dos columnas con los pares de datos.
En tu tercer columna clasifica tus datos de la primera columna del 1 hasta n(el número de datos que tienes). Comienza con el más bajo, el cual debe tener el 1, el siguiente número más bajo el 2 y así sucesivamente.
cómo usar el coeficiente de correlacion de spearman
En tu cuarta columna haz lo mismo que en el paso 3, pero clasifica la segunda columna en lugar de la primera.
En la columna "d" calcula la diferencia del número de clasificación para cada par de datos. Esto quiere decir que si un dato es tiene el 1 y el otro el número 3, la diferencia sería de 2 (no importa el signo porque el siguiente paso es elevarlo al cuadrado).
cómo usar el coeficiente de correlación de spearman
Eleva al cuadrado cada número de la columna "d" y escribe estos valores en la columna "d2".
Suma todos los valores que hay en la columna "d2". Este resultado es Σd2.
cómo usar el coeficiente de correlación de spearman
Si no hay ninguna relación en los pasos anteriores, introduce este valor en la fórmula simplificada del coeficiente de correlación de Spearman
Interpreta el resultado. Puede variar entre -1 y 1.Cercano a -1: correlación negativaCercano a 0: sin correlación linearCercano a 1: correlación positivaRecuerda dividir entre el total exacto de resultados, luego redúcelo a la mitad. A continuación, divídelo entre Σd2.
VENTAJAS Y DESVENTAJAS
Ventajas no esta afectada por los cambios en las unidades de medida.
Al ser una técnica no parametra, es libre de distribución probabilística.
Desventajas es recomendable usarlo cuando los datos presentan valores extremos, ya que dichos de correlación de Pearson, o ante distribuciones no normales.
r no debe ser utilizada para decir algo sobre la relación entre causa y efecto
USOS DE ENFOQUES SPEARMAN
A PROBLEMAS ESTADÍSTICOSUna generalización del coeficiente de Spearman es útil en la situación en la cual hay 3 o mas condiciones, varios individuos son observados en cada una de ella, y predecimos que las observaciones tendrán un orden en particular. Por ejemplo, un conjunto de individuos pueden tener 3 oportunidades para intentar cierta tarea, y predecimos que su habilidad mejorar de intento en intento.
El coeficiente de correlación de rangos de Spearman debe utilizarse para series de datos en los que existan varios extremos, pues si calculamos la correlación de Pearson, los resultados se varan afectados.
La interpretación del resultado del coeficiente de correlación de Speraman se encuentra entre los valores de -1 y 1.
El significado estadística de un coeficiente debe tener en cuenta conjuntamente con la relevancia clinica del fenómeno que se estudia
https://es.wikipedia.org/wiki/Coeficiente_de_correlación_de_Spearman
http://documents.tips/presentations-public-speaking/uso-de-los-coeficientes-de-correlacion-de-pearson-y-de-sperman.html
https://es.wikipedia.org/wiki/Coeficiente_de_correlación_de_Pearson
http://www.monografias.com/trabajos85/coeficiente-correlacion-rangos-spearman/coeficiente-correlacion-rangos-spearman.shtml
http://es.wikihow.com/calcular-el-coeficiente-de-correlación-de-Spearman#/Imagen:Table_338.jpg
http://www.ehowenespanol.com/coeficiente-correlacion-pearson-como_84118/
Bibliografía