coeficiente de correlacion de pearson y spearman

20
INSTITUTO UNIVERSITARIO SANTIAGO MARIÑO INGENIERIA INDUSTRIAL ESTADISTICA I SECCION: YV coeficiente de correlacion de pearson y spearman Participante: Michelly Calzadilla C.I 26.146.835 Profesor: Ramón A. Aray López Febrero 2015 Barcelona

Upload: michelly-calzadilla

Post on 14-Apr-2017

153 views

Category:

Education


4 download

TRANSCRIPT

Page 1: coeficiente de correlacion de pearson y spearman

INSTITUTO UNIVERSITARIO SANTIAGO MARIÑOINGENIERIA INDUSTRIAL

ESTADISTICA ISECCION: YV

coeficiente de correlacion de pearson y spearman

Participante:Michelly Calzadilla C.I 26.146.835

Profesor:Ramón A. Aray López

Febrero 2015 Barcelona

Page 2: coeficiente de correlacion de pearson y spearman

Coeficiente de correlación de Pearson

En estadística, el coeficiente de correlación de Pearson es una medida de la relación lineal entre dos variables aleatorias  cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.

De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas.

Page 3: coeficiente de correlacion de pearson y spearman

En el caso de que se esté estudiando dos variables aleatorias X y Y sobre una población;

el coeficiente de correlación de Pearson se simboliza con la letra , siendo la expresión que

nos permite calcularlo:

Coeficiente de correlación de Pearson

Donde:   es la covarianza de   es la desviación típica de la variable 

es la desviación típica de la variable 

Page 4: coeficiente de correlacion de pearson y spearman

Coeficiente de correlación de Pearson

De manera análoga podemos calcular este coeficiente sobre un estadístico muestral denotado como    a:

InterpretaciónEl valor del índice de correlación varía en el intervalo [-1,1]:Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en proporción constante.Si 0 < r < 1, existe una correlación positiva.Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las variables son independientes: pueden existir todavía relaciones no lineales entre las dos variables.Si -1 < r < 0, existe una correlación negativa.Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre las dos variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en proporción constante.

Page 5: coeficiente de correlacion de pearson y spearman

Cómo usar el coeficiente de correlación de Pearson

El coeficiente de correlación de Person, normalmente denotado como "r", es un valor estadístico que mide la relación linear entre dos variables. Los rangos de valor van de +1 a -1, lo que indica una perfecta relación linear positiva y negativa respectivamente entre ambas variables. El cálculo del coeficiente de correlación normalmente se realiza con programas de estadística, como SPSS y SAS, para dar los valores posibles más precisos en estudios científicos. Su interpretación y uso varía de acuerdo con el contexto y propósito del respectivo estudio en donde se calcula.

Instrucciones Identifica el dependiente variable que se probará entre dos observaciones derivadas

independientemente. Uno de los requisitos del coeficiente de correlación de Pearson es que las dos variables que se comparan deben observarse o medirse de manera independiente para eliminar cualquier resultado sesgado.

Calcula el coeficiente de correlación de Pearson. Para cantidades grandes de información, el calculo puede ser tedioso. Además de los varios programas de estadística, muchas calculadoras científicas pueden calcular el valor.

Page 6: coeficiente de correlacion de pearson y spearman

Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación linear entre las

dos variables. Conforme el coeficiente de correlación se acerque al 0, los valores se vuelven menos

correlacionados, lo que identifica las variables que no pueden ser relacionadas entre sí.

Reporta un valor de correlación cercano al 1 como indicador de que existe una relación linear positiva

entre las dos variables. Un valor mayor a cero que se acerque a 1 da como resultado una mayor

correlación positiva entre la información. Conforme una variable aumenta cierta cantidad, la otra aumenta

en cantidad correspondiente. La interpretación debe determinarse de acuerdo con el contexto del

estudio.

Reporta un valor de correlación cercano a -1 como indicador de que hay una relación linear negativa

entre las dos variables. Conforme el coeficiente se acerca a -1, las variables se vuelven negativamente

más correlacionadas, lo que indica que conforme una variable aumenta, la variable disminuye por una

cantidad correspondiente. La interpretación, de nuevo, debe determinarse de acuerdo con el contexto del

estudio.

Cómo usar el coeficiente de correlación de Pearson

Page 7: coeficiente de correlacion de pearson y spearman

Interpreta el coeficiente de correlación de acuerdo con el contexto de los datos particulares. El valor de

correlación es esencialmente un valor arbitrario que debe aplicarse de acuerdo con las variables que se

comparan. Por ejemplo, un valor r de 0.912 indica una relación linear positiva muy fuerte entre las dos

variables. En un estudio donde se comparan dos variables que normalmente se identifican como

relacionadas, estos resultados dan evidencia de que una variable puede afectar de manera positiva a la

otra, lo que resulta un caso para mayor investigación entre las dos. Sin embargo, el mismo valor r en un

estudio que compara dos variables donde está probado que tienen una relación linear positiva puede

identificar un error en la información u otros problemas potenciales en el diseño experimental. Por ello, es

importante entender el contexto de la información cuando se reporta e interpreta el coeficiente de

correlación de Pearson.

Cómo usar el coeficiente de correlación de Pearson

Page 8: coeficiente de correlacion de pearson y spearman

Determina la importancia de los resultados. Esto se logra con el uso del coeficiente de

correlación, grados de libertad y una tabla de valores críticos del coeficiente de correlación.

Los grados de libertad se calculan como el número de las dos observaciones menos 2.

Con este valor, identifica el valor crítico correspondiente en la tabla de correlación para una

prueba de 0.05 y 0.01 que identifique 95 y 99 por ciento de nivel de confiabilidad

respectivamente. Compara el valor crítico al coeficiente de correlación previamente

calculado. Si el coeficiente de correlación es mayor, los resultados son importantes.

CÓMO USAR EL COEFICIENTE DE CORRELACIÓN DE

PEARSON

Page 9: coeficiente de correlacion de pearson y spearman

VENTAJAS Y DESVENTAJAS

Ventajas requiere datos de cantidad solo del periodo base

Desventajas no refleja cambios en los patrones de compra conforme pasa el tiempo

Page 10: coeficiente de correlacion de pearson y spearman

USOS DE ENFOQUES PEARSON A PROBLEMAS ESTADÍSTICOS

En la perspectiva de Pearson, para establecer el nivel de significación estadística habría que atender al

impacto de cada tipo de error en el objetivo del investigador, y a partir de ahí se decidirá cual de ellos es

preferible minimizar.

Pearson llamaron alfa al error tipo l y beta al error tipo ll; a partir de este ultimo topo de error,

introdujeron el concepto de «poder de una prueba estadística, el cual se refiere a su capacidad para

evitar el error tipo ll, y esta definido por 1-beta, y en estrecha relación con este se ha desarrollado el

concepto de «tamaño del efecto» que algunos han propuesto como sustituto de los valores p en los

informes de investigación científica.

Las pruebas paramétricas mas conocidas y usadas son la prueba T de Student, la prueba F llamada así

en honor a Fisher, y el coeficiente de correlación de Pearson, simbolizado por r.

Page 11: coeficiente de correlacion de pearson y spearman

Coeficiente de correlación de Spearman

En estadística, el coeficiente de correlación de Spearman, ρ (rho) es una medida de la correlación (la asociación o interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo orden.El estadístico ρ viene dado por la expresión:

donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el número de parejas.Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstancia

Page 12: coeficiente de correlacion de pearson y spearman

Coeficiente de correlación de Spearman

Para muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximación a la distribución t de Student

La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia. La tau de Kendall es un coeficiente de correlación por rangos, inversiones entre dos ordenaciones de una distribución normal bivariante.

Page 13: coeficiente de correlacion de pearson y spearman

cómo usar el coeficiente de correlacion de spearman

El coeficiente de correlación de Spearman permite identificar si dos variables se relacionan en una función monótona (es decir, cuando un número aumenta, el otro también o viceversa). 

Dibuja tu tabla. Esta organizará la información que necesitas para calcular el coeficiente de correlación de Spearman. Necesitarás:6 columnas con encabezados como se muestra a continuación.Las filas necesarias para poner los pares de datos que tengas.

Page 14: coeficiente de correlacion de pearson y spearman

cómo usar el coeficiente de correlacion de spearman

Llena las primeras dos columnas con los pares de datos.

En tu tercer columna clasifica tus datos de la primera columna del 1 hasta n(el número de datos que tienes). Comienza con el más bajo, el cual debe tener el 1, el siguiente número más bajo el 2 y así sucesivamente.

Page 15: coeficiente de correlacion de pearson y spearman

cómo usar el coeficiente de correlacion de spearman

En tu cuarta columna haz lo mismo que en el paso 3, pero clasifica la segunda columna en lugar de la primera.

En la columna "d" calcula la diferencia del número de clasificación para cada par de datos. Esto quiere decir que si un dato es tiene el 1 y el otro el número 3, la diferencia sería de 2 (no importa el signo porque el siguiente paso es elevarlo al cuadrado).

Page 16: coeficiente de correlacion de pearson y spearman

cómo usar el coeficiente de correlación de spearman

Eleva al cuadrado cada número de la columna "d" y escribe estos valores en la columna "d2".

Suma todos los valores que hay en la columna "d2". Este resultado es Σd2.

Page 17: coeficiente de correlacion de pearson y spearman

cómo usar el coeficiente de correlación de spearman

Si no hay ninguna relación en los pasos anteriores, introduce este valor en la fórmula simplificada del coeficiente de correlación de Spearman

Interpreta el resultado. Puede variar entre -1 y 1.Cercano a -1: correlación negativaCercano a 0: sin correlación linearCercano a 1: correlación positivaRecuerda dividir entre el total exacto de resultados, luego redúcelo a la mitad. A continuación, divídelo entre Σd2.

Page 18: coeficiente de correlacion de pearson y spearman

VENTAJAS Y DESVENTAJAS

Ventajas no esta afectada por los cambios en las unidades de medida.

Al ser una técnica no parametra, es libre de distribución probabilística.

Desventajas es recomendable usarlo cuando los datos presentan valores extremos, ya que dichos de correlación de Pearson, o ante distribuciones no normales.

r no debe ser utilizada para decir algo sobre la relación entre causa y efecto

Page 19: coeficiente de correlacion de pearson y spearman

USOS DE ENFOQUES SPEARMAN

A PROBLEMAS ESTADÍSTICOSUna generalización del coeficiente de Spearman es útil en la situación en la cual hay 3 o mas condiciones, varios individuos son observados en cada una de ella, y predecimos que las observaciones tendrán un orden en particular. Por ejemplo, un conjunto de individuos pueden tener 3 oportunidades para intentar cierta tarea, y predecimos que su habilidad mejorar de intento en intento.

El coeficiente de correlación de rangos de Spearman debe utilizarse para series de datos en los que existan varios extremos, pues si calculamos la correlación de Pearson, los resultados se varan afectados.

La interpretación del resultado del coeficiente de correlación de Speraman se encuentra entre los valores de -1 y 1.

El significado estadística de un coeficiente debe tener en cuenta conjuntamente con la relevancia clinica del fenómeno que se estudia

Page 20: coeficiente de correlacion de pearson y spearman

https://es.wikipedia.org/wiki/Coeficiente_de_correlación_de_Spearman

http://documents.tips/presentations-public-speaking/uso-de-los-coeficientes-de-correlacion-de-pearson-y-de-sperman.html

https://es.wikipedia.org/wiki/Coeficiente_de_correlación_de_Pearson

http://www.monografias.com/trabajos85/coeficiente-correlacion-rangos-spearman/coeficiente-correlacion-rangos-spearman.shtml

http://es.wikihow.com/calcular-el-coeficiente-de-correlación-de-Spearman#/Imagen:Table_338.jpg

http://www.ehowenespanol.com/coeficiente-correlacion-pearson-como_84118/

Bibliografía