correlacao

29
1 Baseado (parcialmente) em: Baseado (parcialmente) em: Statistical methods for psychology, Statistical methods for psychology, 3 rd rd Edition Edition David C. Howell David C. Howell Correlação © 2004/2006 Tradução e adaptação de Tomás da Silva 2 Correlação Pontos Principais Pontos Principais O problema O problema Diagramas de dispersão Diagramas de dispersão Um exemplo Um exemplo O coeficiente de correlação O coeficiente de correlação Correlações com ordens Correlações com ordens Factores que afectam as correlações Factores que afectam as correlações Cont.

Upload: jose-pereira

Post on 25-Jul-2015

963 views

Category:

Education


0 download

TRANSCRIPT

Page 1: Correlacao

1

Baseado (parcialmente) em:Baseado (parcialmente) em:

Statistical methods for psychology, Statistical methods for psychology, 33rdrd EditionEdition

David C. HowellDavid C. Howell

Correlação

© 2004/2006 Tradução e adaptação de Tomás da Silva

2Correlação

Pontos PrincipaisPontos Principais

•• O problemaO problema

•• Diagramas de dispersãoDiagramas de dispersão

•• Um exemploUm exemplo

•• O coeficiente de correlaçãoO coeficiente de correlação

✸✸ Correlações com ordensCorrelações com ordens

•• Factores que afectam as correlaçõesFactores que afectam as correlações

Cont.

Page 2: Correlacao

2

3Correlação

Pontos PrincipaisPontos Principais----cont.cont.

•• Testar a significânciaTestar a significância

•• Matrizes de intercorrelaçõesMatrizes de intercorrelações

•• Outros tipos de correlaçõesOutros tipos de correlações

•• Questões para revisãoQuestões para revisão

4Correlação

O ProblemaO Problema

•• Estarão duas variáveis relacionadas?Estarão duas variáveis relacionadas?

✸✸Será que uma aumenta quando a outra aumenta?Será que uma aumenta quando a outra aumenta?

•• v.g. competências profissionais e rendimento v.g. competências profissionais e rendimento económico económico

✸✸Será que uma diminui quando a outra aumenta?Será que uma diminui quando a outra aumenta?

•• v.g. problemas de saúde e nutriçãov.g. problemas de saúde e nutrição

•• Como poderemos obter uma medida numérica Como poderemos obter uma medida numérica do grau de relação? do grau de relação?

Page 3: Correlacao

3

5Correlação

O coeficiente de correlaçãoO coeficiente de correlação((http://www.stats.gla.ac.uk/steps/glossary)http://www.stats.gla.ac.uk/steps/glossary)

•• O coeficiente de correlação é um número entre O coeficiente de correlação é um número entre --1 and 1 o qual 1 and 1 o qual mede o grau em que duas variáveis estão linearmente mede o grau em que duas variáveis estão linearmente correlacionadas. Se existe uma relação linear perfeita com um correlacionadas. Se existe uma relação linear perfeita com um declive positivo entre as duas variávesi, temos um coeficiente de declive positivo entre as duas variávesi, temos um coeficiente de correlação de 1; se existir uma correlação positiva, sempre que correlação de 1; se existir uma correlação positiva, sempre que uma variável tiver um valor elevado (baixo), também a outra o uma variável tiver um valor elevado (baixo), também a outra o terá. Se existir uma relação linear perfeita com um declive terá. Se existir uma relação linear perfeita com um declive negativo entre as duas variáveis, teremos um coeficiente de negativo entre as duas variáveis, teremos um coeficiente de correlação de correlação de --1; se existir uma correlação negativa, sempre que 1; se existir uma correlação negativa, sempre que uma variável tiver um valor elevado (baixo), a outra tem um valor uma variável tiver um valor elevado (baixo), a outra tem um valor baixo (elevado). Um coeficiente de correlação de 0 significa que baixo (elevado). Um coeficiente de correlação de 0 significa que não existe relação linear entre as variáveis.não existe relação linear entre as variáveis.

•• Existem diferentes coeficientes de correlação que podem ser Existem diferentes coeficientes de correlação que podem ser apropriados dependendo das espécies de variáveis que estão a apropriados dependendo das espécies de variáveis que estão a ser estudadas (ver próximo slide)ser estudadas (ver próximo slide)

6Correlação

Tipos de coeficientes de Tipos de coeficientes de correlação/associaçãocorrelação/associação

CoeficienteCoeficiente SímboloSímbolo CaracterísticasCaracterísticas

ProdutoProduto--Momento de Momento de PearsonPearson

rr X e Y quantitativas, relação linearX e Y quantitativas, relação linear

Eta quadradoEta quadrado ηη22 X e Y quantitativa, relação curvilinearX e Y quantitativa, relação curvilinear

Coeficiente de SpearmanCoeficiente de Spearman ρρ ou rou rss X e Y ordens, relação monotónicaX e Y ordens, relação monotónica

Tau de KendallTau de Kendall ττ X e Y ordens, relação monotónicaX e Y ordens, relação monotónica

Ponto biserialPonto biserial rrpbpb Uma variável quantitativa e outra dicotómicaUma variável quantitativa e outra dicotómica

BiserialBiserial rrbb X e Y quantitaivas mas uma das variáveis X e Y quantitaivas mas uma das variáveis forçada a uma dicotomiaforçada a uma dicotomia

TetracóricoTetracórico rrtt X e Y quantitativas, mas ambas forçadas a X e Y quantitativas, mas ambas forçadas a dicotomiasdicotomias

Coeficiente fiCoeficiente fi φφ X e Y ambas dicotómicasX e Y ambas dicotómicas

Page 4: Correlacao

4

7Correlação

Diagramas de DispersãoDiagramas de Dispersão

•• ExemplosExemplos

✸✸Ver os próximos slidesVer os próximos slides

•• Diagramas representando diferentes Diagramas representando diferentes magitudes de relaçãomagitudes de relação

•• Matriz combinando Diagramas de dispersão e Matriz combinando Diagramas de dispersão e r’sr’s

•• Relação entre autoRelação entre auto--estima e alturaestima e altura

•• Expectativa de vida e gastos em cuidadados Expectativa de vida e gastos em cuidadados de saúdede saúde

8Correlação

Page 5: Correlacao

5

9Correlação

Diagramas de Dispersão e r’sDiagramas de Dispersão e r’s

Fonte:

Wikipedia

10Correlação

Page 6: Correlacao

6

11Correlação

Figure 9.2

Life Expectancy and Health Care Costs

Health Care Expenditures

1600140012001000800600400200

Life

Exp

ecta

ncy

(Mal

es)

74

73

72

71

70

69

68

67

66

12Correlação

Um applet para ver coeficientes de correlação(http://www.duxbury.com/authors/mcclellandg/tiein/johnson/correlation.htm)

Page 7: Correlacao

7

13Correlação

Um ExemploUm Exemplo

•• Suponha que uma disciplina tem dois Suponha que uma disciplina tem dois componentes componentes -- trabalhos laboratoriais e exame trabalhos laboratoriais e exame -- ambos contribuindo para a nota final. Será ambos contribuindo para a nota final. Será que ambos estão correlacionados?que ambos estão correlacionados?

•• Representar graficamente a relação entre as Representar graficamente a relação entre as duas variáveis (diagrama de dispersão)duas variáveis (diagrama de dispersão)

•• O que observamos?O que observamos?

✸✸Uma relação francamente pequenaUma relação francamente pequena

✸✸A relação é positivaA relação é positiva

14Correlação

Total Points in Lab

20018016014012010080

Tot

al P

oint

s on

Exa

ms

140

120

100

80

60 Rsq = 0.1368

Page 8: Correlacao

8

15Correlação

Exames e LaboratóriosExames e Laboratórios

•• Note que a relação é fraca, mas real.Note que a relação é fraca, mas real.

•• Note que a maioria dos dados se concentram Note que a maioria dos dados se concentram na direita.na direita.

•• Porque nos preocupamos com o estudo da Porque nos preocupamos com o estudo da relação?relação?

✸✸ O que O que concluiriamconcluiriam os alunos se não existisse uma os alunos se não existisse uma relação?relação?

✸✸ E se a relação fosse praticamente perfeita?E se a relação fosse praticamente perfeita?

✸✸ E se a relação fosse negativa?E se a relação fosse negativa?

16Correlação

Exemplo aplicadoExemplo aplicadoDoença coronária e Doença coronária e

TabagismoTabagismo•• Landwehr & Watkins relataram dados Landwehr & Watkins relataram dados sobre doença coronária e tabagismo em sobre doença coronária e tabagismo em 21 países desenvolvidos21 países desenvolvidos

•• Os dados foram arredondados por Os dados foram arredondados por conveniência de cálculo.conveniência de cálculo.

✸✸Tenha em nota que isso não afectou as Tenha em nota que isso não afectou as conclusões originais.conclusões originais.

Page 9: Correlacao

9

17Correlação

Os dadosOs dadosCigarette Consumption and Coronary Heart Disease Mortality for 21 Countries

Cig. 11 9 9 9 8 8 8 6 6 5 5CHD 26 21 24 21 19 13 19 11 23 15 13

Cig. 5 5 5 5 4 4 4 3 3 3CHD 4 18 12 3 11 15 6 13 4 14

Cig. = Cigarettes per adult per dayCHD = Cornary Heart Disease Mortality per 10,000 population

Os EUA são o primeiro país na lista—o país com maior taxa de consumo e a maior taxa de mortalidade.

18Correlação

Diagrama de dispersão dos Diagrama de dispersão dos dadosdados

•• Mortalidade por CHD é colocada na ordenadaMortalidade por CHD é colocada na ordenada

✸✸ Porquê?Porquê?

•• Consumo de cigarros na abcissaConsumo de cigarros na abcissa

✸✸ Porquê?Porquê?

•• O que representa cada ponto?O que representa cada ponto?

•• A linha de melhor aderência foi colocada para A linha de melhor aderência foi colocada para percebermos melhor a relaçãopercebermos melhor a relação

Page 10: Correlacao

10

19Correlação

Cigarette Consumption per Adult per Day

12108642

CH

D M

orta

lity

per

10,

000

30

20

10

0

{X = 6, Y = 11}

20Correlação

O que mostra o Diagrama de O que mostra o Diagrama de dispersão?dispersão?

•• Quando aumenta o tabagismo, também Quando aumenta o tabagismo, também aumenta a mortalidade por doença coronária.aumenta a mortalidade por doença coronária.

•• A relação parece forteA relação parece forte

•• Nem todos os pontos se encontram sobre a Nem todos os pontos se encontram sobre a linha.linha.

✸✸ Essa discrepância (ou desvio) dáEssa discrepância (ou desvio) dá--nos os “resíduos” nos os “resíduos” ou “erros de predição”ou “erros de predição”

•• A discutir posteriormenteA discutir posteriormente

Page 11: Correlacao

11

21Correlação

Coeficiente de CorrelaçãoCoeficiente de Correlação

•• Uma medida do grau de relação.Uma medida do grau de relação.

•• O sinal revela a direcção.O sinal revela a direcção.

•• Baseado na covariânciaBaseado na covariância

✸✸Mede o grau em que os resultados mais altos Mede o grau em que os resultados mais altos numa variável acompanham os resultados altos na numa variável acompanham os resultados altos na outra, e os resultados mais pequenos vão com os outra, e os resultados mais pequenos vão com os outros mais pequenos.outros mais pequenos.

22Correlação

CovariânciaCovariância

•• A fórmulaA fórmula

•• Como funciona, e porquêComo funciona, e porquê

•• Quando deve a covQuando deve a covXYXY ser grande e positiva?ser grande e positiva?

•• Quando deve a covQuando deve a covXYXY ser grande e negativa?ser grande e negativa?

1))((

−−−Σ=

N

YYXXCovXY

Page 12: Correlacao

12

23Correlação

Coeficiente de CorrelaçãoCoeficiente de Correlação

•• Simbolizado por Simbolizado por r r

•• Covariância Covariância ÷÷ (produto dos desvios padrão de cada (produto dos desvios padrão de cada uma das variáveis)uma das variáveis)

Nota: existem vários coeficientes de associação e de Nota: existem vários coeficientes de associação e de correlação (vide próximo slide), a fórmula acima diz correlação (vide próximo slide), a fórmula acima diz respeito ao coeficiente produto momento de respeito ao coeficiente produto momento de PearsonPearson

YX

XY

ss

Covr =

24Correlação

Coeficiente de correlaçãoCoeficiente de correlação

•• Outra fórmula frequentemente usada no Outra fórmula frequentemente usada no cálculo:cálculo:

Page 13: Correlacao

13

25Correlação

CálculoCálculo

•• CovCovXYXY = 11.13= 11.13

•• ssXX = 2.33= 2.33

•• ssYY = 6.69= 6.69

71.59.1513.11

)69.6)(33.2(13.11cov ====

YX

XY

ssr

26Correlação

CorrelaçãoCorrelação----cont.cont.

•• Correlação, Correlação, rr = .71= .71

•• O sinal é positivoO sinal é positivo

✸✸Porquê?Porquê?

•• E se o sinal fôsse negativoE se o sinal fôsse negativo

✸✸O que poderia tal significar?O que poderia tal significar?

✸✸Não alteraria o Não alteraria o graugrau da relação.da relação.

Page 14: Correlacao

14

27Correlação

CorrelaçãoCorrelação----cont.cont.

Como interpretar o r?Como interpretar o r?

•• Utilize uma classificação convencionalUtilize uma classificação convencional

•• Calcule o coeficiente de determinação: rCalcule o coeficiente de determinação: r2 2

e re r22%%

•• Calcule a significância estatística do r Calcule a significância estatística do r (ver slide sobre como testar o r)(ver slide sobre como testar o r)

28Correlação

CorrelaçãoCorrelação----cont.cont.

•• Utilize um esquema de classificação Utilize um esquema de classificação convencional:convencional:

�r = 0.5 é um efeito grande, 0.3 é moderado, e 0.1 is pequeno (Cohen, 1988)

�Uma escala completa (Will G. Hopkins, 2002)http://www.sportsci.org/resource/stats/effectmag.html

trivialtrivial pequenapequena moderadamoderada grandegrande muito muito grandegrande

quase quase perfeitaperfeita

perfeitaperfeita

0.00.0 0.10.1 0.30.3 0.50.5 0.70.7 0.90.9 11

Page 15: Correlacao

15

29Correlação

CorrelaçãoCorrelação----cont.cont.

••Calcule o coeficiente de determinação: Calcule o coeficiente de determinação: rr2 2 e re r22%%::

Aplicando ao exemplo de Landwehr & Watkins: r = .71, Aplicando ao exemplo de Landwehr & Watkins: r = .71, logo, rlogo, r22 = (.71)= (.71)22 = .504;= .504;

rr22% = (.71)% = (.71)22 x100% = 50.4%, ou seja, x100% = 50.4%, ou seja, aproximadamente, 50,4% da variabilidade na aproximadamente, 50,4% da variabilidade na mortalidade CHD é explicada pelo nº de cigarros mortalidade CHD é explicada pelo nº de cigarros consumidos por dia (e viceconsumidos por dia (e vice--versa).versa).

30Correlação

Factores que Afectam o Factores que Afectam o rr

•• Restrições na amplitudeRestrições na amplitude

✸✸ Ver o próximo slideVer o próximo slide

•• Dados apenas para os países baixo consumoDados apenas para os países baixo consumo

•• Não linearidadeNão linearidade

✸✸ V.g. idade e tamanho do vocabulárioV.g. idade e tamanho do vocabulário

•• SubSub--amostras heterogéneasamostras heterogéneas

✸✸ Relação entre peso e altura (combinando ambos os Relação entre peso e altura (combinando ambos os géneros)géneros)

Page 16: Correlacao

16

31Correlação

Países com Consumos BaixosPaíses com Consumos Baixos

Data With Restricted Range

Truncated at 5 Cigarettes Per Day

Cigarette Consumption per Adult per Day

5.55.04.54.03.53.02.5

CH

D M

orta

lity

per

10,0

00

20

18

16

14

12

10

8

6

4

2

32Correlação

Testar o Testar o rr

•• Parâmetro populacional = Parâmetro populacional = ρρ

•• Hipótese nula Hipótese nula HH00: : ρρ = 0= 0✸✸ Teste da independência linearTeste da independência linear

✸✸ O que é que significaria uma hipótese nula verdadeira aqui?O que é que significaria uma hipótese nula verdadeira aqui?

✸✸ O que é que significaria uma falsa hipótese nula?O que é que significaria uma falsa hipótese nula?

•• Hipótese alternativa (Hipótese alternativa (HH11) ) ρρ ≠≠ 00✸✸ BiBi--laterallateral

Page 17: Correlacao

17

33Correlação

Assunções (Assunções (http://www2.chass.ncsu.edu/garson/PA765/correl.htmhttp://www2.chass.ncsu.edu/garson/PA765/correl.htm))

•• Dados ao nível de escalas de intervalosDados ao nível de escalas de intervalos (para a correlação (para a correlação de Pearson).de Pearson).

•• RelaçõesRelações lineareslineares. Assume. Assume--se que os pontos xse que os pontos x--y no diagrama de y no diagrama de dispersão para as duas variáveis que estão em análise serão melhor descritos por dispersão para as duas variáveis que estão em análise serão melhor descritos por uma linha recta do que por uma outra qualquer função curvilínea. No caso em que uma linha recta do que por uma outra qualquer função curvilínea. No caso em que uma função curvilinear teria um melhor ajuste, então o r de Pearson e os outros uma função curvilinear teria um melhor ajuste, então o r de Pearson e os outros coeficientes lineares de correlação irão subestimar a correlação verdadeira, por coeficientes lineares de correlação irão subestimar a correlação verdadeira, por vezes a um ponto que torna a sua utilização inútil e enganosa. A linearidade pode vezes a um ponto que torna a sua utilização inútil e enganosa. A linearidade pode ser verificada visualmente através de um gráfico dos dados.ser verificada visualmente através de um gráfico dos dados.

•• HomoscedasticidadeHomoscedasticidade é assumida. Isto é, assumeé assumida. Isto é, assume--se que a variância se que a variância dos erros seja a mesma para qualquer ponto ao longo da relação linear. De outro dos erros seja a mesma para qualquer ponto ao longo da relação linear. De outro modo o coeficiente de correlação será uma medida enganadora da média dos modo o coeficiente de correlação será uma medida enganadora da média dos pontos mais elevados e mais baixos de correlação.pontos mais elevados e mais baixos de correlação.

•• Sem outliersSem outliers. Casos outliers podem atenuar os coeficientes de correlação. . Casos outliers podem atenuar os coeficientes de correlação. Os scatterplots podem ser usados para identificar visualmente outliers (ver acima). Os scatterplots podem ser usados para identificar visualmente outliers (ver acima). Uma diferença grande entre o r de Pearson e o rho de Spearman também pode Uma diferença grande entre o r de Pearson e o rho de Spearman também pode indicar a presença de outliers.indicar a presença de outliers.

34Correlação

•• Um Erro de medida mínimoUm Erro de medida mínimo é assumido uma vez que a baixa é assumido uma vez que a baixa garantia atenua o coeficiente de correlação. Por definição, a correlação garantia atenua o coeficiente de correlação. Por definição, a correlação mede a covariância sistemática de duas variáveis. O erro de medida mede a covariância sistemática de duas variáveis. O erro de medida usualmente reduz a covariância sistemática e diminui o coeficiente de usualmente reduz a covariância sistemática e diminui o coeficiente de correlação. Esta diminuição chamacorrelação. Esta diminuição chama--se se atenuaçãoatenuação. A restrição da variância, . A restrição da variância, discutida abaixo, também conduz à atenuação.discutida abaixo, também conduz à atenuação.

✸✸ Correcção para a atenuação:Correcção para a atenuação: A garantia pode ser pensada como a A garantia pode ser pensada como a correlação da variável com ela própria. A correcção da atenuação de correlação da variável com ela própria. A correcção da atenuação de uma correlação, ruma correlação, rxyxy é uma função das é uma função das garantiasgarantias das duas variáveis, rdas duas variáveis, rxxxxand rand ryyyy::

rrxyxy (corrigido) = r(corrigido) = rxyxy / [Raiz quadrada{r/ [Raiz quadrada{rxxxxrryyyy}]}]

•• Variância não restringidaVariância não restringida Se a variância for truncada ou Se a variância for truncada ou restringida numa ou em ambas as variáveis, por exemplo, uma restringida numa ou em ambas as variáveis, por exemplo, uma amostragem deficiente, tal pode também levar à atenuação do coeficiente amostragem deficiente, tal pode também levar à atenuação do coeficiente de correlação. Isso também acontece com a truncagem da amplitude das de correlação. Isso também acontece com a truncagem da amplitude das variáveis quando dicotomizamos dados contínuos, ou quando reduzimos variáveis quando dicotomizamos dados contínuos, ou quando reduzimos uma escala de7uma escala de7--pontos a uma escala de 3pontos a uma escala de 3--pontos. pontos.

Page 18: Correlacao

18

35Correlação

•• AssumeAssume--se que as distribuições subjacentes são se que as distribuições subjacentes são similaressimilares com o objectivo de avaliar a força da correlação. I.e., se com o objectivo de avaliar a força da correlação. I.e., se duas variáveis provêm de distribuições dissimilares, a sua correlação duas variáveis provêm de distribuições dissimilares, a sua correlação pode ser inferior a +1 mesmo quando os pontos observados estão tão pode ser inferior a +1 mesmo quando os pontos observados estão tão perfeitamente emparelhados quanto é possível permanecendo perfeitamente emparelhados quanto é possível permanecendo conformes às distribuições subjacentes. Portanto, quanto maior a conformes às distribuições subjacentes. Portanto, quanto maior a diferença na forma da distribuição das duas variáveis, maior a atenuação diferença na forma da distribuição das duas variáveis, maior a atenuação no coeficiente de correlação e mais o investigador deve considerar no coeficiente de correlação e mais o investigador deve considerar alternativas como a correlação por postos. Esta assunção poderá ser alternativas como a correlação por postos. Esta assunção poderá ser violada quando correlacionamos uma variável intervalar com uma violada quando correlacionamos uma variável intervalar com uma dicotomia ou mesmo com uma variável ordinal. dicotomia ou mesmo com uma variável ordinal.

•• Distribuições normais subjacentesDistribuições normais subjacentes, com o propósito de , com o propósito de testar a significância da correlação. O testar a significância da correlação. O teorema doteorema do limite centrallimite centraldemonstra, contudo, que para grandes amostras, os índices usados no demonstra, contudo, que para grandes amostras, os índices usados no teste de significância estarão normalmente distribuídosmesmo quando teste de significância estarão normalmente distribuídosmesmo quando as variáveis em si mesmas não estão distribuídas normalmente, e as variáveis em si mesmas não estão distribuídas normalmente, e portanto o teste de hipóteses pode ser empregue. O investigador pode portanto o teste de hipóteses pode ser empregue. O investigador pode desejar usar o Spearman ou outros tipos de correlações por postos não desejar usar o Spearman ou outros tipos de correlações por postos não paramétricas quando existirem violações marcadas desta assunção, paramétricas quando existirem violações marcadas desta assunção, embora esta estratégia tenha o perigo de atenuar a correlação. embora esta estratégia tenha o perigo de atenuar a correlação.

•• Termos de erro distribuídos normalmenteTermos de erro distribuídos normalmente. Mais uma . Mais uma vez, aplicavez, aplica--se o teorema do limite central.se o teorema do limite central.

36Correlação

Tabelas de SignificânciaTabelas de Significância

•• Tabelas (ver anexo)Tabelas (ver anexo)

•• For For NN -- 2 = 19 2 = 19 dfdf, , rrcritcrit = .433= .433

•• A correlação observada > .433A correlação observada > .433

•• Rejeitar Rejeitar HH00✸✸Correlação é significante.Correlação é significante.

✸✸Maior consumo de cigarros está associado Maior consumo de cigarros está associado com maior mortalidade por CHD.com maior mortalidade por CHD.

Page 19: Correlacao

19

37Correlação

Computer PrintoutComputer Printout

•• O “Printout” dáO “Printout” dá--nos o teste de nos o teste de significância.significância.

•• Ver o próximo slide.Ver o próximo slide.

✸✸Os duplos asteriscos com a nota de rodapé Os duplos asteriscos com a nota de rodapé indicamindicampp < .01.< .01.

38Correlação

Printout do SPSSPrintout do SPSS

Correlations

.713**

.000

21

PearsonCorrelationSig.(2-tailed)NPearsonCorrelationSig.(2-tailed)N

CigaretteConsumption perAdult per Day

CHD Mortalityper 10,000

CigaretteConsumptionper Adult per

Day

CHDMortality per10,000

Correlation is significant at the 0.01 level(2-tailed).

**.

Page 20: Correlacao

20

39Correlação

Matriz de IntercorrelaçõesMatriz de Intercorrelações

•• Matriz com as correlações entre várias Matriz com as correlações entre várias variáveis todas representadas de uma só vez.variáveis todas representadas de uma só vez.

•• Exemplo de Kliewer et al (1998) Exemplo de Kliewer et al (1998) JCCPJCCP

✸✸Amostra: 99 crianças muito novasAmostra: 99 crianças muito novas

✸✸MediuMediu--se o nível de:se o nível de:

•• Violência presenciada, Pensamentos Intrusivos, Violência presenciada, Pensamentos Intrusivos, Suporte Social, e Sintomas de InternalizaçãoSuporte Social, e Sintomas de Internalização

40Correlação

Witness

Intrus SocialSupport

Internalizing

Witness 1.00 .37 .08 .20

Intrus .37 1.00 -.08 .39SocSup .08 -.08 1.00 -.17

Internal .20 .39 -.17 1.00

Cont.

Page 21: Correlacao

21

41Correlação

Matriz de IntercorrelaçõesMatriz de Intercorrelações

•• Descreva a tabela.Descreva a tabela.

•• O que podemos dizer acerca dos efeitos O que podemos dizer acerca dos efeitos de se ter presenciado actos de violência?de se ter presenciado actos de violência?

•• Qual o papel desempenhado pelo suporte Qual o papel desempenhado pelo suporte social?social?

42Correlação

Questões para RevisãoQuestões para Revisão

•• O que ajuda a determinar quais as variáveis O que ajuda a determinar quais as variáveis que são representadas em cada um dos eixos que são representadas em cada um dos eixos do diagrama de dispersão?do diagrama de dispersão?

•• O que nos diria uma correlação de 0 acerca da O que nos diria uma correlação de 0 acerca da relação entre as notas nos trabalhos relação entre as notas nos trabalhos laboratoriais e os resultados nos exames?laboratoriais e os resultados nos exames?

•• Que factores podem afectar a relação entre Que factores podem afectar a relação entre tabagismo e a mortalidade por CHD?tabagismo e a mortalidade por CHD?

Page 22: Correlacao

22

43Correlação

Questões para RevisãoQuestões para Revisão----cont.cont.

•• Indique o nível (alto, médio, ou baixo) e o sinal da Indique o nível (alto, médio, ou baixo) e o sinal da correlação para:correlação para:

✸✸ Número de armas na comunidade e número de mortes por Número de armas na comunidade e número de mortes por armas de fogoarmas de fogo

✸✸ Roubos e incidência de abuso de drogasRoubos e incidência de abuso de drogas

✸✸ Sexo protegido e incidência de SIDASexo protegido e incidência de SIDA

✸✸ Nível educacional da comunidade e taxa de criminalidadeNível educacional da comunidade e taxa de criminalidade

✸✸ Número de explosões solares e taxa de suicídioNúmero de explosões solares e taxa de suicídio

Cont.

44Correlação

Questões para RevisãoQuestões para Revisão----cont.cont.

•• Porque deve o tamanho da correlação Porque deve o tamanho da correlação requerido para haver significância requerido para haver significância decrescer com o N (i.e., o número de decrescer com o N (i.e., o número de efectivos da amostra)?efectivos da amostra)?

Page 23: Correlacao

23

45Correlação

AnexoAnexo

46Correlação

AnexoAnexo

Page 24: Correlacao

24

47Correlação

AnexoAnexo

48Correlação

Exercício Exercício (http://www.texasoft.com/winkpear.html)(http://www.texasoft.com/winkpear.html)

Page 25: Correlacao

25

49Correlação

Exercício Exercício (http://www.texasoft.com/winkpear.html)(http://www.texasoft.com/winkpear.html)

50Correlação

Resolução Resolução (usando a calculadora http://wessa.net)(usando a calculadora http://wessa.net)

Page 26: Correlacao

26

51Correlação

Resolução Resolução (usando a calculadora http://wessa.net)(usando a calculadora http://wessa.net)

52Correlação

Wessa, P. (2006), Free Statistics Software, Office for Research Development Wessa, P. (2006), Free Statistics Software, Office for Research Development and Education, version 1.1.18, URL http://www.wessa.net/and Education, version 1.1.18, URL http://www.wessa.net/

Page 27: Correlacao

27

53Correlação

Coeficiente ró de Spearman, rCoeficiente ró de Spearman, rss

o A correlação de Spearman é uma técnica usada para testar a direcção e a força da relação entre duas variáveis. É um utensílio para avaliar se um conjunto qualquer de números se relaciona com outro conjunto qualquer de números. É um teste não-paramétrico e deve ser utilizado quando os dados são medidos numa escala ordinal ou quando os dados não se enquadram nos outros pressupostos dos testes paramétricos

o Usa a estatística rs que se localiza num intervalo entre -1 e +1.

54Correlação

Coeficiente ró de Spearman, rCoeficiente ró de Spearman, rssProcedimento para usar o coeficiente ró de

Spearman1. Estabeleça a hipótese nula, i.e., “Não existe relação entre os dois

conjuntos de dados.”

2. Ordene ambos os conjuntos de dados atribuindo ao resultado mais baixo a ordem 1 e assim consecutivamente (Faça a ordenação em separado para cada variável e tenha em conta os empates).

3. Subtraia os dois conjuntos de ordens para obter a diferença d.

4. Calcule o quadrado dos valores de d.

5. Adicione o quadrado dos valores de d para obter o sigma d2.

6. Use a fórmula rs = 1-(6*Sigma d2/n3-n) onde n é o número de ordens do seu problema.

Page 28: Correlacao

28

55Correlação

Coeficiente ró de Spearman, rCoeficiente ró de Spearman, rssConsidere o seguinte problema, extraído de Green & Oliveira (1989,

p.190), acerca da avaliação da participação das crianças em jogos no

recreio (X) e frequência de constipações (Y).

SujeitoSujeito XX YY Ordem 1Ordem 1 Ordem 2Ordem 2 dd dd22

11 55 22 55 3.53.5 1.51.5 2.252.25

22 33 22 2.52.5 3.53.5 --11 11

33 77 44 77 7.57.5 --0.50.5 0.250.25

44 1010 55 11.511.5 1111 0.50.5 0.250.25

55 99 44 9.59.5 7.57.5 33 44

66 99 55 9.59.5 1111 --1.51.5 2.252.25

77 22 44 11 7.57.5 --6.56.5 42.2542.25

88 66 33 66 55 11 11

99 33 11 2.52.5 1.51.5 11 11

1010 44 11 44 1.51.5 2.52.5 6.256.25

1111 88 44 88 7.57.5 0.50.5 0.250.25

1212 1010 55 11.511.5 1111 0.50.5 0.250.25

56Correlação

Coeficiente ró de Spearman, rCoeficiente ró de Spearman, rss

79.01716

6161

61

3

2

=×−=−

−= ∑nn

drs

Page 29: Correlacao

29

57Correlação

Coeficiente ró de Spearman, rCoeficiente ró de Spearman, rss