sebenta de estatística clínica

30
 Página 1 de 29 Mestrado em Nutrição Clínica  semestre 2011/2012 Cadeira:  Estatística Clínica Tânia Carreira Aula 1 Introdução à Estatística e ao SPSS  Infos: - site: http://sites.google.com/site/ecmnc5/  - mail:  [email protected]  Conceitos Comparação: comparar sujeitos (e não variáveis) com base num ou mais critérios. Pode ser feito com um grupo, comparando valores do grupo com valores de referência.  Associação: associar variáveis e não sujeitos. Em estatística, um grupo ser grande ou não depende do teste:  T-student: se a amostra tem mais de 30 elementos é grande, devendo ser simétrica.  Se a amostra é pequena, esta tem de ter distribuição normal: se sim, usamos t-student; se não ou transformamos os dados para t- student ou utilizamos testes não paramétricos. Hipótese estatística:  Ho: hipótese nula, sob a qual aplicamos o teste  HÁ: hipótese alternativa Podemos rejeitar ou não rejeitar Ho. Se rejeitarmos, não significa que Ho é falso, mas sim que com os dados que temos rejeitamos Ho. Nível de significância:  Do teste: α=0,05  Do resultado do teste: P(|teste|› resultado)  p-value

Upload: tania-carreira

Post on 19-Jul-2015

293 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Sebenta de Estatística Clínica

5/17/2018 Sebenta de Estatística Clínica - slidepdf.com

http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 1/29

 

Página 1 de 29 

Mestrado em Nutrição Clínica 1º semestre 2011/2012

Cadeira: Estatística Clínica 

Tânia Carreira

Aula 1 – Introdução à Estatística e ao SPSS Infos:- site: http://sites.google.com/site/ecmnc5/ - mail: [email protected] 

Conceitos

Comparação: comparar sujeitos (e não variáveis) com base num oumais critérios. Pode ser feito com um grupo, comparando valores dogrupo com valores de referência.

≠ 

Associação: associar variáveis e não sujeitos.

Em estatística, um grupo ser grande ou não depende do teste:  T-student: se a amostra tem mais de 30 elementos é grande,

devendo ser simétrica.  Se a amostra é pequena, esta tem de ter distribuição normal: se

sim, usamos t-student; se não ou transformamos os dados para t-student ou utilizamos testes não paramétricos.

Hipótese estatística:  Ho: hipótese nula, sob a qual aplicamos o teste  HÁ: hipótese alternativa

Podemos rejeitar ou não rejeitar Ho. Se rejeitarmos, não significa que Hoé falso, mas sim que com os dados que temos rejeitamos Ho.

Nível de significância:  Do teste: α=0,05   Do resultado do teste: P(|teste|› resultado) p-value

Page 2: Sebenta de Estatística Clínica

5/17/2018 Sebenta de Estatística Clínica - slidepdf.com

http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 2/29

 

Página 2 de 29 

Testes

1.  Testes à normalidade da amostra

Teste de Kolmogorov-Smirnov

  Ho: X tem distribuição normal  HA: X não tem distribuição normal  Estatística de teste: D

Este teste aplica-se melhor em populações grandes, não podendo ser utilizado em populações com menos de 200 elementos. Além disso,para se utilizar este teste é necessário saber-se a variância exacta dapopulação.

Teste de Shapiro-Wilk

  Ho: X tem distribuição normal  HA: X não tem distribuição normal  Estatística de teste: W

Rejeita-se Ho se p-value ≤ 0,05. É um teste muito potente mesmo emamostras pequenas.

 2.  Teste de homogeneidade de variâncias

Teste de Levene

  Ho: as variâncias são todas iguais  HA: pelo menos duas variâncias são diferentes  Estatística de teste, sob Ho: W ~ F(k-1, N-k ) 

Page 3: Sebenta de Estatística Clínica

5/17/2018 Sebenta de Estatística Clínica - slidepdf.com

http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 3/29

 

Página 3 de 29 

Introdução ao SPSS

 Abrir o ficheiro “health_I”.

Para sabermos características como média e mediana, tomamos oseguinte caminho:

Analyze descriptive statistics frequencies escolhemos a variável statistics escolhemos as características que queremos.

Para a pressão sistólica, obtemos, na janela de Output:

Kurtosis: Curtose – achatamento dos dadosSkewness: coeficiente de assimetria  –  como é que os dados sedistribuem em torno de uma medida central.

Através do coeficiente de assimetria, como saber se os dados sãoassimétricos?S= 1,451

εS= 0,269

Para saber a simetria, calcula-se S/ εS : Se o valor inteiro for maior que 2,a distribuição dos dados é assimétrica, se for menor ou igual a 2 a

distribuição é simétrica.

 

Statistics 

Systolic blood pressure (mmHg)

NValid 80

Missing 0

Mean 114,85

Median 113,00

Mode 110a 

Std. Deviation 14,671

Variance 215,243

Skewness 1,451

Std. Error of Skewness ,269

Kurtosis 4,786

Std. Error of Kurtosis ,532

Minimum 89

Maximum 181

Percentiles

25 107,00

50 113,00

75 124,00

Page 4: Sebenta de Estatística Clínica

5/17/2018 Sebenta de Estatística Clínica - slidepdf.com

http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 4/29

 

Página 4 de 29 

Em termos de curtose, temos:K= 4,786

εK= 0,532

Calcula-se K/  εK : se o valor inteiro for maior que 2, a distribuição éleptocúrtica, se for menor ou igual a 2 a distribuição é mesocúrtica.

Para uma distribuição ser normal, tem de ser simétrica e mesocúrtica.Basta falhar um destes critérios para que a distribuição não seja normal.Estes dois “testes” serem menor que 2 não garante a normalidade, massão um forte argumento a favor.

Testes à normalidade

Por defeito, quando pedimos um teste à normalidade, o SPSS aplica osdois, cabe ao utilizador escolher o que melhor se adequa aos seusdados.Para pedir o teste:

Analyze descriptive statistics explore escolhemos a variável paraa “Dependent List”   colocamos a bolinha no “Plots” (em baixo)  clicamos no botão “Plots” (ao lado)   seleccionamos apenas “None”para os Boxplots e “Normality plots with test”, tudo o resto desmarcamos. continue OK.

O resultado, para a pressão sistólica, é este:

Tests of Normality 

Kolmogorov-Smirnova

Shapiro-Wilk

Statistic df Sig. Statistic df Sig.

Systolic blood pressure

(mmHg)

,106 80 ,026 ,907 80 ,000

Como a amostra não tem mais de 200 indivíduos, escolhemos o teste deShapiro-Wilk. Para sabermos o valor exacto de Sig.: duplo clique emcima da tabela, para activar e depois duplo clique na célula do valor.Neste caso, o valor aproximadamente é 2.38 E-5. Isto é o p-value ecomo é menor que 0,05 rejeitamos Ho, ou seja, admitimos que adistribuição dos dados não é normal.

Page 5: Sebenta de Estatística Clínica

5/17/2018 Sebenta de Estatística Clínica - slidepdf.com

http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 5/29

 

Página 5 de 29 

Caixa com bigodes

Para fazer uma caixa com bigodes, o caminho é:

Analyze descriptive statistics explore escolhemos a variável para

a “Dependent List”   colocamos a bolinha no “Plots” (em baixo)  clicamos no botão “Plots” (ao lado) escolhemos a opção“dependentes together” na parte do boxplot e desmarcamos todas asoutras continue OK

O resultado é:

As bolinhas com os números são outliers ligeiros, enquanto que a estrelaé um outlier severo ou grave. Para retirarmos os outliers (em casos emque se possa fazer isso), como o exemplo do 55:

Data select cases marcamos "If condition is satisfied” e clicamosem “If” seleccionamos a variável em causa   no “function group”

marcamos “all” e em baixo seleccionamos “$Casenum” e clicamos nasetinha ao lado escrevemos o resto até ficar “$Casenum~=55” 

Se quisermos retirar mais do que um outlier fazemos o mesmoprocedimento, mas no fim ficará: “$Casenum~=55 & $Casenum~=62” 

Para ver a caixa-com-bigodes sem o outlier basta, depois deste

processo, voltar a fazer o gráfico. Sem os dois outliers, a caixa-com-bigodes fica assim:

Page 6: Sebenta de Estatística Clínica

5/17/2018 Sebenta de Estatística Clínica - slidepdf.com

http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 6/29

 

Página 6 de 29 

O perigo de se retirar os outliers, é que em alguns casos os outliers nãosão observações erróneas, mas sim observações naturais da populaçãoe que, ao retirarmos, podemos estar a diminuir o nível de significânciados resultados.Assim, se fizermos de novo o teste à normalidade, obtemos:

Tests of Normality 

Kolmogorov-Smirnova

Shapiro-Wilk

Statistic df Sig. Statistic df Sig.

Systolic blood pressure

(mmHg)

,070 78 ,200*

,981 78 ,288

O p-value é agora bem diferente daquele que se obteve com todos osindivíduos da amosta, e neste caso, como é maior que 0.05 nãorejeitaríamos Ho. Assim, para se retirar um outlier é preciso saber se esteé mesmo fruto de um erro ou não.

Page 7: Sebenta de Estatística Clínica

5/17/2018 Sebenta de Estatística Clínica - slidepdf.com

http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 7/29

 

Página 7 de 29 

Mesmo retirando apenas o 55, aproximamo-nos perigosamente do limite0,05:

Tests of Normality 

Kolmogorov-Smirnova

Shapiro-Wilk

Statistic df Sig. Statistic df Sig.

Systolic blood pressure

(mmHg)

,083 79 ,200*

,967 79 ,037

Aula 2 – Teste de Levene, Teste T-student

Continuando com o ficheiro “health_I” e com os testes à normalidade,podemos ter uma ideia a partir de gráficos. Para isso:

Analyse descriptive statistics P-P plots escolhe-se a variável e o tipo

de distribuição OK.

O que obtemos para a pressão sistólica é:

Page 8: Sebenta de Estatística Clínica

5/17/2018 Sebenta de Estatística Clínica - slidepdf.com

http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 8/29

 

Página 8 de 29 

Como os pontos não se situam na linha, desconfiamos que não se trata deuma distribuição normal.

Testes à normalidade separando por sexo

Para que o programa faça o teste à normalidade relativamente aosdados da pressão arterial sistólica para homens e para mulheres emseparado, tem de primeiro indicar-se que queremos separar os dadosdessa forma. Para isso:

Data split file   marcar “organize output by groups” escolher avariável (“sex” neste caso) 

Após este passo concluído procede-se à realização do teste ànormalidade como anteriormente.

Para desactivar: Data split file   marcar “analyse all cases, do notcreat groups” OK

Atenção: após activar o split file tudo o que se fizer daí em diantefica com split file até cancelarmos essa indicação.

Uma forma alternativa é:Analyse descriptive statistics explore seleccionar a variável (“sex”neste caso) para a “Factor list” seleccionar os dados a analisar para“dependente list” (neste caso “Systolic…”)  seleccionar “plots” embaixo e clicar no botão “plots” em cima normality plots with tests ok  

Teste de Levene

O teste de Levene utiliza-se para aferir sobre a homogeneidade dasvariâncias da amostra. Para lançar o teste o teste de Levene por sexos,para a pressão sistólica:

H0: a variância é homogénea entre os sexos.H1: a variância não é homogénea entre os sexos.

Analyse descriptive statistics explore marcar “Plots” escolher avariável cuja homogeneidade de variências se quer testar para“Dependent list” coloca-se a variável sex para “factor list” Plot  em “spread vs level with levene test” marcar “untransformed” Ok 

Page 9: Sebenta de Estatística Clínica

5/17/2018 Sebenta de Estatística Clínica - slidepdf.com

http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 9/29

 

Página 9 de 29 

O teste mais potente é o “Based on Mean”.Obtem-se:

Uma vez que sig > 0,05 não se rejeita a hipótese nula a variância éhomogénea entre sexos.

Teste de T-student

O teste de t-student baseia-se na comparação de médias. Para isso,tem de se cumprir alguns pressupostos:

  Normalidade das amostras.  Homogeneidade de variâncias entre os grupos.

No caso do teste T, que se utiliza quando não se conhece a variância,se a amosta for menor que trinta elementos, a distribuição tem de ser 

normal; se a amostra for menor for igual ao maior que trinta elementos adistribuição tem de ser, no mínimo, simétrica (com assimetria é muitoarriscado usar o teste T).O teste aplicado deve de ser sempre bilateral, que aliás é o único que oSPSS oferece.

Exemplo 1

Suponha que nos EUA, na população feminina, a pressão arterial média

é 130.7 mmHg.

Para comparar o grupo do sexo feminino do nosso ficheiro com estedado, procedemos da seguinte forma:

H0: μ=130,7 mmHgH1: μ≠130,7 mmHg 

Page 10: Sebenta de Estatística Clínica

5/17/2018 Sebenta de Estatística Clínica - slidepdf.com

http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 10/29

 

Página 10 de 29 

Escolher só o sexo feminino:Data select cases if “sex= código”* *o código é atribuido pelo utilizador previamente, neste caso, 1 paramasculino e 0 para feminino.

Para lançar o teste de T-student:

Analyse Compare Means One-sample T-test seleccionar variávela testar  indicar o “test value” (μo) Ok 

Obtém-se:

Como sig < 0,05 rejeitamos H0.

Se existirem outliers, devemos repetir o teste T mas excluindo os outliers.Se a conclusão é igual, rejeitamos H0, se a conclusão for diferente

devemos de indicar isso no relatório.

Teste T-student entre médias

Para exemplificar este teste, vamos testar a diferença do BMI entrehomens e mulheres.Neste caso:H0: μ0 = μ1 ; H1: μ0 ≠ μ1

1.  Testar a normalidade das amostras:  Masculino: normal  Feminino: não normal

2.  Ver a simetria para a amostra não normal:  Não é simétrico

3.  Retirar o outlier (22) e ver a simetria:  Sk/εk = 2,30 é perto de 2, aceita-se

4.  Aplicar o teste T sem o outlier e depois com o outlier. Para isso:

Page 11: Sebenta de Estatística Clínica

5/17/2018 Sebenta de Estatística Clínica - slidepdf.com

http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 11/29

 

Página 11 de 29 

Analyse compare means independent samples T test  coloca-se BMI em “test variables” e sex em “grouping variables” colocar os códigos Ok 

Como assinalado a verde, o SPSS lança também o teste de Levene.Como se pode ver, como sig < 0,02 rejeita-se a hipótese nula do teste, o

que leva à conclusão que não há homogeneidade de variância.Tendo em conta o que o teste de Levene nos indica, devemos guiar-nospela linha de baixo (“equal variances not assumed”). Assim, comosig > 0,05 não rejeitamos a hipótese nula.

 Abrir o ficheiro “SysBP” 

Podemos querer medir a pressão sistólica em diferentes situações, masnos mesmos sujeitos. Nesse caso, diz-se que estamos perante amostras

emparelhadas.Como proceder?H0: não há diferenças entre a média de pressão sistólica antes e depoisdo exercício.H1: há diferença entre a média de pressão sistólica antes e depois doexercício.

1.  Ver a normalidade: tudo igual ao que já foi feito masseleccionamos duas variáveis para “dependente list”. 

  Ambas são normais (PréExercise No Stress e PosExercise Nostress)

2.  Aplicar o teste T:  Analyse compare means paired-sample T test  

selecionar as duas variáveis (que ficam lado a lado no “Pair 1”) 

Page 12: Sebenta de Estatística Clínica

5/17/2018 Sebenta de Estatística Clínica - slidepdf.com

http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 12/29

 

Página 12 de 29 

Obtemos:

Como sig > 0,05 não se rejeita H0.

Aula 3 – ANOVA paramétrica e não paramétrica

ANOVA

A ANOVA utiliza-se para comparar médias quando temos três ou maisgrupos.Condições:

  A distribuição tem de ser normal em todos os grupos.  As variâncias têm de ser homogéneas

Mas:- se não houver normalidade, o teste pode prosseguir desde que nãoexista um grande enviesamento.

- se as variâncias não forem homogéneas, o teste pode prosseguir se ascomposições dos grupos forem semelhantes. Regra: não pode haver grupos com discrepância de membros maior que 50%. Se houver omesmo número de indivíduos nos grupos, melhor.

No caso da ANOVA:H0: a média é igual em todos os grupos.H1: pelo menos dois grupos têm média diferente.

No caso de se rejeitar a hipótese nula fazem-se testes à posteriori. Senão se rejeitar nunca se deve fazer esses testes, pois podem colocar-nosem dúvida. Em caso disso, confiar sempre na ANOVA.

Para exemplificar a ANOVA abrir o ficheiro “FEF” 

Será que o hábito tabágico influencia a FEF?

Analyse

compare means

One way ANOVA

colocamos os gruposna “factor list” colocamos a variável para “dependente list” Ok 

Page 13: Sebenta de Estatística Clínica

5/17/2018 Sebenta de Estatística Clínica - slidepdf.com

http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 13/29

 

Página 13 de 29 

Como sig < 0,05 rejeitamos H0.Então fazemos testes Post-Hoc para saber quais os grupos diferentes:

Analyse compare means One way ANOVA  clicar em “Post-Hoc”

escolher LSD ou Tukey (o melhor).

No quadro lançado, quando comparamos, sabemos que há diferençase sig < 0,05.

Nota: para comparar não fumadores com todo o tipo de fumadorestemos de colocar na janela:

  Fumadores: 5  Nos restantes grupos: -1

Se fosse fumadores passivos com o resto:  -1  5  -1  … 

ANOVA não paramétrica

Em testes não paramétricos não se fala em médias. O conceito é

comparar se os dados foram retirados da mesma população ou não.Assim:H0: os dados foram extraídos da mesma população.H1: os dados foram extraídos de populações diferentes.A medida de tendência mais adequada no caso deste tipo de testes éa mediana.

Para lançar a ANOVA não paramétrica:

Analyse Non-parametric tests legacy dialogs k-independentsamples  colocamos a variável em “test variable list” e os grupos em“group list” definimos o mínimo e o máximo Ok 

Com assimptota sig < 0,05 rejeitamos H0

Neste caso não há testes Post-Hoc para saber entre que grupos é adiferença. Só se consegue saber, comparando através de testes não

paramétricos semelhantes ao T-student.

Page 14: Sebenta de Estatística Clínica

5/17/2018 Sebenta de Estatística Clínica - slidepdf.com

http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 14/29

 

Página 14 de 29 

Teste de Mann-Witney

Analyse non-parametric tests legacy dialogs 2 independentsamples

Para corrigir o α : 

α*= 0,05/ nº gruposC2 correcção de Bonferroni

Se sig < α* rejeita-se H0.

Aula 4 – Regressão Linear 

A regressão linear prova que existe uma associação, mas não provaque há causalidade!Na regressão linear, a ANOVA serve para saber se existe um factor preditivo, no entanto não diz qual.H0: nenhum factor é preditivoH1: pelo menos um factor é preditivoRejeita-se H0 quando sig < 0,05

Teste de Durbin-Watson

Testa a correlação entre resíduos sucessivos.H0: os resíduos não são independentes entre si.H1: os resíduos são independentes entre si.Não se rejeita H0 se d ≈ 2 ± 0,2

Multicolinearidade

Calcula-se o ViF de cada dado. Se ViF < 5 mantemos, se ViF > 5retiramos o dado.

Utilizamos o ficheiro “HeartData.sav” 

Relação entre idade, sexo, BMI e cigarros/dia com Sys BP  –  qual é apercentagem de variância que o modelo explica?

Analyse

regression

Linear 

 colocamos SysBP em “dependent” ecoloca-se sex, age, BMI, CIGPDAY e BPMed em “independents” 

Page 15: Sebenta de Estatística Clínica

5/17/2018 Sebenta de Estatística Clínica - slidepdf.com

http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 15/29

 

Página 15 de 29 

R – coeficiente de correlação múltiplaR square – coeficiente de determinação

Uma vez que R2aj é pequeno, o modelo não é explicativo. Para tal, oR2aj ≥ 0,8 no mínimo.

Quando a ANOVA indica que existe pelo menos um que é preditivo,qual é o mais significativo? O que apresentar um β maior.

Se todas as outras variáveis estiverem iguais então as mulheres tem maisSysBP. Como sabemos? B = 2,887 é uma relação positiva, se o sinalfosse negativo, então SysBP diminuía.

MASTem de se verificar os pressupostos:

Page 16: Sebenta de Estatística Clínica

5/17/2018 Sebenta de Estatística Clínica - slidepdf.com

http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 16/29

 

Página 16 de 29 

Analyse regression linear  statistics  marcar “Durbin-Watson” e“colinearity diagnostics” continue plots   marcar “Normalprobability plot” coloca-se “ADJPRED” em X e “SDRESID” em Y  continue Ok.

Uma vez que Leverage < 2 não se remove nenhum dado: não háoutliers.

Para ver qual o melhor modelo:

Analyse regression linear  coloca-se todas as variáveis em

“dependent” excepto SysBP e RAD.

Aula 5 – Tabelas de Contingência e Teste de Qui-

Quadrado

Tabelas de Contingência 2x2

Diabético Não diabético Total

Obeso a b a + bNão-obeso c d c + d

Total a + c b + d a + b + c + d

Para se fazer o qui-quadrado tem de se verificar os pressupostosprimeiro:

  N > 20  Todos os Eij > 1

  Pelo menos 80% dos Eij ≥ 5Se estes pressupostos forem violados tem de se recorrer ao teste exactode Fisher.

Quando as tabelas são 2x2 tem de se fazer a correcção decontinuidade: -0,5 em cada numerador 

Utilizar o ficheiro Heartdata.sav

Page 17: Sebenta de Estatística Clínica

5/17/2018 Sebenta de Estatística Clínica - slidepdf.com

http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 17/29

 

Página 17 de 29 

Analyse descriptive statistics crosstabs coloca-se sex em “rows” ediabetes em “colums” statistics  marcar “chi-square continue  Ok 

Se quisermos refinar a tabela vamos a “cells” 

Na linha de “Pearson Chi-Square”: - Value: 1,222- Assymp. Sig: 0,269 com correcção, Assymo. Sig: 0,311 não serejeita H0 pois Assymp. Sig > 0,05- Se existirem violações: usar a linha “Fisher’s exact test” neste caso,exactSig(2-sided) = 0,307 e por isso não se rejeita H0.

Se sig do resultado > sig do teste

não se rejeita H0.

Page 18: Sebenta de Estatística Clínica

5/17/2018 Sebenta de Estatística Clínica - slidepdf.com

http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 18/29

 

Página 18 de 29 

E se quiser comparar diabetes com BMI?O BMI é uma variável contínua, por isso tem de se transformar emvariável nominal.

BMI_code:  1 (baixo peso ≤ 18)   2 (peso normal < 18 ≤ 25)   3 (obeso > 25)

Transform compute variable target variable: BMI_code numérica

expression: (BMI<=18)*1+(BMI>18&BMI≤25)*2+(BMI>25)*3 

E agora atribui-se o código:

Variable view  seleccionar a célula “value” do BMI_code clicar nasreticências   value: 1, label: baixo peso e clicar “add” voltar para“data view” view marcar “value labels” 

Page 19: Sebenta de Estatística Clínica

5/17/2018 Sebenta de Estatística Clínica - slidepdf.com

http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 19/29

 

Página 19 de 29 

Temos uma tabela 3x2 3 tabelas 2x2 sig = α/3 = 0,05/3 

Data select cases “if condition is satisfied” BMI_code~= 1 Ok 

Agora pede-se o crosstabs

Com baixo peso e obeso:p>0,05 não rejeitamos H0, logo não há prevalência de diabetes em

indivíduos de baixo peso e indivíduos obesos não existem diferençassignificativas na prevalência de diabetes destes dois grupos.

Peso normal/obesos:Obeso com diabetes: 3,6%Normal com diabetes: 1,6%Os obesos têm mais do dobro de percentagem de prevalência dediabetes.

Aula 6 – Regressão Logística, ANOVA factorial e

MANOVA

Regressão Logística

Objectivo: predizer um de dois estados. Ex.: tem doença/não tem

doença

Page 20: Sebenta de Estatística Clínica

5/17/2018 Sebenta de Estatística Clínica - slidepdf.com

http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 20/29

 

Página 20 de 29 

Terminologia em Regressão Logística

- Probabilidade do evento de interesse: P(Y=1) ‘(ter a doença)’ - Tendência para o evento de interesse (eZ) e logaritmo da tendência

(Z): Z = log(PZ/1-PZ)- Taxa de tendência para evento de interesse, dados Z1 e Z2: OR = eZ1-Z2 

Teste à significância da RL

Testar se pelo menos um dos preditores tem associação com ter adoença.

  Estatística de Teste: G  Qui-quadrado tabela SPSS   “Omnibus testo f model

coefficients”   Se nenhum dos preditores tiver associação, o teste não serve  Queremos rejeitar H0 (H0: nenhuma variável tem associação)  Na tabela queremos valores de p baixos para rejeitar H0.  Depois de sabermos que há pelo menos uma associação: teste à

estatística dos coeficientes teste de Wald. No SPSS tabela“variable in the equations” p > 0,05 conseguimos identificar quais as variáveis que têm associação com a variáveldependente.

Qualidade do Ajustamento

Utiliza-se para saber se o modelo se ajusta bem aos dados.Usa-se o teste de Hosmer-Lemeshow. Quando não se rejeita H0 temosum bom ajustamento, para isso queremos um valor de p elevado, poisquanto maior o p, melhor o modelo.Faz-se gráficos dos resíduos:

1.  Change in deviance (calculada a partir dos resíduosestudantizados, calculando o quadrado sre2) vs. Predictedprobabilities

2.  Cook’s distance vs predicted probabilities 

Regressão logística no SPSS  predizer a probabilidade ter a doençacoronária em função da idade.

Page 21: Sebenta de Estatística Clínica

5/17/2018 Sebenta de Estatística Clínica - slidepdf.com

http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 21/29

 

Página 21 de 29 

Utiliza-se o ficheiro “CHDRL.sav” 

Analyse regression BinaryLogistic Save, marcar  “probabilities”,“cook’s” e “studentized” options, marcar “Hasmer -Lemeshow” 

Block 1:-  1ª tabela: saber se o modelo é significativo – saber se pelo menos

uma variável tem influência sig. sig (ou p) < 0,05 : há pelomenos um preditor com influência rejeita-se H0.

- 3ª tabela: saber se o modelo serve mede a qualidade do modelo.Quanto mais alto o valor de p, melhor o modelo

- 5ª tabela: variar o valor de cut-off altera a percentagem de indivíduosbem ou mal classificados.

São classificados correctamente 74% dos casos. Tem uma sensibilidade

de [29/(12+29)*100] e uma especificidade de [45/(45+14)*100].

Page 22: Sebenta de Estatística Clínica

5/17/2018 Sebenta de Estatística Clínica - slidepdf.com

http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 22/29

 

Página 22 de 29 

E se alterar o cut-off para 0,74?

Curva de ROC

A Curva ROC é um gráfico de sensibilidade (ou taxa de verdadeirospositivos) versus taxa de falsos positivos.

Para lançar a Curva ROC:

Analyse ROC curve em display marcar todas as opções em“Value of state variable” colocar 1 Ok.

Page 23: Sebenta de Estatística Clínica

5/17/2018 Sebenta de Estatística Clínica - slidepdf.com

http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 23/29

 

Página 23 de 29 

Na tabela, vemos a área debaixo da curva. Quanto maior, melhor oteste.

Anova Factorial

ANOVA tow-way: serve para comparar sujeitos entre si com duas

variáveis. Existem três hipóteses estatísticas a testar: duas delas são paraos dois factores e uma é “H0: os factores não interagem”.

Pressupostos:  Distribuição normal em cada uma das células (teste de Shapiro-

wilk ou de Kolmogorov-Smirnov)  Variâncias homogéneas (teste de levene)

Se os pressupostos falharem , mas os grupos tiverem composiçõescomparáveis, pode usar-se ANOVA.

  Se o efeito interactivo não é significativo, interpreta-se os efeitosisolados

  Se o efeito interactivo é significativo, procede-se à comparaçãoplaneada (contrastes)

Primeiro criamos o BMI_code

H01: o factor sex não tem efeito sobre a pressão arterial sistólicaH02: o factor BMI não tem efeito sobre a pressão arterial sistólicaH03: não há interacção entre os dois factores

Divide-se a amostra por sexo (split file), testa-se a normalidade edesactiva-se o split file. Lançamos a ANOVA factorial:

Page 24: Sebenta de Estatística Clínica

5/17/2018 Sebenta de Estatística Clínica - slidepdf.com

http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 24/29

 

Página 24 de 29 

Analyse general linear model univariate em dependent variablecolocamos “Systolic blood pressure” e em fixed factors colocamos “sex” e “BMI_code”  options marcar “homogeneity” e “observed power ”  plots no horizontal axis colocamos “sex” e em separate lines

“BMI_code”  add Continue Ok.

2ª tabela: teste de levene sig < 0,05 falha

3ª tabela:

Sex sig < 0,05 rejeita-se H01BMI_code sig < 0,05 rejeita-se H02Sex*BMI_code sig > 0,05 não se rejeita H03

.Conclusão:

  Sexo tem influência na pressão arterial sistólica  BMI tem influência na pressão arterial sistólica  Os dois factores não têm interacção entre si

Page 25: Sebenta de Estatística Clínica

5/17/2018 Sebenta de Estatística Clínica - slidepdf.com

http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 25/29

 

Página 25 de 29 

MANOVA

Este teste só se utiliza se as variáveis estiverem associadas entre si.As hipóteses são:

- H0: as médias de cada uma das variáveis são todas iguais entre osvários grupos.- H1: há pelo menos uma média diferente

Condições:  Homogeneidade da matriz da variância (covariância)

Vamos comparar homens e mulheres em relação ao colesterol, BMI,pressão sistólica, pressão diastólica.

1º Analisar se é necessário aplicar a MANOVA teste de esfericidade

de Bartlet

Analyse dimension reduction factor  colocar colesterol, BMI,pressão sistólica e pressão diastólica em “variables” e sex em “selectionvariable”, atribuindo o valor 1 descriptives marcar initial solution eKMO.

1ª tabela:

Relativamente ao teste de Bartlet, sig < 0,05 não se rejeita H0

2º Fazer a MANOVA

Analyse general linear model multivariate options marcar “homogeneity test” 

Page 26: Sebenta de Estatística Clínica

5/17/2018 Sebenta de Estatística Clínica - slidepdf.com

http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 26/29

 

Página 26 de 29 

2ª tabela:se o valor de Box’s M é mmaior do que 0,05, háviolação e não se pode

usar Wilks lambda.

3ª tabela:

Como sig < 0,05 rejeita-se H0 há diferenças entre os grupos.

Pressão sistólica: sig < 0,05  rejeitar H0  há diferençasPressão diastólica: sig < 0,05  rejeitar H0  há diferençasColesterol: sig < 0,05  rejeitar H0  há diferençasBMI: sig > 0,05 não rejeitar H0  não há diferenças

Aula 7–ANOVA de medições repetidas

É utilizada para situações em que medimos as mesmas pessoas váriasvezes ou em situações experimentais diferentes. O objectivo é comparar média.

Pressupostos:- normalidade da variável dependente.- esfericidade: teste de Bartlet ou de Mauchly

Page 27: Sebenta de Estatística Clínica

5/17/2018 Sebenta de Estatística Clínica - slidepdf.com

http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 27/29

 

Página 27 de 29 

Utilizamos o ficheiro SysBP

Se não quero saber do sexo, posso utilizar ANOVA de mediçõesrepetidas.

1º testar os pressupostos (para todos os pré)- distribuição é normal porque sig > 0,05

2º testar a esfericidade com o teste de Mauchly e lançar a ANOVA

Analyse general linear model repeated measures nº de níveis(quantos registos?):3 add define escolher todos os “prés” para osfactores options factor para “display means for ”  marcar “compare main effect”  LSDmarcar “observed power ”  Ok.

Porque aparece primeiro o quadro de MANOVA?É muito provável que a esfericidade seja violada e, nesse caso, faz-seMANOVA. “À cautela”, o SPSS oferece também automaticamente aMANOVA.

H0: há esfericidade.

Como sig > 0,05 não se rejeita H0.

Page 28: Sebenta de Estatística Clínica

5/17/2018 Sebenta de Estatística Clínica - slidepdf.com

http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 28/29

 

Página 28 de 29 

No quadro “Tests of Within Subjects-Effects”:

Na linha “sphericity assumed”, sig < 0,05 rejeita-se H0, logo hádiferenças.

Vamos agora analisar os Post-Hoc: Pairwise

Há influência e é devido ao factor 2.

E se quiséssemos fazer para os 6 factores? Fazemos os passos iguais

Teste de Mauchly:

Como sig < 0,05 rejeita-se H0 não há esfericidade.

Page 29: Sebenta de Estatística Clínica

5/17/2018 Sebenta de Estatística Clínica - slidepdf.com

http://slidepdf.com/reader/full/sebenta-de-estatistica-clinica 29/29

 

Página 29 de 29 

Então escolhemos uma das correlações do quadro da MANOVA aque tiver maior potência.

Para fazer o mesmo mas por sexos:

Analyse general linear models repeated measures nº de níveis:3 todos os prés para “within subject variables” e sex para “Betweensubject factor ”  Post-Hoc Tukey continue options marcar 

observed power e homogeneity tests.

No teste de Mauchly, não se rejeita H0 porque sig > 0,05.

Usamos a linha da esfericidade assumida, e temos sig > 0,05 não serejeita H0, logo não há diferenças.

E assim, tem-se este quadro de Post-Hocs, onde podemos comparar osvários factores.