Análise de Associação: Análise de Associação: Tabelas de contingênciaTabelas de contingência
Curso de Especialização em Pesquisa Clínica - Curso de Especialização em Pesquisa Clínica - FCMSCSPFCMSCSP
MÓDULO 3 – EPIDEMIOLOGIA E BIOESTATÍSTICAMÓDULO 3 – EPIDEMIOLOGIA E BIOESTATÍSTICA
Profa. Ting Hui Ching - 2009Profa. Ting Hui Ching - 2009
As etapas de uma pesquisa científicaAs etapas de uma pesquisa científicaxx
EstatísticaEstatística
Planejamento
Execução
AnáliseEstatística
Relatório
•Coleta de dados•Banco de dados
Análise DescritivaInferência
DiscussãoConclusão
Definir 6w•Why (Por que): objetivo•Who (Quem): público alvo•What (O que): desfecho•When (quando): tempo•Where (onde): local•How (como): forma de coleta de dados
Como analisar os dadosQual n para garantir a confiabilidadeComo selecionar a amostra
Protocolo
Relatório e as etapas da pesquisa científica Relatório e as etapas da pesquisa científica
Planejamento
Execução
Análise
Conclusão
Material e Método
Resultados
Discussão
Conclusão
Introdução
VisVisão Globalão Global
População
Amostra
Inferência Estatística(“Adivinhar”)
•Estimação de quantidades desconhecidas•Testes de hipóteses
•Extrapolação dos resultados (modelagem)
Estatística Descritiva(“Fotografia”)
•Consistência dos dados•Caracterização da amostra
•Interpretações iniciais
Planejamento•Como selecionar amostra?
•Qual o tamanho da amostra?
Dados
Análise Descritiva
Teorias Estatísticas
Modelos Probabilísticos
InferênciaEstatística
Fazer afirmação sobre
característica de uma população, baseando-se em
resultados de uma amostra
Exemplos de testes de hipótesesExemplos de testes de hipóteses
Tratamento novo é melhor que o Tratamento novo é melhor que o tratamento tradicionaltratamento tradicional??
Dieta para ganho de peso funciona?Dieta para ganho de peso funciona?
Existe associação entre fumo e câncer de Existe associação entre fumo e câncer de pulmão?pulmão?
H0: novo= tradiconal Ha: novo ≠ tradiconal
H0: Pesoantes= Peso depois Ha: Peso antes ≠ Peso depois
H0: Não existe associação entre fumo e câncer de pulmãoHa: Existe associação entre fumo e câncer de pulmão
As decisõesAs decisões
Decisão(amostra)
H0 Ha
Situação(população)
H0
Ha
DecisãoCorreta
DecisãoCorreta
Erro
Erro
Tipo I ()
Tipo II ()(poder do teste=1-β)
Pela amostra, encontramos “p”, onde p=p-valor=nível descritivo=probabilidade de acontecer H0
Ex: Consumo de cafeína e estado civil das Ex: Consumo de cafeína e estado civil das pacientes em acompanhamento pré-natalpacientes em acompanhamento pré-natal
Consumo de Cafeína (mg/dia)Consumo de Cafeína (mg/dia)
Estado Estado CivilCivil
00 1-1501-150 151-300151-300 >300>300 TotalTotal
CasadaCasada 652652 15371537 598598 242242 20292029
Divorciada/Divorciada/SeparadaSeparada
3636 4646 3838 2121 141141
SolteiraSolteira 218218 327327 106106 6767 718718
TotalTotal 906906 19101910 742742 330330 38883888
Fonte: Martin and Bracken, 1987
O consumo de cafeína é diferente entre os diferentes estados civis?
Ex: Consumo de cafeína e estado civil das Ex: Consumo de cafeína e estado civil das pacientes em acompanhamento pré-natalpacientes em acompanhamento pré-natal
Consumo de Cafeína (mg/dia)Consumo de Cafeína (mg/dia)
Estado Estado CivilCivil
00 1-1501-150 151-300151-300 >300>300 TotalTotal
CasadaCasada 22%22% 51%51% 20%20% 8%8% 3029(100%)3029(100%)
Divorciada/Divorciada/SeparadaSeparada
26%26% 33%33% 27%27% 15%15% 141(100%)141(100%)
SolteiraSolteira 30%30% 46%46% 15%15% 9%9% 718(100%)718(100%)
TotalTotal 23%23% 49%49% 19%19% 8%8% 3888(100%)3888(100%)
Fonte: Martin and Bracken, 1987
O consumo de cafeína é diferente entre os diferentes estados civis?
Tabela de Frequência - SexoTabela de Frequência - Sexo
Distribuição de pacientes por sexo obtidos de um estudo clínico*
Sexo N %F 33 18,3%M 147 81,7%
Total 180 100,0%*Dados hipotéticos
Tabela de Frequência - Tabela de Frequência - HipertensãoHipertensão
HAS N %SIM 50 27,8%NÃO 130 72,2%Total 180 100,0%
Distribuição de pacientes portadores de hipertensão obtidos de um estudo
clínico*
*Dados hipotéticos
Estudar a associação entre Sexo e Estudar a associação entre Sexo e Hipertensão – Tabela de contingênciaHipertensão – Tabela de contingência
Sim NãoF 20 13 33M 30 117 147
Total 50 130 180
Sexo HAS Total
Variável desfecho: Doença
Exposição: Fator de risco
Existe associação entre Sexo e Hipertensão ?
Estudo de AssociaçãoEstudo de Associação
PREVISÃO
• Duas variáveis qualitativas: Tabela de contingência• Duas variáveis quantitativas: Correlação
Tabela de contingência – % GeralTabela de contingência – % Geral
Sim NãoF 20 13 33M 30 117 147
Total 50 130 180
Sexo HAS Total
Sim NãoF 11,1% 7,2% 18,3%M 16,7% 65,0% 81,7%
Total 27,8% 72,2% 100,0%
HAS TotalSexo
Frequentemente utilizada em Estudo transversal
Tabela de contingência – % em Doença Tabela de contingência – % em Doença (Coluna)(Coluna)
Sim NãoF 40,0% 10,0% 18,3%M 60,0% 90,0% 81,7%
Total 100,0% 100,0% 100,0%
TotalSexo HAS
Sim NãoF 20 13 33M 30 117 147
Total 50 130 180
Sexo HAS Total
Distribuição por sexo nas duas sub-populações são iguais?(Frequentemente utilizada em Estudo de Caso-controle)
Tabela de contingência – % em Fator Tabela de contingência – % em Fator (Linha)(Linha)
Sim NãoF 20 13 33M 30 117 147
Total 50 130 180
Sexo HAS Total
Sim NãoF 60,6% 39,4% 100,0%M 20,4% 79,6% 100,0%
Total 27,8% 72,2% 100,0%
Sexo HAS Total
Risco de Pop Feminina > Risco de Pop Masculina?Diferença de % significante?
Dimensão de Tabela de Contingência – Dimensão de Tabela de Contingência – exemplo 1exemplo 1
Sim NãoF 20 13 33M 30 117 147
Total 50 130 180
Sexo HAS Total
2 linhas2 colunas Tabela 2 x 2
Dimensão de Tabela de Contingência – Dimensão de Tabela de Contingência – exemplo 2exemplo 2
Estudar a associação entre Hábito de Fumar (Fumo) e Hipertensão (HAS)
Sim NãoSim 14 19 33
Ex-fumante 3 1 4Não 33 110 143Total 50 130 180
Fumo HAS Total
Tabela de contingência
3 linhas2 colunas Tabela 3 x 2
Exposição: Fator de risco
Teste de HipótesesTeste de Hipóteses
Pergunta: Existe associação entre Sexo e Pergunta: Existe associação entre Sexo e Hipertensão?Hipertensão?
Pergunta: Ser homem ou mulher terá Pergunta: Ser homem ou mulher terá chance diferente de ter hipertensão?chance diferente de ter hipertensão?
Hipótese nula(H0): Sexo e HAS são independentes(Não existe associação )
Hipótese alternativa(Ha): Sexo e HAS não são independentes(Existe associação)
As decisõesAs decisões
Decisão(amostra)
H0 é verdadeira(não existe associação)
H0 é falso(existe
associação)
Situação(população)
H0 é verdadeira
H0 é falso
DecisãoCorreta
DecisãoCorreta
Erro
Erro
Tipo I ()
Tipo II ()(poder do teste=1-β)
Como verificar a hipótese da existência de Como verificar a hipótese da existência de associação entre Fator em estudo e Doença?associação entre Fator em estudo e Doença?
Comparação entre Valor Observado e Valor esperado
Sim NãoF 20 13 33M 30 117 147
Total 50 130 180
Sexo HAS TotalSim Não
F 20 13 33M 30 117 147
Total 50 130 180
Sexo HAS Total
Observado Esperado
E11E12
E21 E22
Como verificar a hipótese da existência de Como verificar a hipótese da existência de associação entre Fator em estudo e Doença?associação entre Fator em estudo e Doença?
Observado
Esperado
Sim NãoF 60,6% 39,4% 100,0%M 20,4% 79,6% 100,0%
Total 27,8% 72,2% 100,0%
Sexo HAS TotalSim NãoF 20 13 33M 30 117 147
Total 50 130 180
Sexo HAS Total
Observado
(a)(c)
(b)(d)
E(a)=27,8% * 33 =E(b)=72,2% * 33E(c )=27,8% * 147E(d)=72,2%*147
(a+c)n (a+b) = 50 x 33
180
Teste de Qui-QuadradoTeste de Qui-Quadrado
Observado – Esperado
2obs= (Oij – Eij)2
Eij
( ) 2
Esperado
Critério de DecisãoCritério de Decisão
0 H0
Ha
2obs 2
obs2obs
2crítico
Não rejeito H0 Rejeito H0
Observado – Esperado( ) 2
Esperado
Se observado = esperado 2obs pórximo de 0 H0 verdadeiro
Se observado <> esperado 2obs longe de 0 Ha verdadeiro
Como selecionar valor crítico (Como selecionar valor crítico (22críticocrítico))??
Grau de liberdade = (#linha-1) (#coluna-1)
0
: Nível de significância
2crítico
H0
Distribuição de Qui-Quadrado
H0 Ha
D0
Da
DecisãoCorreta
DecisãoCorreta
Erro II
Erro I()
p-valor: nível descritivo
2crítico = 2 (Grau de liberdade; )
= Nível de significância
ExemploExemplo
Sim NãoF 20 13 33M 30 117 147
Total 50 130 180
Sexo HAS Total
(a+c)(a+b) na =
(a+c)(c+d) nc =
(b+d)(c+d) nd =
=(50)(33)
180= 9
(b+d)(a+b) nb = =
(130)(33)180
= 24
=(50)(147)
180= 41
=(130)(147)
180= 106
Freqüência Observada
Freqüência Esperada
(a)(c)
(b)(d)
Teste de Qui-QuadradoTeste de Qui-Quadrado
Observado (O) Esperado (E) O-E (O-E)2 (O-E)2/E
a = 20 9 b = 13 24 c = 30 41 d = 117 106
Total = 180 180
11 -11 -11 11
0
121121121121
13.5 5.0 3.0 1.1
22.6
2obs = 22.6
Sim NãoF 20 13 33M 30 117 147
Total 50 130 180
Sexo HAS Total
(a) (b)(c) (d)
Casela
11122122
ResultadosResultados
Conclusão: Sexo e HAS não são independentes
Pela tabela, 2crítico = 2
(g.l.; ) = 2 (1;5%) = 3,841
Como 2obs > 2
crítico então rejeitamos H0
2obs = 22.6 Grau de liberdade=(2-1)x (2-1)=1
Tomar decisão por nível descritivo (p):
2obs = 22.6 Grau de liberdade=1 P=1,99485E-06
Como p < 0,05 então rejeitamos H0
Tomar decisão por Valor crítico:
Existe associação entre Sexo e HAS
Vamos praticarVamos praticar??
ExerExercícioscícios
ComentáriosComentários
• Teste Exato de Fisher
Sim NãoSim 14 19 33Não 36 111 147Total 50 130 180
Fumo HAS TotalSim Não
Sim 9 24 33Não 41 106 147Total 50 130 180
Fumo HAS Total
Sim NãoSim 14 19 33
Ex-fumante 3 1 4Não 33 110 143Total 50 130 180
Fumo HAS Total Sim NãoSim 9 24 33
Ex-fumante 1 3 4Não 40 103 143Total 50 130 180
Fumo HAS Total
Freqüência Observada Freqüência Esperada
• Frequencia esperada: 80% das caselas com FE>5, 100% com FE>1
ComentáriosComentários
• Existência de associação entre as variáveis não implica relação causal entre elas.
• No caso de tabelas com dimensão r x c, se tiver associação significante, pode ser feita comparação 2 a 2.
• Valor de 2 (ou p-valor) não indica a força da associação e sim a evidência sobre H0
Uso de EPIINFOUso de EPIINFO
Demonstração através de exemplosEx 1: Sexo x HASEx 2: Fumo x HAS
Casos particularesCasos particulares• Presença de variável ordinal em uma das categorias: 2 de tendência
Operação cesariana <4 4 4,5 5 5,5 6+ Total
Sim 5 7 6 7 8 10 43Não 17 28 36 41 46 140 308Total 22 35 42 48 54 150 351
• Dados pareados: Teste de McNemar
Sim Não TotalAntes Sim 4 9 13
Não 3 16 19Total 7 25 32
Depois
Uso de computador x EstatísticaUso de computador x Estatística
Boa notícia: Boa notícia: Todo mundo pode fazer Todo mundo pode fazer
análise estatística!!!análise estatística!!!FacilidadeFacilidadeRapidezRapidezSegurançaSegurança
Problema:Problema:Todo mundo pode fazer Todo mundo pode fazer
análise estatística!análise estatística!??Utilização de técnicas Utilização de técnicas inadequadasinadequadasInterpretação errada Interpretação errada dos resultadosdos resultados
Solução: Compreensão dos conceitos básicos da estatística, bem como as suposições necessárias para o seu uso de forma criteriosa
Relação Pesquisador x Estatístico
Dependência Independência
• Utilize como consultório e não Pronto-socorro• Diálogo contínuo com estatístico em todas etapas da pesquisa• Dê feedback aos estatísticos
Papel de professor
Interdependência
Trabalho de equipe
Lembrete Lembrete A literatura médica: Check-list A literatura médica: Check-list
para ler e escrever um artigo na para ler e escrever um artigo na área médicaárea médica
ReferênciasReferências
Estatística Básica. Morettin, P. A. e Bussab, W. O. Editora Atual
Noções de Probabilidade e Estatística. Magalhães, M.N. e Lima, A.C.P. EDUSP
Practical Statistics for Medical Research. Altman, D.G. Chapman and Hall