bioestatÍstica · 2018-08-09 · membro da associação brasileira de educação médica (abem)....

420
BIOESTATÍSTICA Aplicada à Pesquisa Experimental BIOESTATISTICA_Vol_01.indb 1 25/06/12 17:11

Upload: others

Post on 19-Jul-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

BIOESTATÍSTICAAplicada à Pesquisa Experimental

BIOESTATISTICA_Vol_01.indb 1 25/06/12 17:11

Page 2: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

BIOESTATISTICA_Vol_01.indb 2 25/06/12 17:11

Page 3: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

M A U R O J O S É F O N T E L L E SDoutor em Cirurgia pela Faculdade de Ciências Médicas da Unicamp

Professor das Disciplinas de Anatomia Humana e Bioestatísca da

Universidade do Estado do Pará (UEPA).

Membro Titular do Colégio Brasileiro de Cirurgiões (TCBC).

Membro da Associação Brasileira de Educação Médica (ABEM).Membro da Associação Brasileira de Médicos Escritores (SOBRAMES).

BIOESTATÍSTICAAplicada à Pesquisa Experimental

VOLUME 1

BIOESTATISTICA_Vol_01.indb 3 25/06/12 17:11

Page 4: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Copyright © 2012 Editora Livraria da Física1a edição

Direção editorial José Roberto Marinho Editor-assistente Victor Pereira Marinho Capa Ana Maria Hitomi/Typodesign Projeto gráfico e diagramação Typodesign

Edição revisada segundo o Novo Acordo Ortográfico da Língua Portuguesa

Dados Internacionais de Catalogação na Publicação (CIP)(Câmara Brasileira do Livro, SP, Brasil)

Fontelles, Mauro JoséBioestatística aplicada à pesquisa experimental: volume 1/

Mauro José Fontelles. – São Paulo: Editora Livraria da Física, 2012.

BibliografiaISBN 978-85-7861-137-8

1. Bioestatística 2. Pesquisa - Experiências I. Título.

12-01763 CDD-570.15195

Índice para catálogo sistemático1. Bioestatística e pesquisa experimental:

Ciências biológicas 570.15195

Todos os direitos reservados. Nenhuma parte desta obra poderá ser reproduzida sejam quais forem os meios empregados sem a permissão da Editora.

Aos infratores aplicam-se as sanções previstas nos artigos 102, 104, 106 e 107 da Lei no 9.610, de 19 de fevereiro de 1998

Editora Livraria da Físicawww.livrariadafisica.com.br

BIOESTATISTICA_Vol_01.indb 4 25/06/12 17:11

Page 5: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

BIOESTATISTICA_Vol_01.indb 5 25/06/12 17:11

Page 6: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

BIOESTATISTICA_Vol_01.indb 6 25/06/12 17:11

Page 7: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

À querida esposa Marilda, companheira inseparável, que

por sua dedicação incondicional à família,

propiciou momentos tranquilos para que esta obra

pudesse ser concluída.

Aos filhos Gustavo e Renata.

Orgulhosos admiradores deste autor.

À minha mãe Celina, coração bondoso a perdoar

os longos períodos de ausência do filho, não por falta

de lembranças, mas escrever é preciso.

BIOESTATISTICA_Vol_01.indb 7 25/06/12 17:11

Page 8: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

BIOESTATISTICA_Vol_01.indb 8 25/06/12 17:11

Page 9: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Prefácio

Quando fui gentilmente convidado para fazer o prefácio deste livro, senti-me pres-

tigiado e contente, mas, conhecendo na sua plenitude o que pretendia a referida obra,

confesso que sofri. Uma vez que sempre enfrentei, de frente, as dificuldades da vida, e,

se era este, um grande desafio, dispus-me a enfrentá-lo.

A história deste livro teve início há muitos anos atrás, quando o Professor Mauro

Fontelles veio até nós, na Universidade Estadual de Campinas, para realizar, sob minha

orientação, suas teses de Mestrado e Doutorado, as quais foram concluídas e defendidas

com raro brilhantismo. Como seu orientador, pude, de perto, acompanhar o interesse e

a necessidade deste Professor em adquirir, em curto prazo, todo o aprendizado relativo

à Bioestatística, o qual era exigido para os seus estudos, nas suas teses. A época, além

de ter demonstrado ser um médico detentor de vasto conhecimento clínico, a par de

suas excelentes qualidades como exímio cirurgião e pesquisador de mão cheia, dedi-

cou-se com muito afinco, adquirindo vasta experiência sobre o assunto, tornando-se,

consequentemente, um especialista na área, o que lhe conferiu uma grande vanta-

gem sobre os estaticistas disponíveis. Com este cabedal, soube muito bem aplicar seus

conhecimentos, quando, então, passou a oferecer uma análise crítica mais apurada

e minuciosa em seus trabalhos de pesquisa. Assim, ao apreciarmos o vasto conteúdo

desta obra, temos a certeza que será de grande valia para estudantes, professores e

pesquisadores, pois, talvez nenhuma outra área do saber tenha expandido tanto seus

horizontes quanto a Bioestatística, a qual tem sido amplamente empregada no campo

da pesquisa e, em decorrência desta grande expansão e do intercâmbio com outras

BIOESTATISTICA_Vol_01.indb 9 25/06/12 17:11

Page 10: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

áreas de conhecimento, vem contribuindo de forma decisiva para tornar a rotina do

pesquisador, através de leitura de livros como este que ora temos a rara oportunidade

de apreciar, um trabalho mais produtivo e interessante.

Desta forma, o valor altamente relevante desta obra é esclarecer dúvidas e apre-

sentar soluções que a pesquisa nos impõe, de modo a abrir um novo caminho que permita

sua aplicação direta em estudos de campo ou laboratoriais, sejam clínicos ou experi-

mentais. Nesta atividade, ocorre um fato notório: quando os trabalhos de pesquisa são

concluídos e, na ânsia de comunicar os seus resultados em congressos ou publicações,

existe sempre a necessidade de divulgar estes achados com uma precisão estatística que

permita avaliações mais acuradas e análises justas dentro da metodologia científica.

Atualmente, em grande parte das publicações, a Bioestatística à disposição é muitas

vezes aplicada por profissional não médico, o que, no entendimento do pesquisador,

torna-a frequentemente confusa ou não expressa a grandeza da avaliação clínica ou

experimental, daí a necessidade de respaldo de algo mais profundo, sendo esta a carac-

terística do livro em questão, o qual, dentro do espírito crítico do autor, passa a oferecer

uma ótica diferente para o entendimento desta importante ferramenta de pesquisa.

Portanto, trata a presente obra, de um livro muito bem planejado e bastante didá-

tico, pois aborda os aspectos da Bioestatística mais utilizados em projetos de pesquisa

na área das Ciências da Saúde. Destarte, um de seus objetivos é fornecer ao pesquisador

iniciante e alunos dos cursos de graduação e pós-graduação, um texto direto e de fácil

compreensão, tornando o aprendizado desta importante ciência uma tarefa mais sim-

ples e de maior aplicação. Assim, o lançamento deste livro é a coroação dos esforços do

autor para a aplicação prática da parte dos interessados pelo tema, sobre o qual tenho

a certeza que alcançará todos os seus objetivos, de modo a contribuir para a formação

dos profissionais dos cursos de graduação e como fonte de complementação de conheci-

mento das áreas da saúde e de outros profissionais de áreas correlatas, sendo, portanto,

motivo de júbilo e muito orgulho para o autor, pois contribui de forma inegável para

todos que se interessam pelo assunto por ele abordado.

A todos e a todas, fica aqui o convite para que a leitura deste livro seja um

estímulo à ação consciente que traduza o conhecimento, em resposta às necessidades

acadêmicas do nosso país.

Dr. Mario Mantovani (in memorian).

Professor Titular do Departamento de Cirurgia da Unicamp.

BIOESTATISTICA_Vol_01.indb 10 25/06/12 17:11

Page 11: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

SUMÁRIO

VOLUME I

INTRODUÇÃO .......................................................................................................... 151. Origem da estatística ............................................................................................ 152. Bioestatística ........................................................................................................ 173. Estrutura do livro ................................................................................................... 19

Parte I - O PLANEJAMENTO DA PESQUISA EXPERIMENTAL ................................. 25

1. As ciências e o conhecimento científico ................................................................. 271.1. As ciências ................................................................................................... 271.2. O conhecimento científico ............................................................................. 31

2. A pesquisa científica ............................................................................................. 372.1. Estrutura da pesquisa ................................................................................... 38

2.1.1 Escolha do tema ................................................................................... 402.1.2 Formulação do problema (questão da pesquisa) .................................... 412.1.3 Revisão da literatura (pesquisa bibliográfica) .......................................... 452.1.4 Justificativa ........................................................................................... 472.1.5 Determinação dos objetivos .................................................................. 482.1.6 Elaboração do projeto de pesquisa ....................................................... 482.1.7 Execução operacional do projeto (coleta de dados) ............................... 492.1.8 Organização do material coletado ......................................................... 502.1.9 Análise e discussão dos resultados ....................................................... 512.1.10 Relatório final e divulgação dos resultados .......................................... 51

2.2. Tipos de pesquisa científica .......................................................................... 522.2.1 Quanto à finalidade ............................................................................... 522.2.2 Quanto à natureza ................................................................................ 542.2.3 Quanto à forma de abordagem ............................................................. 552.2.4 Quanto aos objetivos ............................................................................ 582.2.5 Quanto aos procedimentos técnicos ..................................................... 592.2.6 Quanto ao desenvolvimento no tempo .................................................. 60

BIOESTATISTICA_Vol_01.indb 11 25/06/12 17:11

Page 12: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

3. Delineamento dos estudos de pesquisa ................................................................ 633.1. Classificação dos estudos de pesquisa ......................................................... 633.2. Estudos observacionais ................................................................................ 64

3.2.1. Estudo de caso e série de casos ......................................................... 643.2.2. Estudo de corte transversal ................................................................. 653.2.3. Estudo caso-controle .......................................................................... 703.2.4. Estudo coorte (COHORT) .................................................................... 75

3.3. Estudos experimentais .................................................................................. 853.3.1. Ensaios clínicos controlados ............................................................... 853.3.2. Ensaio clínico não-controlados ............................................................ 99

3.4. Estudos de meta-análise .............................................................................. 993.4.1. Tipos de meta-análise ......................................................................... 1013.4.2. Etapas para a meta-análise ................................................................. 1023.4.3. Métodos estatísticos para a meta-análise ............................................ 1083.4.4 Outras informações importantes ........................................................... 128

4. Tamanho da amostra e randomização ................................................................... 1314.1. Amostragem e recrutamento ........................................................................ 1314.2. Métodos de amostragem .............................................................................. 134

4.2.1. Amostras probabilísticas ..................................................................... 1344.2.2. Amostras não-probabilísticas .............................................................. 1384.2.3. Erros no processo de amostragem ...................................................... 1394.2.4. Recrutamento ..................................................................................... 140

4.3. Cálculos para o tamanho da amostra ............................................................ 1414.3.1. Cálculo do “n” amostral para estudos descritivos ................................ 1494.3.2. Cálculo do “n” amostral para estudos analíticos .................................. 1524.3.3. Cálculo do “n” para populações limitadas (finitas) ................................ 157

4.4. Métodos de randomização ............................................................................ 1604.4.1. Objetivos da randomização ................................................................. 1604.4.2. Tipos de randomização ....................................................................... 1604.4.3. Outras considerações ......................................................................... 165

5. Coleta, organização e análise dos dados ............................................................... 1675.1. Objetivos da coleta e organização de dados ................................................. 167

5.1.1. Tipos de dados quanto à origem ......................................................... 1685.1.2. Análise interpretação dos dados ......................................................... 1695.1.3. Acurácia e precisão ............................................................................. 170

5.2. Erros na coleta de dados .............................................................................. 1735.2.1. Erro sistemático (BIAS) ........................................................................ 1735.2.2. Erro aleatório ...................................................................................... 1755.2.3. Confundimento (ou confusão) ............................................................. 1765.2.4. Interação e sinergismo ........................................................................ 1775.2.5. Estratégias para melhorar a coleta de dados ....................................... 178

BIOESTATISTICA_Vol_01.indb 12 25/06/12 17:11

Page 13: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

5.3. Fontes de variação ........................................................................................ 180Parte II – INTRODUÇÃO À ESTATÍSTICA DESCRITIVA ................................................ 183

6. Estudo das variáveis estatísticas ...................................................................... 1856.1. Conceitos estatísticos ................................................................................... 1856.2. Classificação das variáveis ............................................................................ 188

6.2.1. Variáveis quantitativas ......................................................................... 1886.2.2. Variáveis qualitativas ........................................................................... 1896.2.3. Variáveis independentes e dependentes .............................................. 193

7. Distribuição de freqüências ................................................................................... 1977.1. Organização de dados estatísticos ............................................................... 197

7.1.1. Série estatística ................................................................................... 1987.2. Distribuição de freqüência ............................................................................. 200

7.2.1. Construindo uma distribuição de freqüência ........................................ 2047.2.2. Elementos da distribuição de freqüência .............................................. 2097.2.3. Tipos de tabela de distribuição de freqüência ...................................... 2127.2.4. Normas para apresentação tabular de dados ...................................... 214

7.3. Representação gráfica .................................................................................. 2187.3.1. Gráficos para dados quantitativos ....................................................... 2197.3.2. Gráficos para dados qualitativos ......................................................... 226

8. Parâmetros da distribuição de freqüência .............................................................. 2358.1. Medidas de tendência central ....................................................................... 237

8.1.1. Moda .................................................................................................. 2378.1.2. Mediana .............................................................................................. 2408.1.3. Média aritmética ................................................................................. 2438.1.4. Média geométrica ............................................................................... 2528.1.5. Média harmônica ................................................................................ 252

8.2. Medidas de dispersão .................................................................................. 2538.2.1. Amplitude total .................................................................................... 2548.2.2. Desvio médio absoluto ........................................................................ 2558.2.3. Variância ............................................................................................. 2568.2.4. Desvio padrão ..................................................................................... 2618.2.5. Coeficiente de variação ....................................................................... 271

8.3. Medidas de assimetria e curtose ................................................................... 2728.3.1. Medidas de assimetria ........................................................................ 2738.3.2. Medidas de curtose ............................................................................ 274

8.4. Medidas de posição (separatrizes) ............................................................... 2768.4.1. Quartil ................................................................................................. 2768.4.2. Decil ................................................................................................... 2778.4.3. Centil ou Percentil ............................................................................... 2788.4.4. Gráfico Box Plot (Diagrama de Tukey) ................................................. 282

8.5. Erro padrão da média ................................................................................... 287

BIOESTATISTICA_Vol_01.indb 13 25/06/12 17:11

Page 14: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

8.6. Intervalo de confiança ................................................................................... 289

9. Distribuição de probabilidades .............................................................................. 2959.1. Distribuição normal (gaussiana) ..................................................................... 296

9.1.1. Características da curva normal .......................................................... 2999.1.2. Curva normal padronizada (reduzida) ................................................... 3019.1.3. Aplicação da curva normal .................................................................. 302

9.2. Distribuição binomial ..................................................................................... 3069.2.1. Distribuição binomial versus distribuição normal .................................. 3099.2.2. Aplicação da distribuição binomial ....................................................... 311

9.3. Distribuição de Poisson ................................................................................ 315

10. Inferência estatística e teste de hipótese ............................................................. 31910.1. Inferência estatística ................................................................................... 320

10.1.1. Estimação de parâmetros ................................................................. 32010.2. Teste de hipótese estatística ....................................................................... 322

10.2.1. Tipos de hipóteses estatísticas .......................................................... 32410.2.2. Fundamentos do teste de hipótese ................................................... 32610.2.3. Tipos de erro na verificação de hipóteses .......................................... 32910.2.4. Nível alfa e valor P ............................................................................. 33010.2.5. Poder do teste estatístico .................................................................. 33410.2.6. Testes unicaudal e bicaudal ............................................................... 334

10.3. Etapas de um teste de hipótese estatística ................................................. 33710.4. Tipos de análises estatísticas ...................................................................... 34010.5. A escolha do teste estatístico ..................................................................... 341

TABElAS .................................................................................................................. 345

REFERêNCIAS BIBlIOGRáFICAS ............................................................................. 407

ÍNDICE REMISSIVO .................................................................................................. 413

BIOESTATISTICA_Vol_01.indb 14 25/06/12 17:11

Page 15: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Introdução 15

INTRODUÇÃO

“Chamar o especialista em estatística depois que o experimento foi feito pode ser o mesmo que pedir a ele

para fazer um exame post-mortem. Talvez ele consiga dizer de que foi que o experimento morreu”.

Sir Ronald Aylmer Fisher (1890-1962) Biólogo, geneticista e estatístico inglês.

1. ORIGEM DA ESTATÍSTICA

Desde os primórdios das civilizações humanas, o homem, como ser inteli-gente que é, teve despertada a sua grande curiosidade no sentido de conhecer seus recursos naturais, suas riquezas e suas populações, assim como definir os limites de suas propriedades. Certamente, de modo empírico, essas civili-zações, como ainda acontece nos dias atuais, ocupavam-se em descrever quan-titativamente seus vários aspectos socioeconômicos, com o intuito de criar normas e leis que, por sua aplicação governamental, pudessem melhor definir os parâmetros para a aplicação dos recursos disponíveis. Assim é que, os cha-mados censos, nos moldes como conhecemos hoje, sejam eles demográficos, agropecuários ou socioeconômicos, foram implantados ainda em cidades mui-to antigas da Grécia, de Roma e da Palestina, onde nesta, no início da era cristã,

BIOESTATISTICA_Vol_01.indb 15 25/06/12 17:11

Page 16: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental16

por volta do ano um, o imperador romano Caio Júlio César Octaviano Augusto (63 a.C.-14 d.C.) ordenou o primeiro recenseamento no sentido de reorganizar politicamente o Estado romano. Do mesmo modo, e com os mesmos objetivos, diversos outros estudos censitários famosos foram realizados em outros paí-ses, como na Inglaterra, onde, nos anos de 1085 e 1806, o rei William I ordenou um grande estudo no sentido de obter informações precisas sobre o seu reino, de tal maneira que pudesse administrá-lo, e, para isso, precisaria saber quem era o dono e qual o valor da propriedade, para poder taxá-la. Este censo deu origem ao livro, escrito em latim, conhecido como “Domesday Book” ou livro do juízo final. Atualmente, estudos semelhantes são adotados em todos os pa-íses do mundo, inclusive no Brasil, onde o Instituto Brasileiro de Geografia e Estatística (IBGE), fundação pública da administração federal brasileira, é res-ponsável pela realização e organização das informações censitárias ligadas às geociências e estatísticas sociais, demográficas e econômicas, com o objetivo de suprir órgãos das esferas governamentais federal, estadual e municipal, e para outras instituições e o público em geral.

Desta forma, como podemos observar, todas estas atividades relativas à co-leta, organização e análise de dados têm sido atribuídas à esfera governamental de um país, ou seja, ao Estado, palavra derivada do latim status, que significa “posto”, “posição” ou “forma de estar”, daí a origem do termo “estatística”, o qual denota as “coisas” ou assuntos relacionados ao Estado, ao governo. Assim, esta ciência, que foi pela primeira vez utilizada pelos coletores de impostos, com o ob-jetivo de obter informações que pudessem determinar o valor dos bens e deter-minar o tributo referente aos mesmos, tem sido empregada em todos os campos do conhecimento humano, embora apresente um passado pouco popular1.

De início acanhado, quando apenas se pautava em observar e descrever os aspectos inerentes a uma dada população, hoje, esta ciência tem por objetivo a observação, a coleta, a classificação, o resumo, a organização, a análise e a interpretação de dados, bem como a análise de fenômenos coletivos ou de mas-sa, e, também, a indução das leis que tais fenômenos obedecem, tornando-se, portanto, uma poderosa ferramenta a fornecer um conjunto de técnicas de aná-lise de dados e auxiliar na tomada de decisões científicas. Isto posto, podemos

1. O termo larápio teve sua origem na Roma antiga, onde existia um coletor de impostos corrupto chamado Lucius Antonius Ruffus Appius que, nos documentos públicos, assinava L. A. R. Appius.

BIOESTATISTICA_Vol_01.indb 16 25/06/12 17:11

Page 17: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Introdução 17

perceber que a estatística se subdivide em: estatística descritiva, direcionada para a coleta, o resumo e a apresentação de dados populacionais mediante a utilização de gráficos e tabelas; a estatística inferencial, importante nos tes-tes de hipóteses científicas e na tomada de decisões mediante a interpretação de conjuntos de dados amostrais retirados de uma dada população.

De qualquer sorte, seja qual for o ramo da estatística a ser utilizado, sua aplicação prática como ferramenta de pesquisa só ganhou popularidade após o surgimento do microcomputador e dos softwares especializados, o que a tor-nou mais popular nos meios acadêmicos, ganhando agilidade e facilidade de aplicação. Por outro lado, o ensino-aprendizado desta ciência não tem desper-tado o interesse dos alunos dos diferentes cursos de graduação, uma vez que seu ensino tem se pautado em processos fundamentalmente teóricos, voltados quase que exclusivamente para suas fórmulas matemáticas, sem, no entanto, mostrar sua verdadeira aplicação prática, a qual é, realmente, ampla. Assim, no tocante à sua grande aplicação na área das ciências da saúde, ela tem sido largamente empregada na educação, economia, agricultura, física, química, psi-cologia, sociologia e em muitas outras áreas do conhecimento.

2. BIOESTATÍSTICA

Define-se como bioestatística ou biometria, a aplicação dos métodos es-tatísticos nas pesquisas relacionadas às áreas das ciências da saúde, como na biologia ou na medicina, por exemplo. Mas, no que a bioestatística difere da es-tatística tradicional? A princípio, podemos afirmar que em nada, uma vez que a primeira é uma parte inerente à segunda, e ambas desfrutam dos mesmos prin-cípios de raciocínio e utilizam, basicamente, as mesmas fórmulas matemáticas. Assim, exceto por alguns conceitos e técnicas de análises que, de maneira cor-rente, são mais usualmente empregadas no âmbito das ciências da saúde, elas em nada diferem. Porém, como todas as áreas das atividades humanas têm seu linguajar próprio, assim o é, também, na bioestatística, onde o aluno tem que se familiarizar com conceitos e termos próprios das ciências biológicas e médicas.

As próximas questões que devem ser respondidas são: por que aprender bioestatística? Onde empregá-la? De uma maneira bem simplista, poderíamos

BIOESTATISTICA_Vol_01.indb 17 25/06/12 17:11

Page 18: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental18

dizer que em todas as áreas do conhecimento humano podemos utilizar a bio-estatística, em especial nas pesquisas relacionadas às áreas das ciências bioló-gicas e médicas, onde tem se mostrado como um instrumento extremamente útil. Isto, por si só, justifica o seu aprendizado em todos os níveis, seja na gradu-ação ou na pós-graduação, sendo nesta última, uma ferramenta indispensável. Hoje, não se concebe um pesquisador que não possua um conhecimento razo-ável desta importante ciência, pois, não é possível planejar um experimento científico, coletar e analisar dados ou mesmo formular e testar hipóteses, sem o auxílio da bioestatística. Assim, várias são as suas aplicações no campo da pesquisa experimental, constituindo-se num importante método auxiliar na aquisição de conhecimentos e na tomada de decisões.

Desta forma, podemos, portanto, citar algumas de suas principais apli-cações no campo da pesquisa clínica na área da saúde. Nesta, o uso da bio-estatística ajuda a medir e explicar de forma mais precisa a grande variação observada nos dados da amostra coletada em um determinado estudo, além de permitir a identificação da margem de erro associada às conclusões em razão desta variabilidade, facilitando, deste modo, a interpretação dos dados com vista à promoção de um diagnóstico e ao estabelecimento de um plano de conduta para a prevenção e tratamento de uma determinada doença, tal como ocorre nos ensaios clínicos que estudam as questões epidemiológicas em uma região geográfica. Igualmente, nas pesquisas experimentais de laboratórios, a bioestatística é parte obrigatória de um projeto de pesquisa, pois é ela que ga-rante a reprodutibilidade dos resultados do experimento, tal como ocorre nos ensaios laboratoriais para testar o mecanismo de ação, a efetividade e os efei-tos colaterais de novas drogas.

Finalmente, a aplicação da bioestatística nos processos de investigação científica extrapola as simples questões matemáticas para cálculos de médias e desvios padrão ou apresentação de gráficos, tabelas e planilhas. Ela ajuda os profissionais da área da saúde a avaliar adequadamente o método utilizado e os resultados apresentados em artigos científicos publicados por literatura especializada. Um leitor arguto, e dotado de embasamento estatístico, pode-rá, facilmente, identificar erros no desenho e na execução de um determinado estudo. Estudos dessa natureza não raro apresentam ausência de critérios de inclusão dos indivíduos participantes da pesquisa, falhas no processo de ran-

BIOESTATISTICA_Vol_01.indb 18 25/06/12 17:11

Page 19: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Introdução 19

domização da amostra e erros na escolha dos testes estatísticos empregados para a verificação das hipóteses, falhas estas que comprometem a qualidade do estudo, destituindo-os de qualquer valor científico e tornando-os impró-prios para publicação. Do mesmo modo, para os profissionais que coordenam grupos de pesquisa, ou agências de fomento, e que, frequentemente, são cha-mados para avaliar projetos submetidos à aprovação, o conhecimento desta importante ciência é fundamental, já que ela está diretamente envolvida com a metodologia científica, sendo parte integrante desta, pois, nenhum estudo, por mais relevante que seja, irá fornecer informações confiáveis a respeito do obje-to da pesquisa, a não ser que apresente um desenho adequadamente projetado, com embasamento científico e metodológico consistentes. Nisto, a bioestatísti-ca pode ajudar, e muito.

3. ESTRUTURA DO LIVRO

O objetivo desta obra não visa, por si só, a esgotar o assunto relativo ao ensino-aprendizagem da bioestatística, mas tão somente de servir como um guia prático para aqueles profissionais da área da saúde, sejam estudantes, professores ou pesquisadores, ainda não familiarizados com o emprego desta importante ferramenta de pesquisa.

Após alguns anos atuando na área da gestão, do ensino e do desenvolvimen-to de projetos de pesquisa, assim como no ensino da bioestatística, cedo percebe-mos que escrever e executar um determinado projeto de pesquisa experimental requer um conhecimento, no mínimo satisfatório, de metodologia científica, na qual se inclui, de maneira inconteste, o conhecimento de estatística. Planejar e escrever um projeto de pesquisa, e também executá-lo, compreende uma série de passos que deverão ser desencadeados em etapas sequenciais, de tal modo que se transforme num empreendimento lógico e preciso, em última análise, num algoritmo2. Portanto, foi pensando no aluno, no professor ou mesmo no pesqui-

2. Um algoritmo é uma sequência de instruções executadas até que determinada condição se verifique, ou seja, são os passos necessários para a realização de uma tarefa específica. A palavra algoritmo tem origem no sobrenome, Al-Khwarizmi, do matemático persa do século IX Mohamed ben Musa.

BIOESTATISTICA_Vol_01.indb 19 25/06/12 17:11

Page 20: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental20

sador iniciante, ainda dotados de pouca experiência na área da pesquisa, que decidimos estruturar esta obra, de tal modo que ela contemple seus assuntos numa ordem lógica de apresentação, semelhante àquela necessária para o de-senvolvimento de um projeto de pesquisa, contemplando um nível crescente de complexidade dos assuntos abordados, tal como segue abaixo:

Volume I •Parte I – O planejamento da pesquisa experimental

Trata do planejamento da pesquisa experimental. Inicia com um capítulo que aborda as ciências e o conhecimento científico; apresenta a estrutura e os diversos tipos de pesquisa científica e o desenvolvimento de um projeto de pesquisa. Mostra a importância da elaboração da questão da pesquisa, com a escolha do tema e o planejamento do estudo; descreve a classifi-cação dos diferentes estudos de pesquisa e apresenta os tipos mais usu-ais de estudos observacionais e experimentais. No capítulo 3, destaca-se a elaboração de um projeto de pesquisa e, no capítulo 4, trata do tamanho da amostra e dos diversos tipos de randomização. Seguem-se a coleta de dados, as fontes de variação dos dados, a classificação e o estudo das va-riáveis estatísticas, assim como mostra os erros mais comuns na pesquisa experimental e o gerenciamento de informações.

•Parte II - Introdução à estatística descritiva

Introduz o leitor nos princípios básicos da estatística descritiva. Mostra o estudo das variáveis estatísticas e trata da distribuição de frequências e da organização de dados de variáveis contínuas, nominais e ordinais, além de enfatizar a distribuição binomial, de Poisson e a Gaussiana. Descreve os parâmetros da distribuição de frequência, onde aborda as medidas de tendência central (moda, mediana e média), as medidas de dispersão (va-riância, desvio padrão, erro padrão e intervalos de confiança), as medidas de assimetria e curtose, além das medidas de posição (separatrizes) quar-til, decil e percentil. Destaque para o capítulo 10, onde aborda a inferência estatística e os processos de teste de hipóteses. Nos demais capítulos, são descritos a estimação de parâmetros, a distribuição de probabilidades e os diferentes tipos de análises estatísticas.

BIOESTATISTICA_Vol_01.indb 20 25/06/12 17:11

Page 21: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Introdução 21

Volume II •Parte III – Testes de hipótese paramétricos

Aborda as técnicas de análise univariada, com ênfase para os testes para-métricos e testes de aderência. Estuda as análises bivariadas e mostra os critérios para a escolha do teste estatístico para análise bivariada. Aqui, o leitor irá entender os princípios que orientam as inferências estatísticas para análises bivariadas. Aprenderá a interpretação dos resultados dos di-ferentes testes estatísticos paramétricos, com destaque para o teste t de Student, correlação linear e regressão linear, além da aplicação e interpre-tação dos testes de aderência Kolmogorov-Smirnov e Shapiro-Wilk.

•Parte IV – Testes de hipótese não-paramétricos

Nesta parte, o leitor poderá aprender sobre os testes de hipóteses não-pa-ramétricos mais utilizados em pesquisa na área das ciências da saúde, com destaque para o teste do qui-quadrado e para a teoria das probabilidades, na qual são descritas as medidas de avaliação de risco (odds ratio e risk ratio). Aprenderá, também, sobre os testes de rastreamento diagnóstico, com ênfase para a aplicação da curva ROC e para a combinação de múlti-plos testes. Aqui também serão estudados os principais testes de hipóteses para dados ordinais, tais como o teste de Wilcoxon-Mann-Whitney, o teste T de Wilcoxon, o coeficiente de correlação de Spearman e o teste de con-cordância de Kappa.

•Parte V – Análise multivariada

Contempla as técnicas de análise multivariadas. Inicialmente, introduz o leitor na análise conceitual multivariada e, a seguir, orienta quanto à es-colha do teste estatístico para este tipo de análise. Orienta quanto à infe-rência para análises com dados paramétricos e não-paramétricos e expõe outros modelos de análises multivariadas, enfatizando a análise de variân-cia (ANOVA), a regressão linear múltipla e a regressão logística múltipla. Esta parte do livro também contempla os métodos de análise de sobrevida, estes bastante utilizados na medicina clínica, com abordagem sobre o mé-todo atuarial e o método produto limite de Kaplan-Meier, com ênfase para o teste de significância de logrank. Esta parte é o destaque da obra, um di-

BIOESTATISTICA_Vol_01.indb 21 25/06/12 17:11

Page 22: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental22

ferencial e de maior complexidade, pois trata da análise de planejamentos fatoriais, com destaque para a análise de superfície de resposta.

Volume I

BIOESTATISTICA_Vol_01.indb 22 25/06/12 17:11

Page 23: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Volume I

BIOESTATISTICA_Vol_01.indb 23 25/06/12 17:11

Page 24: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

BIOESTATISTICA_Vol_01.indb 24 25/06/12 17:11

Page 25: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

parte 1

O planejamentO da pesquisa experimental

“A ciência faz-se com fatos

assim como uma casa se faz com pedras;

mas um acúmulo de fatos é tão ciência

como um montão de pedras é uma casa.

Os fatos simples não bastam,

não se dispensa a ciência organizada”.

Henri Poincaré (1854-1912)Matemático, físico e filósofo francês.

BIOESTATISTICA_Vol_01.indb 25 25/06/12 17:11

Page 26: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

BIOESTATISTICA_Vol_01.indb 26 25/06/12 17:11

Page 27: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

1As Ciências e o

Conhecimento Científico

1.1. AS CIÊNCIAS

Na literatura, define-se como ciência, o conhecimento perfeito, o qual é apresentado com evidência, com verdade e com a certeza dos fatos, suas propriedades qualitativas. Termo derivado do latim scire (= saber), scientia

(= conhecimento), a palavra ciência oferece o mesmo conteúdo etimológico que conhecimento, do latim cognosci (= conhecer). De organização sistemá-tica, a ciência parte sempre em busca do conhecimento perfeito, o seu ideal, embora nem sempre o consiga, sendo, porém, um todo inter-relacionado de conhecimentos ordenados em sistemas, direcionados à descoberta da ver-dade. Podemos dizer, também, que Ciência é o conhecimento ou um sistema de conhecimentos que engloba um conjunto de verdades ou a operação de leis gerais, especialmente obtidas e testadas através de um método científico lógico, que, segundo Charles Darwin1, consiste em agrupar fatos para que leis gerais ou conclusões possam ser tiradas deles. De maneira menos formal, podemos dizer que ciência abrange qualquer campo sistemático de estudo ou o conheci-mento obtido a partir dele.

1. Charles Robert Darwin (1809-1882). Naturalista britânico que alcançou fama ao convencer a comunidade científica da ocorrência da evolução, e propor uma teoria para explicar como ela se dá por meio da seleção natural e sexual.

BIOESTATISTICA_Vol_01.indb 27 25/06/12 17:11

Page 28: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental28

A partir desses conceitos, podemos dividir a ciência em quatro gran-des categorias conforme seu campo de atuação: a ciência pura, destinada, mediante a utilização de pesquisas científicas, ao desenvolvimento de novas teorias, e que contrasta com a ciência aplicada, que estuda a aplicação dessas teorias às necessidades humanas; a ciência natural, que estuda a natureza, o mundo natural, e se completa com a ciência social, que abrange o estudo do comportamento humano e da sociedade como um todo. Portanto, com base nesta divisão, a ciência pode ser subdividida em vários campos, conforme suas especificidades e aplicações. Assim, temos:

Ciências da SaúdeQue engloba a Medicina, Odontologia, Fonoaudiologia, Enfermagem, Bio-

medicina, Fisioterapia, Medicina Veterinária, Nutrição, Educação Física, cada uma delas com seus campos de saberes específicos, tais como a anatomia hu-mana, fisiologia, patologia, farmacologia, bioquímica, biofísica, toxicologia, imunologia, ginecologia, neurologia, radiologia, entre outras.

Ciências NaturaisCompreende a Astronomia; a Física (acústica, astrofísica, balística, cos-

mologia, dinâmica, estática, mecânica, física atômica, física molecular e óptica, física computacional, física da matéria condensada, física de partículas, física de polímeros, física do plasma, física dos materiais, física matemática, física nu-clear etc.); a Química (bioquímica, eletroquímica, espectroquímica, estereoquí-mica, ciência dos materiais, química analítica, química computacional, química física, química inorgânica, química orgânica, química quântica, termoquímica); as Ciências da Terra (climatologia, geodesia, geofísica, geografia, geologia, ge-omorfologia, geoquímica, glaciologia, hidrologia, hidrogeologia, limnologia, meteorologia, mineralogia, oceanografia, paleontologia, petrologia, sismolo-gia, vulcanologia); a Biologia (análise comportamental, anatomia, antropolo-gia física, astrobiologia, biofísica, bioinformática, biologia celular, biologia do desenvolvimento, biologia estrutural, biologia evolutiva do desenvolvimento, biologia marinha, biologia molecular, bioquímica, botânica, citologia, cladística, ecologia, entomologia, epidemiologia, evolução, ficologia, filogenia, fisiologia, genética, genômica, proteômica, histologia, imunologia, limnologia, microbio-

BIOESTATISTICA_Vol_01.indb 28 25/06/12 17:11

Page 29: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

As ciênciAs e o conhecimento científico 29

logia, morfologia, neurociência, ontogenia, psicobiologia, taxonomia, toxicolo-gia, virologia e zoologia).

Ciências SociaisAbrange a História; a Antropologia (antropologia física, arqueologia, an-

tropologia cultural, antropologia visual); a Linguística (fonética, fonologia, morfologia, semântica, sintaxe); a Psicologia (análise comportamental, neu-ropsicologia, ontopsicologia, psicobiologia, psicofísica, psicopedagogia, psico-logia clínica, psicologia cognitiva, psicologia do desporto, psicologia da perso-nalidade, psicologia da religião, psicologia da saúde, psicologia da sensação e percepção, psicologia do desenvolvimento, psicologia educacional, psicologia experimental, psicologia forense, psicologia humanística, psicologia industrial e organizacional, psicologia social, psicometria); além da Administração, Ar-quivologia, Biblioteconomia, Contabilidade, Direito, Economia, Geografia, Ciên-cia da Informação, Ciência Política, Sociologia e a Pedagogia.

Ciências Holísticas, Interdisciplinares e AplicadasCorrespondem às Ciências Cognitivas (neurociência cognitiva, neuropsico-logia, psicolinguística, psicologia cognitiva); às Ciências da Computação e da Informação (biblioteconomia, cibernética, ciência da computação, ciência da informação, linguística computacional, sistêmica); à Ciência Militar; à Ciência Planetária e às Engenharias (Ciência da Agricultura, Engenharia Biomédica, Engenharia Cartográfica, Engenharia Civil, Engenharia da Agricultura, Engenharia da Computação, Engenharia de Linguagem, Engenharia Elétrica, Engenharia Mecânica).

Ciências AmbientaisConstituída pela Ciência Ambiental e Química Ambiental.Assim, apesar de bastante ampla na sua abrangência, a ciência não visa,

por si só, a responder a todas as questões, mas, sim, àquelas pertinentes a nossa realidade física. Deste modo, ainda é possível classificar a ciência, de acordo com sua finalidade, em ciência básica, ciência aplicada e ciência téc-nica, estando, a primeira, relacionada com a investigação científica sobre as leis que regem o universo, a natureza, ao passo que a ciência aplicada se ocupa

BIOESTATISTICA_Vol_01.indb 29 25/06/12 17:11

Page 30: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental30

em compreender os fenômenos específicos de cada processo de experimen-tação, buscando atingir maior utilidade prática. Já a ciência técnica é aquela que busca a melhoria da qualidade de vida pela busca do aprimoramento do conhecimento científico.

Isto posto, podemos dizer que o objeto das ciências é produzir mode-los úteis da realidade, os quais nos permitem fazer predições baseadas em observações dos fenômenos naturais, através de testes de hipóteses previa-mente bem definidas, de tal modo que benefícios possam ser traduzidos para os indivíduos ou para a sociedade como um todo, os quais podem fazer uso delas. Tomemos por exemplo a ciência matemática, cujas características são especiais entre todas as ciências, sendo considerada como a linguagem uni-versal para o conhecimento científico, e que, tradicionalmente, tem servido como ferramenta que nos permite chegar rapidamente a resultados precisos, os quais, de outra forma, se tornariam difíceis e, certamente, obscuros. Esta, antes aplicada mais frequentemente à física e à engenharia, hoje suas possi-bilidades se estendem às outras áreas do conhecimento, como a economia, administração, biologia, química, medicina e às ciências do meio ambiente. Isto se deve, em grande parte, ao amadurecimento científico da matemática, ao advento dos computadores, que possibilitaram o seu desenvolvimento e a sua aplicação eficiente. De igual modo, a química tem transformado nossa habilidade em usar e predizer reações e cenários químicos através da identificação de substâncias da natureza, dos elementos que a constituem, de suas características, propriedades combinatórias, processos de obtenção e suas aplicações práticas. Estuda a maneira como os elementos se ligam e reagem entre si, bem como, a energia desprendida ou absorvida durante estas transformações.

Mas onde se praticam as ciências? A princípio e considerando o seu aspecto mais acadêmico, podemos afirmar que as ciências são, tradicio-nalmente, desenvolvidas e praticadas em laboratórios de pesquisas nas universidades ou em outras instituições de pesquisa, coorporativas ou não, assim como no campo, sempre com a participação de profissionais habili-tados e com o emprego de métodos científicos apropriados. Por isso, para o bom entendimento dos princípios do desenvolvimento das ciências, alguns conceitos devem ser aqui discutidos.

BIOESTATISTICA_Vol_01.indb 30 25/06/12 17:11

Page 31: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

As ciênciAs e o conhecimento científico 31

1.2. O CONHECIMENTO CIENTÍFICO

É aquele que se verifica pela demonstração ou pela experimentação, resultantes de uma investigação científica metódica e sistemática de fatos e fenômenos naturais, cuja finalidade é descobrir suas causas e determinar seus efeitos mediante a explicação das leis gerais que os regem. O estudo do conhe-cimento é a epistemologia, que estuda a origem, a estrutura, os métodos e a validade do conhecimento, o qual, segundo Aristóteles (384 a.C. - 322 a.C.), filósofo grego, divide-se em três áreas: científica, prática e técnica.

Neste sentido, muito se confundem os conceitos de dados, informação e conhecimento científico. Dados correspondem apenas a um amontoado de sím-bolos, decifráveis ou não, podendo ser representados por números resultantes de um determinado experimento científico. Para quem não sabe sua origem ou não entende o processo experimental pelo qual eles foram obtidos, esses dados não têm nenhum sentido lógico ou prático. Estes, quando armazenados, formam uma “base de dados”. Uma informação acontece a partir do momento em que os dados coletados e armazenados são decodificados e passam a ter um significado lógico para quem os observa, estabelecendo uma comunicação visual através da qual se pode obter a informação desejada. A partir deste ponto, podemos afirmar que os dados acumulados formam uma base ou uma fonte de informações a respeito do fenômeno estudado pelo processo experimental, as quais servem de base para a construção do conhecimento científico, sendo este, acumulável na mente humana. Assim, o conhecimento científico sobre um determinado assunto, corresponde a um conjunto de informações absor-vidas pela coleta e análise de dados obtidos pela aplicação de um experimento científico. Com base neste raciocínio, podemos afirmar que o conhecimento científico é uma atividade intelectual de aprendizagem através da qual acumu-lamos idéias, conceitos e teorias sobre um dado assunto de interesse. Neste ponto, gostaríamos de enfatizar a aplicação da bioestatística como método efetivo a ser utilizado, por pesquisadores, no processo de aprendizado para a captação do conhecimento científico, pois é ela que orienta quanto ao plane-jamento experimental, quanto à coleta e análise dos dados, e no que tange aos testes de hipóteses que devem ser empregados para inferência dos resultados. A bioestatística torna mais preciso o método científico.

BIOESTATISTICA_Vol_01.indb 31 25/06/12 17:11

Page 32: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental32

Método científicoCorresponde ao conjunto de orientações básicas utilizadas com a finalida-

de de desenvolver uma dada experiência cujo intuito é produzir novos conheci-mentos ou agregar valor aos conhecimentos pré-existentes, ou seja, consiste em reunir evidências observáveis e mensuráveis. Aqui, é válido salientar que os mé-todos científicos apresentam aspectos que os diferenciam de outros processos. Num método científico, é necessária, inicialmente, a proposição de hipóteses para explicar fenômenos e observações, os quais deverão ser testados pela apli-cação de experimentos. Se estas hipóteses forem confirmadas, pode-se, agora, gerar teorias ou, em conjunto, formular novas hipóteses. Outra característica do método científico é a objetividade e a imparcialidade na interpretação dos seus resultados, além de que precisa ser documentado no que diz respeito aos proce-dimentos e aos dados obtidos, de tal modo que o mesmo possa ser reproduzido. Neste aspecto, a utilização de métodos estatísticos é fundamental no sentido de testar as hipóteses e de verificar a confiabilidade dos resultados.

Cabe aqui uma explicação: como o objetivo deste livro não é um apro-fundamento sobre a metodologia científica, mas sim, abordar o emprego da bioestatística como ferramenta do processo de investigação científica, sugeri-mos que o leitor busque outros autores especializados sobre o assunto. Porém, como todo método científico prevê a aplicação de um raciocínio lógico e estru-turado, podemos classificá-lo em:

Método indutivo

É aquele que emprega o raciocínio indutivo nos processos de interpretação dos resultados de uma pesquisa científica. Neste método, o investigador parte de dados particulares, devidamente constatados pelos processos experimen-tais, e infere uma verdade geral ou universal não contida nas partes estudadas. Seu objetivo é obter conclusões verdadeiras a partir de premissas verdadeiras.

Método dedutivo

É aquele que caminha do geral para o particular e parte de premissas bas-tante evidentes, ou seja, a racionalização das idéias, como um todo, tem mais valor que a experimentação caso a caso. Requer um nível de complexidade de raciocínio menor que aquele aplicado ao método indutivo e, portanto, menor experiência da parte do pesquisador.

BIOESTATISTICA_Vol_01.indb 32 25/06/12 17:11

Page 33: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

As ciênciAs e o conhecimento científico 33

Método observacional

Ou fenomenológico. Esse método corresponde a um dos mais utilizados entre todos os procedimentos investigativos, revestindo-se de grande impor-tância para o desenvolvimento da ciência. É a descrição direta do experimento, tal como ele é, para que se possa, a partir dele, adquirir informações e mon-tar uma base de conhecimento claro e preciso. Este método pode ser realizado individualmente ou em equipe, em campo ou em laboratório. Pode ser classifi-cado em: assistemático, quando não tem planejamento e controle previamente elaborados pelo pesquisador; e sistemático, quando tem planejamento e é rea-lizado em condições controladas pré-estabelecidas.

Método experimental

Geralmente realizados em laboratórios, com a utilização de animais ou como ensaios clínicos em seres humanos, este método pode ser controlado ou não, e seu objetivo é obter informações sobre determinado procedimento ou tratamento, no sentido de estabelecer relação entre causa e efeito. É, talvez, o método mais aplicado na área das ciências biológicas e da saúde.

Método da diferença

Também chamado de método dos resíduos ou das variações concomitan-tes. Neste método, o investigador modifica a intensidade da causa a fim de verificar as variações correspondentes do fenômeno estudado.

Experimento científicoOu experiência científica, corresponde ao conjunto de experiências ou

ações realizadas a partir de um sistema padronizado de etapas ordenadamente dispostas. A experimentação científica deve obedecer, estritamente, a um mé-todo científico previamente determinado por parte do pesquisador, e prevê a sua interferência, a introdução e a manipulação das condições ambientais, ou de quaisquer outros fatores, em função da finalidade da pesquisa, e pode, de qualquer modo, ser realizada em laboratórios ou em ambientes externos. Um investigador que deseje testar os efeitos de uma nova droga sobre uma deter-minada doença, ou condição clínica, em animais de laboratório, deverá, a prio-ri, padronizar um método de pesquisa o qual deverá prever todas as etapas de

BIOESTATISTICA_Vol_01.indb 33 25/06/12 17:11

Page 34: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental34

experimentação, de tal modo que a droga possa ser testada na sua plenitude, e os objetivos alcançados. Portanto, a apresentação e a descrição das diferentes etapas reveste-se de importância, pois pela sua replicação, o experimento pode ser repetido e até testado em outra amostra não relacionada àquela original-mente estudada. Nesta fase, a elaboração do projeto de pesquisa, bem redigido e bem orientado, é fundamental, assunto este que será discutido em outro ca-pítulo específico sobre o tema.

Hipótese Corresponde ao mais básico dos três níveis utilizados para se definir a

validade de uma afirmação no âmbito do conhecimento científico, sendo os ou-tros dois, a tese e a teoria científica. Uma hipótese é uma teoria a qual se pode provar, mas não pode ser demonstrada, ou seja, é uma suposição admissível, uma alegação. Uma hipótese ocorre como pensamento científico quando, após a coleta de dados, ocorre a necessidade de uma explicação plausível para jus-tificar os fenômenos associados ao experimento que gerou esses dados. Ela é normalmente seguida de experimentação, que pode confirmar sua verdade ou refutá-la. Quando uma hipótese passa a ser suportada por fatos, porém sem ser confirmada por pesquisas científicas confiáveis, ela é considerada uma tese, uma proposição que se apresenta, porém, assim que é comprovada, a hipótese passa a ser chamada de teoriacientífica, lei ou postulado. Consequentemen-te, uma hipótese é uma suposição tomada como resposta plausível e provisória para um problema a ser pesquisado, uma vez que poderão ser confirmadas ou refutadas após a realização da pesquisa. Caso seja refutada, o pesquisador de-verá abandoná-la ou modificá-la.

Outro fator a ser considerado é que um mesmo problema pode ter mais de uma hipótese, e, portanto, mais de uma solução possível para a sua resolução. Por essa razão, o pesquisador deverá orientar o planejamento de sua pesquisa no sentido de comprovar ou refutar a sua hipótese básica (principal), que corresponde à afirmação tomada como a principal resposta para o problema proposto. Só então, deverá se ater às questões secundárias (complementares), as quais são afirmações complementares que representam outras possibili-dades de respostas para o mesmo problema. Por conseguinte, num processo de investigação científica, é a hipótese ou hipóteses que deverão orientar todo

BIOESTATISTICA_Vol_01.indb 34 25/06/12 17:11

Page 35: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

As ciênciAs e o conhecimento científico 35

desenvolvimento da pesquisa, assim como os seus limites. Essa hipótese deverá ser clara e simples quanto ao grau de complexidade, apresentar uma consistên-cia lógica e ser passível de comprovação, um mínimo aceitável de embasamento teórico, além de relevância científica.

Como formular uma hipótese? Use sua criatividade e experiência na área a ser pesquisada; observe, seja intuitivo e, sobretudo, tome como parâmetros os resultados de outras pesquisas e teorias.

Teoria científicaUma teoria cientifica é uma ideia que tem por objetivo explicar, com alto

grau de exatidão, os fenômenos da natureza. Assim, para que uma ideia possa ser estabelecida como uma teoria científica, suas afirmações devem ser valida-das por um ou mais experimentos cientificamente estruturados e reprodutíveis, os quais devem comprovar suas evidências através da aplicação de raciocínios desenvolvidos a partir de processos de dedução e, principalmente, de indução. Assim, a ausência ou a insuficiência de experimentos confiáveis, como, tam-bém, a incapacidade de sua reprodutibilidade, são elementos suficientes para que uma hipótese não possa ser considerada uma teoria, por isso, toda teoria científica é sempre uma hipótese, pois sempre poderá surgir um fato novo que irá destruí-la, transformando-a em um mito. Deste modo, sempre que algum fato contrarie a teoria científica, esta deverá ser abandonada ou modificada.

Considerando este tipo de raciocínio, não podemos confundir, como geralmente ocorre, fato e teoria científica, pois não representam a mesma coisa. Uma teoria científica é construída a partir de um determinado fato bem comprovado, e sua função é explicá-lo cientificamente, de tal modo que um modelo possa ser proposto para que a realidade do fato possa ser descrita e compreendida adequadamente. Outro ponto importante a ser considerado é o pensamento científico, o qual deverá assumir um caráter dinâmico e evolu-tivo, sempre selecionando a melhor ideia que possa explicar um determinado fato, pois o fato é sempre superior à ideia. Neste princípio fundamenta-se todo o processo da investigação científica. Tomemos, por exemplo, a comparação entre o pensamento científico e o pensamento religioso ou místico. No pen-samento místico religioso, a idéia é sempre superior ao fato, pois uma pessoa mística sempre defenderá o seu mito, mesmo que lhe sejam apresentados

BIOESTATISTICA_Vol_01.indb 35 25/06/12 17:11

Page 36: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental36

vários fatos que contradigam suas idéias, pois ela as coloca acima dos fatos. No pensamento científico, a lógica do raciocínio é inversa, os fatos se sobrepõem às idéias. Um cientista só acredita naquilo que efetivamente pode demonstrar ou provar cientificamente, mediante a aplicação de processos experimentais, tal como no processo de desenvolvimento de novas drogas através de experi-mentos laboratoriais e/ou ensaios clínicos randomizados. Acreditar no poder terapêutico de substâncias efetivamente não estudadas, como em alguns chás e ervas medicinais, não parece ser uma atitude segura, uma vez que o risco de insucesso quanto à cura é muito grande, pois, como foi dito pelo filósofo grego Demócrito (460 a.C. - 370 a.C), “A função da ciência é descrever a natureza da forma como ela é, e não da maneira que gostaríamos que ela fosse”.

Aqui, para ilustrar a importância da pesquisa científica, queremos enfa-tizar duas citações a respeito do tema; a primeira atribuída a Galileu Galilei (1564 -1642), e a segunda a Marcelo Gleiser (1959 - ), autor do livro “Poeira das Estrelas”. “Não interessa quem disse isso ou aquilo, a natureza não dá a menor bola para a autoridade. O único modo de aprender algo sobre os fenôme-nos naturais é mediante experimentos cuidadosos”. “Uma distinção importante entre ciência e religião é que, em ciência, as hipóteses precisam ser comprova-das experimentalmente”.

BIOESTATISTICA_Vol_01.indb 36 25/06/12 17:11

Page 37: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

2A Pesquisa Científica

Na prática, o que é uma pesquisa? De uma maneira bem direta, podemos dizer que uma pesquisa é uma busca, uma investigação que objetiva encontrar respostas a respeito de um determinado problema para o qual não se tem infor-mações concretas para solucioná-lo. Este é um conceito bastante abrangente, pois independe da área do conhecimento pesquisado ou do nível de comple-xidade da pesquisa. Agora, tomando-se como base o conceito de ciência, que afirma ser a busca do conhecimento perfeito, podemos, então, definir com mais clareza uma pesquisa científica, a qual é descrita como um processo formal e sistemático de atividades científicas desenvolvidas com a finalidade de obter conhecimento específico e estruturado a respeito de um determinado assunto de interesse. É, pois, a construção de conhecimento pela aplicação de investi-gação planejada e desenvolvida de acordo com as normas consagradas pela metodologia científica.

Com base neste raciocínio, podemos afirmar que uma pesquisa científica é a aplicação prática de um conjunto de procedimentos objetivos utilizados por um pesquisador (cientista) para o desenvolvimento de um experimento, a fim de produzir um novo conhecimento, além de integrá-lo àqueles pré-existentes. São, portanto, etapas ordenadamente dispostas de maneira lógica e racional, as quais o pesquisador deverá conhecê-las para aplicá-las convenientemente. Estas etapas, de maneira sucinta, incluem desde a escolha do tema a ser pesqui-

BIOESTATISTICA_Vol_01.indb 37 25/06/12 17:11

Page 38: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental38

sado, o planejamento da investigação, o desenvolvimento do método escolhido, a coleta e a tabulação dos dados, a análise dos resultados, a elaboração das conclusões, até a divulgação de resultados. Além disso, todos os procedimentos realizados durante uma pesquisa científica precisam ser fielmente documen-tados, inclusive os dados coletados, para que outros pesquisadores possam analisá-los e reproduzir o experimento. Na fase da análise dos dados, é conve-niente a aplicação de métodos estatísticos, sempre que possível, para que se possa verificar a confiabilidade e a reprodutibilidade dos resultados.

A seguir, passaremos a estudar, de maneira bastante objetiva, a organiza-ção estrutural de uma pesquisa científica, assim como os diferentes tipos de pesquisa e as linhas gerais para o desenvolvimento de um projeto. O estudo dos diferentes métodos de delineamento (desenho) da pesquisa científica será discutido, minuciosamente, no terceiro capítulo deste livro, pois, no nosso entendimento, saber delinear um experimento científico é ponto fundamen-tal para o sucesso de qualquer pesquisa. Portanto, para que um projeto de pesquisa seja considerado perfeito, pressupõe-se que o tipo de estudo a ser desenvolvido tenha sido adequadamente delineado.

2.1 ESTRUTURA DA PESQUISAEmbora os procedimentos adotados para a realização de uma pesquisa

científica possam variar nas diferentes áreas do conhecimento humano, em linhas gerais, eles apresentam, basicamente, a mesma estrutura. Isso inclui as partes mais tradicionalmente utilizadas nos diversos tipos de protocolo de pes-quisa. A saber: escolha do tema, elaboração do projeto de pesquisa, execução operacional do projeto, organização do material coletado, análise e discussão dos resultados, relatório final e divulgação dos resultados. Aqui uma explica-ção: geralmente, pesquisadores iniciantes costumam confundir as etapas para a realização de uma pesquisa científica com a elaboração de um projeto de pes-quisa, ou seja, confundem o protocolo com o projeto. Um projeto de pesquisa é somente um dos componentes de um protocolo de pesquisa, o qual deve ser bastante abrangente e composto de vários documentos, inclusive pelo próprio projeto de pesquisa. O protocolo de pesquisa é o documento onde estarão pre-vistos todos os passos para o desenvolvimento da pesquisa; é o instrumento utilizado pelo investigador para a solicitação de recursos financeiros, e, tam-

BIOESTATISTICA_Vol_01.indb 38 25/06/12 17:11

Page 39: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

a pesquisa científica 39

bém, um guia prático a ser utilizado para organizar a pesquisa de forma lógica e eficiente. Já o projeto de pesquisa é um documento mais restrito, onde esta-rão descritos todos os procedimentos que serão realizados na aplicação do método escolhido no delineamento da pesquisa, o qual deverá ser explicitado no protocolo. No projeto, deverão constar as diversas fases da aplicação do método, embora possa, também, conter partes em comum com o protocolo, tal como a revisão da literatura, os objetivos etc. Assim, de modo resumido, podemos dizer que o protocolo é responsável pelo planejamento da pesquisa, ao passo que o projeto é responsável pela execução da mesma.

Portanto, para a realização de uma pesquisa com o rigor científico que o método requer, pressupõe-se que o pesquisador escolha um tema de sua pre-ferência, defina o problema a ser investigado, elabore um plano de trabalho consistente e, após a execução operacional desse plano, compile e analise os resultados obtidos, e escreva um relatório final, o qual deve ser redigido de forma bem planejada, lógica e conclusiva. Todos estes procedimentos deverão ser executados em etapas conforme o quadro abaixo:

Quadro 2.1 – Fases propostas para a elaboração de um protocolo de pesquisa e seus respectivos procedimentos

Fases Procedimentos Objetivos propostos

De decisão

Escolha do tema • Indicar quais as questões que serão abordadas.

• Mostrar por que elas são importantes.

• Esclarecer o ponto forte da pesquisa.

• Demonstrar onde a pesquisa deseja chegar.

Formulação do problema (questão da pesquisa)

Justificativa

Revisão da literatura

Determinação dos objetivos

De execução

Elaboração do projeto de pesquisa (delineamento) • Demonstrar como o estudo será estruturado.

• Executar os procedimentos previstos.Execução operacional e coleta de dados

De análise

Tabulação e apresentação dos dados • Compor e organizar os dados coletados.

• Apreciar e comparar os dados coletados.Análise e discussão dos resultados

De redaçãoRedação e apresentação do relatório da pesquisa (dissertação ou tese).

• Publicar os resultados aferidos.

BIOESTATISTICA_Vol_01.indb 39 25/06/12 17:11

Page 40: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental40

Bem, se você chegou até aqui, não desista. Lembre-se que o protocolo é um documento mais abrangente, e substitui o anteprojeto, o qual é elaborado como uma versão inicial, um esboço de suas idéias a respeito da pesquisa pretendida. O protocolo deve ser mais bem elaborado e contém várias partes que serão discutidas em detalhes, a seguir.

2.1.1 Escolha do temaDefinida muitas vezes como “o problema da pesquisa”, a escolha do tema é

o primeiro passo para a definição do protocolo de pesquisa. Nesta etapa, o pes-quisador deverá perguntar: “O que, de fato, quero estudar?”. Uma vez respon-dida a pergunta, só então estará apto para prosseguir com a questão da pes-

quisa. Cabe aqui uma breve explicação a respeito do verdadeiro significado de tema e questão da pesquisa. O tema corresponde a um aspecto geral sobre uma área de interesse de um determinado assunto que se deseja estudar. Dentro do tema proposto, o investigador deverá selecionar a questão da pesquisa, a qual corresponde a uma parte delimitada do assunto escolhido; é, portanto, o objeti-vo do estudo, a incerteza que deverá ser investigada pelo autor da pesquisa. Ou seja, no estabelecimento da questão da pesquisa, o profissional deverá partir do assunto geral, o qual deverá ser desmembrado em tópicos específicos, em partes, e, então, escolherá uma ou duas dessas partes para elaborar o protocolo de pesquisa. Note que, até aqui, não se falou em projeto de pesquisa, pois este, como citado anteriormente, faz parte do protocolo, e a questão da pesquisa deverá ser selecionada antes que se possa começar a planejar o estudo. Vamos aos exemplos:

Exemplo 1 - Fontelles e Mantovani (2000) conduziram um estudo de coorte para verificar o uso de antibióticos associados à drenagem pleural fechada pós-traumatismo torácico

Área de interesse • Cirurgia torácica.

Tema escolhido • Drenagem pleural fechada.

Questão da pesquisa• Uso da antibioticoterapia associada à drenagem

pleural fechada.

Perguntas a serem respondidas

• Está indicado o uso da antibioticoterapia associada à drenagem pleural fechada?

• O uso da antibioticoterapia reduz o tempo de internação dos pacientes?

BIOESTATISTICA_Vol_01.indb 40 25/06/12 17:11

Page 41: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

a pesquisa científica 41

Exemplo 2 – Simões e Queiroz (2002) conduziram um estudo experimental, em ratos, para veri-ficar a qualidade da proteína do extrato hidrossolúvel de soja como fonte de alimento.

Área de interesse • Nutrição humana.

Tema escolhido • A proteína de soja como fonte de alimento.

Questão da pesquisa • Digestibilidade da proteína de soja.

Perguntas a serem respondidas

• O extrato hidrossolúvel (EHS) de soja pode ser utilizado como fonte protéica? • A proteína da soja tem a sua digestibilidade comparada à caseína? • Qual o equivalente nutricional da proteína de soja em relação à caseína?

Voltando ao tema, este deve ser escolhido segundo alguns critérios práti-cos. De modo geral, tal como ocorre com pesquisadores iniciantes, entre eles os alunos de programas de mestrado ou doutorado, o tema é proposto pelo profes-sor orientador, pois este já dispõe de uma linha de pesquisa bem consolidada. Nesses casos, o aluno-pesquisador toma para si uma das questões propostas pelo professor. Aqui, nada impede que um aluno criativo possa propor uma nova abordagem sobre o tema proposto. Por outro lado, quando se trata de pesquisadores mais experientes, seus estudos anteriores podem ter mostrado novos problemas que carecem, também, de soluções, as quais podem ser testa-das com novas pesquisas. Ou seja, mesmo que possamos responder a algumas questões, outras surgem no decorrer de um experimento, e que podem ser estudadas, posteriormente, com o emprego de novas pesquisas. Essa é a dinâ-mica evolutiva da ciência. Da mesma maneira, a escolha do tema pode advir da própria experiência profissional do dia-a-dia, ou mesmo pela consulta a textos da literatura especializada, porém o fato é que o seu tema escolhido seja rele-vante em termos científico, pois deve propiciar novos conhecimentos à área de estudo, assim como benefícios para a sociedade.

2.1.2 Formulação do problema (questão da pesquisa)Uma vez que o tema tenha sido selecionado, a formulação do problema é o passo seguinte, e de sua correta formulação dependerá o sucesso da pesquisa. Lembre sempre: todos os procedimentos propostos para a realização da pes-quisa deverão ser planejados no sentido de solucionar ou esclarecer o problema proposto. A ordem correta de raciocínio é: “qual é a questão que necessita de investigação e/ou solução?” “O que ela causa?” “O que a minha pesquisa irá contribuir para solucioná-la”?

BIOESTATISTICA_Vol_01.indb 41 25/06/12 17:11

Page 42: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental42

As características de uma boa questão de pesquisa estão mostradas no Quadro 2.2, tal como propostas Cummings, Browner e Hulley (2003), no livro “Delineando a Pesquisa Clínica – Uma Abordagem Epidemiológica”, onde estas características básicas são representadas pelo acrônimo FINER: factível, inte-ressante, nova (inovadora), ética e relevante.

Quadro 2.2 – Critério FINER para uma boa questão de pesquisa. Adaptado do livro “Delineando a Pesquisa Clínica – Uma Abordagem Epidemiológica”, Artmed Editora, 2003

Característica Requisitos

Factível

• Número adequado de sujeitos.• Domínio técnico adequado.• Viável em termos de tempo e custos.• Escopo manejável.

Interessante • Para o investigador.

Nova (Inovadora)• Confirma ou refuta achados anteriores.• Expande os achados anteriores.• Fornece novos achados.

Ética• Cumpre as normas da resolução CNS196/961.• Cumpre as normas das demais resoluções do CNS.

Relevante• Para o conhecimento científico.• Para diretrizes clínicas e de saúde.• Para direcionamentos futuros de pesquisa.

O quadro sintetiza as principais características da questão da pesquisa e seus respectivos requisitos de aplicação. Assim, para que uma questão de pesquisa seja considerada satisfatória, ela deverá apresentar as seguintes características:

Factível

A pesquisa da maneira como está sendo planejada é possível de ser rea-lizada? Os pesquisadores envolvidos têm domínio do assunto e experiência suficientes para realizá-la? O tempo e os recursos disponíveis são suficientes? Estas são algumas perguntas que deverão ser feitas, e respondidas, antes de

1. Resolução do Conselho Nacional de Saúde (CNS), Nº 196, de 10 de outubro de 1996, que trata das Diretrizes e Normas Regulamentadoras de Pesquisas Envolvendo Seres Humanos no Brasil.

BIOESTATISTICA_Vol_01.indb 42 25/06/12 17:12

Page 43: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

a pesquisa científica 43

iniciar qualquer tipo de pesquisa. De modo geral, as investigações científicas tra-balham com mais de uma questão, mas é sempre aconselhável enfocar aquela de maior relevância ao delinear um estudo. Esta será a questão principal que deverá servir como base para o plano de estudo e para o cálculo do tamanho da amostra.

Um pesquisador deve conhecer seus limites, assim como os recursos dispo-níveis, antes de enveredar por um caminho que não pode trilhar. Isso evita o gasto de tempo e de recursos materiais e financeiros. Ao longo de nossa experiência, temos verificado que pesquisadores iniciantes têm uma tendência de fazer de seu primeiro projeto a “pesquisa de sua vida”, onde pretendem, de maneira nem sempre sensata, agrupar inúmeras questões, as quais aumentam a complexidade do delineamento, da execução do estudo e das inferências estatísticas, além de gerar múltiplas hipóteses impossíveis de serem testadas ao final do experimento. Da mesma maneira, quando agrupamos mais de uma questão relevante em um mesmo estudo, na verdade, estamos englobando dois ou mais experimentos em um só. Neste caso, o bom senso manda que este estudo seja desmembrado e os experimentos executados isoladamente, em dois ou mais estudos distintos. Portanto, se uma questão lhe parece complexa demais, desmembre-a, escolha aquela principal e estude as questões secundárias separadamente.

De qualquer forma, todo problema é passível de ser reformulado para faci-litar a execução do projeto; é sempre possível rever um tema ou uma questão de pesquisa. Se esta não lhe parece factível, reavalie-a. Se o estudo lhe parece muito amplo e abrangente, é sempre possível escolher um conjunto menor de variáveis para o novo estudo ou restringir os seus objetivos. Caso o número de sujeitos disponíveis para o estudo seja insuficiente, devemos rever nossas estratégias de seleção, tais como: aumentar os critérios de inclusão e modificar os critérios de exclusão; procurar por outras fontes de sujeitos; expandir a duração do estudo; reavaliar a estratégia para o cálculo do tamanho da amostra (será discutido em outro capítulo). Se suas habilidades estão aquém daquelas exigidas pelo protoco-lo, aprenda-as, associe-se a pesquisadores mais experientes ou procure métodos alternativos na literatura especializada. Finalmente, se estudo proposto tem cus-to muito elevado, impossível de ser realizado, reconsidere seus gastos, procure métodos menos dispendiosos e reduza o número das medições. É sempre bom lembrar que todas estas medidas não devem comprometer a qualidade do estu-do, sob pena de invalidá-lo.

BIOESTATISTICA_Vol_01.indb 43 25/06/12 17:12

Page 44: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental44

Interessante

É igualmente importante que o objeto da pesquisa desperte o interesse do pesquisador, e muitos são os motivos que podem despertar esse interesse. O crescimento profissional é um motivo importante e deve ser construído passo a passo ao longo de sua carreira e, cada pesquisa é um ponto a mais. No entanto, a construção do conhecimento é aquele que parece ser a motiva-ção mais considerada pela maioria dos pesquisadores. Todos sabem o quanto é estafante trabalhar naquilo que não nos é interessante. Assim também ocorre nos laboratórios de pesquisa. Este é um risco que correm os alunos de iniciação científica ou dos programas de mestrado e doutorado, quando são incorpora-dos em projetos que, embora sejam interessantes para os orientadores, não despertam nenhum interesse dos alunos.

Nova (inovadora)

Uma pesquisa é a construção de conhecimento original, segundo certas exigências científicas. É, pois, um conjunto de atividades cujo objetivo é desen-volver ou contribuir para o conhecimento generalizável, que consiste em teorias, princípios ou acúmulo de informações corroboradas por métodos científicos aceitos a partir de observações e inferências estatísticas. Toda boa pesquisa deve produzir novos conhecimentos, ou, pelo menos, questionar ou confirmar se um achado anterior pode ser repetido ou não, ou, ainda, se os resultados obtidos para uma determinada população são aplicáveis a outra. Ademais, uma pesquisa científica não precisa ser totalmente inédita, porém repetir estudos cujos resultados já estão bem estabelecidos pela comunidade científica não é justificado, uma vez que desperdiçam trabalho, tempo e recursos.

Aqui vale uma ressalva: o caráter inédito de uma pesquisa científica depende, também, de sua finalidade, se básica ou aplicada, ou do nível acadêmico de sua aplicação. Para uma tese de doutorado, o objeto da pesquisa deverá ser inédito, porém, nos curso de graduação, onde os alunos necessitam desenvolver uma pes-quisa como pré-requisito para integralizar o trabalho de conclusão de curso, o fator inovador da pesquisa não é o item fundamental, embora seja desejável. Nesse caso, o fator mais importante é o aprendizado, isto é, o aluno deverá comprovar, ao final do curso, se aprendeu a escrever e a desenvolver um projeto de pesquisa. Aqui, o valor acadêmico do trabalho preponderará sobre o valor científico.

BIOESTATISTICA_Vol_01.indb 44 25/06/12 17:12

Page 45: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

a pesquisa científica 45

Ética

O primeiro ponto a ser considerado: “se uma pesquisa não é cientifica-mente correta, ela não é ética”. A resolução CNS 196/96 considera que toda pesquisa envolvendo seres humanos, direta ou indiretamente, envolve risco, podendo o dano eventual ser imediato ou tardio, no indivíduo ou à coletividade. Por este motivo, todas as pesquisas envolvendo seres humanos devem atender às exigências éticas e científicas fundamentais, que implicam consentimento livre e esclarecido dos indivíduos pesquisados, proteção de grupos vulnerá-veis e dos legalmente incapazes (princípio da autonomia). Potenciais riscos e benefícios deverão ser ponderados, individuais ou coletivos, comprometendo--se, a pesquisa, com o máximo de benefícios e o mínimo de danos (princípio da beneficência), além da relevância social, com vantagens significativas para os sujeitos e minimização do ônus para os vulneráveis, o que garante a igual consideração dos interesses envolvidos sem perder o sentido de sua destinação sócio-humanitária (princípio da justiça e equidade). Para melhores esclareci-mentos, o leitor deverá consultar a resolução CNS 196/96.

Relevância

Este é, sem dúvida, o requisito mais importante de uma boa questão de pesquisa. Sua relevância está no fato de mostrar e justificar como o estudo pre-tendido poderá ser inserido em um contexto mais amplo. Por que essa questão é importante e como suas respostas poderão contribuir para os avanços científico e tecnológico, de tal modo que possa influenciar em futuras decisões no âmbito do desenvolvimento social.

2.1.3 Revisão da literatura (pesquisa bibliográfica)É um passo fundamental, especialmente para o pesquisador iniciante.

Como em todas as áreas de atividade, e também na pesquisa, o domínio da lite-ratura publicada é muito importante. É nesta etapa que o investigador tomará conhecimento a respeito do “estado da arte” do assunto a ser pesquisado. É através da revisão ampla da literatura que o pesquisador passará a conhecer sobre quem escreveu, o que já foi publicado, quais aspectos foram abordados e as dúvidas sobre o tema ou sobre a questão da pesquisa proposta. Ao conhecer sobre o tema, o investigador poderá fornecer a melhor fundamentação teórica

BIOESTATISTICA_Vol_01.indb 45 25/06/12 17:12

Page 46: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental46

que dará suporte e irá justificar a sua proposta, além de definir, com mais pre-cisão, os objetivos de sua pesquisa, evitando a repetição, na íntegra, de estudos anteriores, já bem estabelecidos pela comunidade científica.

É válido salientar que, para tornar o processo de revisão mais produtivo, o autor da pesquisa deverá adotar uma postura metódica, sistematizada, inerente à pesquisa bibliográfica, a qual é baseada na literatura publicada em forma de livros, em revistas especializadas sobre o assunto, escritas ou eletrônicas; em jornais e revistas, em sites da Internet, especializados ou de busca etc. Outras importantes fontes de pesquisa são os eventos científicos, como congressos e seminários, ou mesmo, a consulta direta a pesquisadores mais experientes com reconhecido saber sobre a área de interesse.

Mas, de qualquer forma, o autor da pesquisa deverá estar familiarizado com as diferentes fontes de informação e escolher aquela mais favorável para fazer o levantamento bibliográfico de sua pesquisa. Essas fontes são convenientemente organizadas de modo a facilitar o processo de busca em sua base de dados. Cada uma delas dispõe de um sistema que indexa estas informações por autor, título e assunto, e podem estar disponíveis em for-mato impresso (periódicos, p. ex.) ou digital (CD-ROM ou on line), sendo esta última a preferida em razão de sua praticidade, com melhor relação custo--benefício. Cada fonte, em particular, adota critérios próprios para liberação das informações. Algumas fornecem, gratuitamente, apenas o resumo e as referências bibliográficas (bases referenciais), outras disponibilizam o texto completo (full text).

Cada pesquisador deverá procurar, em sua universidade ou instituição de pesquisa, quais as bases de dados disponíveis para consulta, ou, então, associar--se a uma delas. Para o ponto de partida, sugerimos como fonte de informação digital, as seguintes:

•ScienceDirect – É uma base de dados que oferece mais de 2.000 periódi-cos científicos, milhares de livros, manuais e trabalhos de referência, em plataforma digital, que pode ser acessada diretamente de um microcom-putador conectado à Internet, de uma universidade associada. Esta base de dados contempla as áreas da física e das engenharias, ciências da vida, ciências da saúde, ciências sociais e das humanidades.

BIOESTATISTICA_Vol_01.indb 46 25/06/12 17:12

Page 47: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

a pesquisa científica 47

•Biblioteca Virtual em Saúde (BVS) – Base de dados coordenada pela Biblioteca Regional de Medicina (BIREME), é um centro especializado da Organização Pan-americana de Saúde (OPAS), estabelecido no Brasil desde 1967, em colaboração com o Ministério da Saúde, Ministério da Educação, Secretaria da Saúde do Estado de São Paulo e Universidade Federal de São Paulo. A BVS contempla informações para pesquisa bibliográfica na área das ciências da saúde mediante consulta às bases de dados LILACS (Literatura Latino Americana das Ciências da Saúde), MEDLINE, Biblioteca Cochrane e SciELO (Scientific Eletronic Library ON line), além de outras áreas espe-cializadas e internacionais, como a base de dados da Organização Mundial de Saúde (OMS).

•Web of Science (WoS) – Base de dados de referências bibliográficas do Institute for Scientific Information (ISI), que contém informações publica-das nos periódicos indexados em todas as áreas do conhecimento, desde 1945. A WoS provê um acesso livre às informações multidisciplinares de aproximadamente 14.000 dos mais prestigiados periódicos de alto impacto2 publicados na literatura científica mundial. O acesso ao WoS é feito a partir de qualquer microcomputador conectado à internet pela sua universidade, e sua base é composta por três bancos de dados, o Science Citation Index

Expanded (5.300 periódicos e mais de 24 milhões de artigos catalogados), o Social Sciences Citation Index (1.700 periódicos e mais de 2,8 milhões de artigos catalogados) e o Arts & Humanities Citation Index (1.100 peri-ódicos catalogados e mais de 6.800 periódicos dos outros bancos). O ISIS também publica o Journal Citation Reports, o qual lista o fator de impacto para cada periódico, permitindo ao pesquisador identificar quais os artigos científicos citados mais frequentemente e quem fez a citação.

2.1.4 JustificativaNesta etapa, o pesquisador mostra “o porquê” da realização do estudo. É

nesta parte do protocolo que o investigador deverá, de maneira bastante satis-

2. Fator de impacto (FI) - É a média obtida entre o número de citações a um determinado periódico, nos últimos dois anos, e o número de artigos publicados por este periódico, também nos últimos dois anos, levantada no Journal of Citation Report do Institute for Scientific Information.

BIOESTATISTICA_Vol_01.indb 47 25/06/12 17:12

Page 48: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental48

fatória, justificar e convencer quem for avaliar o projeto sobre a importância da realização da pesquisa, em especial, para a agência de fomento que for dis-ponibilizar o suporte financeiro. Tem que mostrar quais os seus pontos positi-vos, e porque chegar à verdade sobre o assunto escolhido é interessante para a ciência.

2.1.5 Determinação dos objetivosEsta parte mostra qual ou quais são as intenções do pesquisador em rela-

ção ao tema proposto para a pesquisa. É aqui onde será informada a proposta da pesquisa, ou seja, quais os resultados pretendidos ou quais as contribuições que a pesquisa irá proporcionar ao conhecimento científico.

Tradicionalmente, os projetos de pesquisa contemplam dois tipos de objetivo: o geral e os específicos. Ambos sintetizam o que o investigador pretende esclarecer com a pesquisa e devem ser coerentes com o pro-blema proposto e com a justificativa fornecida pelo autor. No objetivo geral, o pesquisador propõe uma síntese dos resultados que pretende alcançar com a pesquisa; nos objetivos específicos, ele detalha as propostas desdo-bradas a partir do objetivo geral. Como regra, a boa técnica para enunciar o objetivo é começar a sua redação com um verbo no infinitivo, o qual deverá exprimir uma ação bem definida, possível de ser executada e de ser mensu-rada. Alguns exemplos: esclarecer, explicar, demonstrar, identificar, analisar, avaliar, estimar etc.

2.1.6 Elaboração do projeto de pesquisaUma vez escolhido o tema, definida a questão da pesquisa e determinados

os objetivos, a elaboração do projeto corresponde à etapa mais importante para a implementação de um protocolo de pesquisa. Esta é a parte de maior comple-xidade, pois, do correto delineamento (desenho) do projeto depende o sucesso na obtenção das respostas esperadas pela questão da pesquisa. Assim, delinear uma pesquisa é, em última análise, planejar a realização de sua parte científica operacional, tanto experimental como observacional; ou seja, é escrever corre-tamente um projeto onde estarão previstas todas as etapas de sua realização. Por isso, em razão de sua grande importância, a estrutura de um projeto, assim como os diferentes modelos de delineamento serão discutidos mais detalhada-

BIOESTATISTICA_Vol_01.indb 48 25/06/12 17:12

Page 49: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

a pesquisa científica 49

mente em capítulos separados, pois acreditamos que o amplo conhecimento do desenho do estudo seja o fator mais relevante para a elaboração do projeto e para a compreensão dos seus resultados e conclusões. Portanto, é aconselhável que o leitor menos experiente deva, primeiro, entender a lógica da condução de uma pesquisa no seu aspecto mais geral e, somente depois desta etapa, apren-der as particularidades dos diferentes tipos de delineamentos.

Como regra geral, a função básica de um bom projeto de pesquisa é per-mitir uma comparação satisfatória entre diferentes variáveis dos grupos de sujeitos incluídos no estudo. Essa comparação pode ocorrer em um determi-nado ponto no tempo ou, em alguns casos, entre um grupo antes e depois de receber uma intervenção ou ter sido exposto a um determinado fator de risco, assim como, permitir que uma possível diferença seja quantificada em termos absolutos e relativos. Outra função importante do delineamento é minimizar os erros (vieses), evitar os fatores de confundimento e outras intercorrências que possam interferir na interpretação dos resultados. É nesta etapa, portanto, que o pesquisador deverá se decidir a respeito da população e dos sujeitos que serão estudados, sobre o tipo de estudo que será aplicado no projeto, se experi-mental ou observacional, se prospectivo ou retrospectivo, e escolher, dentre os diversos delineamentos, qual aquele que melhor se aplica à sua pesquisa. Aqui um aviso: muitos pesquisadores iniciantes já descobriram, de uma forma bas-tante decepcionante, que um erro no planejamento de um experimento pode levar a resultados tão inúteis que nem o mais sofisticado dos processos estatís-ticos poderá salvá-lo da inutilidade.

2.1.7 Execução operacional do projeto (coleta de dados)Esta etapa é referente à execução do projeto em si; é a fase na qual o pes-

quisador vai a campo para implementar todas as ações previstas no projeto inicial. É a parte referente à coleta de material para análise. Se o projeto foi delineado de forma correta e os procedimentos previstos para a sua realiza-ção foram planejados de maneira consistente, tais como medições e exames laboratoriais, a probabilidade de obter uma resposta correta e chegar a con-clusões acertadas a respeito do fenômeno estudado são muito grandes. É nesta etapa que o pesquisador-coordenador deverá mostrar toda a sua experiência

BIOESTATISTICA_Vol_01.indb 49 25/06/12 17:12

Page 50: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental50

e dedicação, pois não basta planejar bem um projeto de pesquisa, é necessá-rio, também, desenvolvê-lo de maneira correta, conforme previsto no plano de trabalho. Lembre-se sempre: nesta etapa, a paciência e a persistência são fun-damentais, e não mais serão aceitos erros de sistematização ou de medição. O primeiro é introduzido por falha no planejamento, no desenho do estudo; o segundo, por descuido (ou descaso) de quem executa o projeto. Esses tipos de erros serão discutidos, nos seus pormenores, no capítulo seis deste livro, que trata da coleta e análise de dados.

Com o objetivo de identificar possíveis erros no planejamento da pesquisa e minorar os vieses na execução dos procedimentos previstos no projeto, é sempre aconselhável, nesta etapa, a implementação de um estudo (projeto) piloto, pois é ele que irá testar e validar o método, além de fornecer subsídios para o cál-culo final do tamanho da amostra. É no estudo piloto que a equipe irá adquirir o treinamento necessário para operar equipamentos laboratoriais, familiarizar-se com o manuseio de animais, adquirir destreza para procedimentos terapêuti-cos e cirúrgicos, assim como rever os formulários e os questionários que serão aplicados no decorrer da pesquisa, por exemplo. O estudo-piloto garante a uni-formidade e a padronização na execução do projeto; é ele que “arredonda” o método. Aqui uma observação: se o estudo piloto for bem executado e os seus resultados se mostrarem livres de vícios e tendenciosidades, os seus dados pode-rão, a critério do pesquisador, ser incluídos nos resultados da pesquisa.

2.1.8 Organização do material coletadoUma vez que a pesquisa tenha terminado, sobrará um amontoado de da-

dos, de informações numéricas ou textuais. Nesta fase, serão processadas a tabulação e apresentação destes dados. Aqui é importante que o pesquisador planeje como processar e analisar os dados do estudo, de tal maneira que ele possa alcançar um nível aceitável de precisão nos cálculos estatísticos. Esta é uma condição fundamental, pois é preciso selecioná-los, agrupá-los em tópicos e, somente depois, analisá-los.

Atualmente, com o advento dos recursos computacionais, esta tarefa ficou mais amena, e com a utilização de softwares estatísticos para o manejo das informações, os procedimentos para a organização e resumo de grandes quan-tidades de dados ficaram mais precisos e seguros. Estes recursos da informática

BIOESTATISTICA_Vol_01.indb 50 25/06/12 17:12

Page 51: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

a pesquisa científica 51

dão-nos suporte para a elaboração de índices e cálculos estatísticos, confecção de gráficos, tabelas e quadros. Lembre-se também: em uma pesquisa científica, a função mais importante da estatística não é a análise dos dados, e sim o pla-nejamento do experimento que produzirá esses dados.

2.1.9 Análise e discussão dos resultadosEsta é a fase da interpretação e da análise dos dados tabulados e organi-

zados na etapa anterior. Nesta etapa, é fundamental que o pesquisador tenha os conhecimentos básicos de estatística descritiva e dos processos de teste de hipótese. Os objetivos da pesquisa somente poderão ser considerados como alcançados após a análise e a comparação dos dados obtidos em cada um dos grupos estudados. É a confrontação destes dados que irá confirmar ou rejei-tar as hipóteses previstas no início da pesquisa, assim como permitirá a sua discussão e comparação com dados publicados na literatura. De posse destas análises e discussão, o pesquisador poderá, então, relatar a contribuição do seu estudo para o desenvolvimento da ciência.

Novamente, gostaríamos de ressaltar a importância do emprego da esta-tística como ferramenta de análise de dados. Como já citado anteriormente, é a estatística que irá validar o método, indicar os testes de significância, calcular o erro inerente à pesquisa e garantir a reprodutibilidade do experimento.

2.1.10 Relatório final e divulgação dos resultadosÉ a fase da redação final, que poderá ser escrito sob a forma de relatório de

pesquisa, trabalho de conclusão de curso, dissertação ou tese. Em geral, a for-matação do texto obedece a normas de documentação da Associação Brasilei-ra de Normas Técnicas (ABNT), porém as normas próprias de cada instituição deverão ser consultadas, mas, de qualquer modo, o texto deverá ser redigido com a beleza técnica que a metodologia científica requer, isto é, deve ser tec-nicamente correto, claro nas idéias, preciso nas afirmações e nas conclusões e, acima de tudo, agradável ao leitor. Estes textos também poderão ser, a critério do autor, publicados na íntegra, sob a forma de livro, ou, de maneira resumida, publicados em revistas especializadas sob a forma de artigos originais. Não es-queça: uma pesquisa que não tem os seus resultados publicados, não cumpriu sua função social, e é, portanto, destituída de qualquer valor científico.

BIOESTATISTICA_Vol_01.indb 51 25/06/12 17:12

Page 52: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental52

2.2 TIPOS DE PESQUISA CIENTÍFICAUma das maiores dificuldades que um pesquisador iniciante pode enfrentar

é entender que existem várias maneiras de se conduzir uma mesma pesquisa, e que ele deve saber enquadrar o seu estudo nos diferentes tipos propostos pela metodologia científica. Para isso, ele deverá estar familiarizado com estes diferentes tipos e suas diversas classificações. Do mesmo modo, deverá enten-der que estes tipos não são estanques, e que uma mesma pesquisa pode ser enquadrada em várias classificações, ao mesmo tempo, e, em alguns casos, as diferenças são muito sutis. Assim, somente após entender essas diferenças, o pesquisador estará apto para delinear (desenhar) corretamente o seu estudo. Portanto, para um pesquisador que pretende planejar uma pesquisa, a sequên-cia correta do raciocínio é: primeiro ele deve escolher, entre os diversos tipos de pesquisa, aquele que melhor se enquadra na população estudada e que melhor atende aos seus objetivos; segundo, definir o melhor delineamento a ser utilizado para que os procedimentos metodológicos possam ser emprega-dos e os objetivos alcançados.

Com base neste princípio, podemos observar que um mesmo tipo de pes-quisa pode ser delineado de diferentes maneiras. Tomemos, com exemplo, um estudo observacional (tipo de pesquisa). Este pode ser delineado como um estudo de coorte ou como um estudo caso-controle, ambos definidos como deli-neamentos de características diferentes. Neste tópico, abordaremos os tipos de pesquisa científica. Os diferentes tipos de delineamentos serão descritos, em detalhes, no capítulo três deste livro.

Assim, como vimos, existem várias maneiras de classificar uma pesquisa, e os autores não são unânimes quanto à padronização desta classificação. Por esse motivo, propomos uma maneira mais simples e mais objetiva, como mos-trado no Quadro 2.3.

2.2.1 Quanto à finalidadePesquisa básica ou fundamental

É a pesquisa cujo objetivo é adquirir conhecimentos novos que contri-buam para o avanço da ciência, sem que haja uma aplicação prática prevista. Neste tipo de pesquisa, o investigador acumula conhecimentos e informações que podem, eventualmente, levar a resultados acadêmicos ou aplicados impor-

BIOESTATISTICA_Vol_01.indb 52 25/06/12 17:12

Page 53: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

a pesquisa científica 53

tantes. Há autores que incluem, neste tipo, as pesquisas acadêmicas, aquelas realizadas nas instituições de ensino superior como parte das atividades de ensino-aprendizagem, tal como nos trabalhos de conclusão de curso.

Pesquisa aplicada ou tecnológica

É o tipo de pesquisa cujo objetivo é produzir conhecimentos científicos para aplicação prática voltada para a solução de problemas concretos, espe-cíficos da vida moderna. É a pesquisa que, além de produzir conhecimento, gera novos processos tecnológicos e novos produtos, com resultados práticos imediatos em termos econômicos e na melhoria da qualidade de vida. Um dos grandes desafios para o desenvolvimento científico tecnológico de um país é promover o inter-relacionamento entre pesquisa acadêmica, pesquisa básica e pesquisa aplicada em todas as áreas de conhecimento.

Quadro 2.3 – Tipos de pesquisa conforme a sua classificação

Classificação Tipos de pesquisa

Quanto à finalidade• Pesquisa básica ou fundamental.

• Pesquisa aplicada ou tecnológica.

Quanto à natureza• Pesquisa observacional.

• Pesquisa experimental.

Quanto à forma de abordagem

• Pesquisa qualitativa.

• Pesquisa quantitativa – Descritiva.

– Analítica.

Quanto aos objetivos• Pesquisa exploratória.

• Pesquisa explicativa.

Quanto aos procedimentos técnicos

• Pesquisa bibliográfica.

• Pesquisa documental.

• Pesquisa de laboratório.

• Pesquisa de campo.

Quanto ao desenvolvimento no tempo

• Pesquisa transversal.

• Pesquisa longitudinal.

• Pesquisa prospectiva.

• Pesquisa retrospectiva.

BIOESTATISTICA_Vol_01.indb 53 25/06/12 17:12

Page 54: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental54

2.2.2 Quanto à naturezaPesquisa observacional

Como o nome supõe, neste tipo de estudo, o investigador atua meramente como expectador de fenômenos ou fatos, sem, no entanto, realizar qualquer intervenção que possa interferir no curso natural e/ou no desfecho dos mes-mos, embora possa, neste meio tempo, realizar medições, análises e outros procedimentos para coleta de dados. Na prática, um estudo observacional não precisa, necessariamente, ser desenvolvido como uma pesquisa de campo, ou como um ensaio clínico em um hospital, ele pode, também, ser realizado em laboratórios de pesquisa. Como um bom exemplo de estudo observacio-nal, citamos o Framinghan Heart Study, o mais famoso estudo de coorte do mundo, iniciado em 1948 e conduzido pelo National Heart, Lung, and Blood Institute (NHLBI). Neste estudo, os pesquisadores recrutaram, na cidade de Framigham, Massachusetts, 5.209 homens e mulheres na faixa etária de 30 a 62 anos, e os vêm acompanhando, desde então, para identificar estilo de vida e os fatores de risco associados à doença cardiovascular. O Framinghan

Heart Study já produziu cerca de 1.200 artigos científicos publicados em peri-ódicos especializados.

As pesquisas observacionais podem ser conduzidas sob a forma de quatro tipos de estudo, conforme o delineamento. São eles: série de casos, estudo de corte transversal, estudo de coorte e estudo caso-controle. Cada um deles será discutido, detalhadamente, no capítulo três deste livro.

Pesquisa experimental

É, pois, toda pesquisa que envolve algum tipo de experimento. Diferentemente do observacional, no estudo experimental, o pesquisador parti-cipa ativamente na condução do fenômeno, processo ou do fato avaliado, isto é, ele atua na causa, modificando-a, e avalia as mudanças no desfecho. Neste tipo de pesquisa, o investigador seleciona as variáveis que serão estudadas, define a forma de controle sobre elas e observa os efeitos sobre o objeto de estudo, em condições pré-estabelecidas. Assim, pelo fato das variáveis, ou da variável, poderem ser manipuladas pelo pesquisador, equívocos e vieses praticamente desaparecem, sendo, por esta razão, considerada como o melhor tipo de pes-quisa científica, pois proporciona maior confiabilidade em seus resultados.

BIOESTATISTICA_Vol_01.indb 54 25/06/12 17:12

Page 55: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

a pesquisa científica 55

Tradicionalmente realizada em laboratórios, com animais de experimen-tação, a pesquisa experimental também pode ser conduzida como pesquisa de campo ou como ensaios clínicos controlados ou não. Um bom exemplo de pes-quisa experimental é o estudo conduzido por um pesquisador que deseja testar uma nova droga inibidora da enzima conversora de angiotensina (ECA) para controle da hipertensão arterial, em ratos Wistar3. Neste estudo, os ratos são separados em dois grupos de 10 animais cada; o grupo experimental recebe a droga a ser testada, ao passo que o grupo controle recebe um placebo4. O comportamento da variável hipertensão é avaliado em relação ao uso da droga, comparativamente ao uso do placebo. No estudo, o pesquisador atua na causa da hipertensão arterial, quando ministra a droga e observa o efeito sobre o desfecho.

Os mais tradicionais tipos de delineamento da pesquisa experimental são os estudos controlados (duplo-cego, randomizado, não-randomizado, autocon-trolado e com controle externo) e não-controlados, os quais serão discutidos, em detalhes, no capítulo três deste livro.

2.2.3 Quanto à forma de abordagemPesquisa qualitativa

É o tipo de pesquisa apropriada para quem busca o entendimento de fenô-menos complexos específicos, em profundidade, de natureza social e cultural, mediante descrições, interpretações e comparações, sem considerar os seus aspectos numéricos em termos de regras matemáticas e estatísticas. Diferente da quantitativa, a pesquisa qualitativa é mais participativa, porém menos controlável, e, por esta razão, tem sido questionada quanto a sua validade e confiabilidade, particularmente, quando comparada com as metodologias utili-zadas pela pesquisa quantitativa, esta mais precisa.

A validação de uma pesquisa qualitativa não costuma ser imediata, pois depende de observações, registros e análises subjetivas do comportamento humano, de interações entre pessoas, sistemas sociais, e a confiabilidade

3. Rattus norvegicus albinus (Rodentia, Muridae). Animal de laboratório largamente utilizado em experimentos científicos. Os animais da linhagem SHR-Wistar apresentam hipertensão arterial.

4. Placebo - Substância inócua ou farmacologicamente inativa, com as mesmas características do medicamento original tal como cor, forma, aroma etc.

BIOESTATISTICA_Vol_01.indb 55 25/06/12 17:12

Page 56: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental56

conferida aos seus resultados depende muito da credibilidade e do conceito profissional de quem a realiza, daí ser vista com desconfiança por investi-gadores das ciências exatas e da saúde. Já a pesquisa quantitativa, se bem conduzida, pode ser validada de imediato, pois resultados matemáticos estão menos sujeitos a críticas. Por outro lado, na qualitativa, os sujeitos não são reduzidos a hipóteses ou números, mas vistos como parte de um todo, em seu contexto social natural. A pesquisa qualitativa considera que, ao reduzir pessoas a dados estatísticos, perde-se de vista a natureza subjetiva do com-portamento humano.

Aqui é importante frisar que, as pesquisas quantitativas também analisam qualidades nos seus métodos de estudo, assim como todos os pesquisadores qualitativos descrevem importantes quantidades em seus relatos. Estudar o comportamento social de uma comunidade, frente a uma nova seita religiosa é um exemplo razoável de uma pesquisa qualitativa.

Pesquisa quantitativa

É aquela que trabalha com variáveis expressas sob a forma de dados numé-ricos e emprega rígidos recursos e técnicas estatísticas para classificá-las e analisá-las, tais como a porcentagem, a média, o desvio padrão, o coeficiente de correlação e as regressões, entre outros. Em razão de sua maior precisão e confiabilidade, os estudos quantitativos são mais indicados para o planeja-mento de ações coletivas, pois seus resultados são passíveis de generalização, principalmente quando as amostras pesquisadas representam, com fidelidade, a população de onde foram retiradas.

Na prática, nos estudos quantitativos, o pesquisador irá tratar com números, geralmente com um amontoado deles, e para tanto, deverá estar fami-liarizado com os procedimentos de análise indutiva, pois, como os números não vêm com suas próprias interpretações, é o pesquisador que deve colocar as interpretações nesses números, isto é, o pesquisador deverá encontrar as relações entre eles, criar fórmulas matemáticas que possam fazer previsões e testar as hipóteses formuladas. Nas pesquisas quantitativas, estas interpreta-ções são importantes, porém, quanto maior a complexidade dos dados, maior é a dificuldade em interpretá-los, e maior é a necessidade de análises estatísticas mais sofisticadas.

BIOESTATISTICA_Vol_01.indb 56 25/06/12 17:12

Page 57: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

a pesquisa científica 57

De acordo com a complexidade da apresentação e da análise dos dados, uma pesquisa quantitativa pode ser classificada em descritiva ou analítica.

Pesquisa descritivaÉ aquela que visa apenas a observar, registrar e descrever as características

de um determinado fenômeno ocorrido em uma amostra ou população, sem, no entanto, analisar o mérito de seu conteúdo. Geralmente, na pesquisa quantita-tiva do tipo descritiva, o delineamento escolhido pelo pesquisador não permite que os dados possam ser utilizados para testes de hipóteses, embora hipóteses possam ser formuladas a posteriori, uma vez que o objetivo do estudo é apenas descrever o fato em si, tal como ocorre, por exemplo, em um estudo de levan-tamento (survey5), em um estudo de corte transversal ou em uma pesquisa eleitoral. Neste tipo de estudo, o modelo é observacional e não experimental, como descritos anteriormente, e as ferramentas utilizadas para descrever os resultados é a estatística descritiva e as normas tabulares para apresentação de dados, assuntos esses a serem discutidos mais adiante.

Pesquisa analíticaÉ o tipo de pesquisa quantitativa que envolve uma avaliação mais aprofun-

dada das informações coletadas em um determinado estudo, observacional ou experimental, na tentativa de explicar o contexto de um fenômeno no âmbito de um grupo, grupos ou população. É mais complexa do que a pesquisa descritiva, uma vez que procura explicar a relação entre a causa e o efeito. Enquanto que na pesquisa descritiva os resultados (dados) são apenas mostrados sob a forma de números dispostos em gráficos e tabelas, ou seja, descritos, na analítica, estes resultados são comparados matematicamente e hipóteses são testadas mediante a aplicação de testes de significância estatística, para confirmá-las ou refutá-las. Portanto, o que realmente diferencia um estudo descritivo de um analítico é a capacidade do estudo de fazer predições para a população de onde a amostra foi retirada, fazer inferências estatísticas pela aplicação de testes de hipótese.

5 Método de estudo estatístico utilizado para a coleta de informações quantitativas a respeito de determinadas características de uma população.

BIOESTATISTICA_Vol_01.indb 57 25/06/12 17:12

Page 58: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental58

Tomemos o exemplo anterior, no qual o pesquisador deseja testar uma nova droga inibidora da enzima conversora de angiotensina (ECA), para controle da hipertensão arterial. Neste estudo, o investigador comparou dois grupos de animais, o grupo experimental, que recebeu a droga testada, e o grupo con-trole, que recebeu um placebo. Os valores da pressão arterial são expressos em mmHg. Se ao final do estudo, por exemplo, o pesquisador apenas se limita a descrever os resultados encontrados nos dois grupos, a pesquisa será clas-sificada como descritiva; mas, se procedimentos de análise estatística forem empregadas para verificar se as diferenças encontradas são reais, isto é, estatis-ticamente significantes, a pesquisa será considerada analítica, pois a hipótese inicial, que a droga é diferente do placebo, foi testada ao final do estudo. Note que os estudos analíticos são mais complexos e requerem um rigor científico mais apurado, porém seus resultados permitem mais inferências quando com-parados com os estudos puramente descritivos.

2.2.4 Quanto aos objetivosPesquisa exploratória

Este tipo de pesquisa visa a uma primeira aproximação do pesquisador com o tema, para torná-lo mais familiarizado com os fatos e fenômenos rela-cionados ao problema a ser estudado. No estudo, o investigador irá buscar subsídios, não apenas para determinar a relação existente, mas, sobretudo, para conhecer o tipo de relação. Em suma, é o primeiro contato entre objeto pesquisado e o pesquisador, o qual está em busca de suporte teórico, sendo o estudo, geralmente, feito por meio de levantamento bibliográfico, por entrevis-tas, estudo de caso, visitas a instituições, a empresas e websites etc.

Pesquisa explicativa

Tem por objetivo central explicar os fatores determinantes para a ocor-rência de um fenômeno, processo ou fato, ou seja, visa a explicar o “porquê” das coisas. É uma consequência lógica da pesquisa exploratória. No campo das ciências sociais, este tipo de pesquisa utiliza, por questões éticas, o método observacional, ao passo que, no campo das ciências naturais, o método pre-ferido é o experimental, no qual as análises estatísticas são amplamente empregadas para a validação dos resultados.

BIOESTATISTICA_Vol_01.indb 58 25/06/12 17:12

Page 59: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

a pesquisa científica 59

2.2.5 Quanto aos procedimentos técnicosPesquisa bibliográfica

Sua base é a análise de material já publicado. É utilizada para compor a fundamentação teórica a partir da avaliação atenta e sistemática de livros, peri-ódicos, documentos, textos, mapas, fotos, manuscritos e, até mesmo, de material disponibilizado na internet etc. Este tipo de pesquisa fornece o suporte a todas as fases de um protocolo de pesquisa, pois auxilia na escolha do tema, na defini-ção da questão da pesquisa, na determinação dos objetivos, na formulação das hipóteses, na fundamentação da justificativa e na elaboração do relatório final.

Pesquisa documental

É o tipo de pesquisa que tem o levantamento de documentos como base. É uma valiosa técnica de coleta de dados qualitativos. Assemelha-se à pesquisa bibliográfica, a qual utiliza a contribuição fornecida por diversos autores sobre um determinado assunto, enquanto na pesquisa documental, a coleta de infor-mações é realizada em materiais que não receberam qualquer tipo de análise crítica. Neste tipo de pesquisa, os documentos consultados são, geralmente, classificados como fontes primárias e fontes secundárias. No primeiro caso, são as fontes cuja origem remonta à época que se está pesquisando, ainda não analisadas e que, frequentemente, foram produzidas pelas próprias pes-soas estudadas, tais como correspondências, diários, textos literários e outros documentos mantidos em órgãos públicos e instituições privadas de qualquer natureza; no segundo, correspondem às fontes cujos trabalhos escritos se baseiam na fonte primária, e tem como característica o fato de não produzir informações originais, mas, apenas, uma análise, ampliação e comparação das informações contidas na fonte original.

Pesquisa laboratorial

A principal característica é a sua realização em ambiente controlado, seja um laboratório ou não. Estas pesquisas, que geralmente são experimentais, adotam ambientes de simulação para reproduzir o fenômeno objeto do estudo, além de utilizar-se de instrumentos específicos e precisos de coleta e análise de material. Na área das ciências humanas e sociais, as pesquisa laboratoriais costumam ser observacionais, especialmente quando requerem um ambiente

BIOESTATISTICA_Vol_01.indb 59 25/06/12 17:12

Page 60: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental60

adequado e seguro, como nos estudos comportamentais com a utilização de modelos animais.

Pesquisa de campo

É o tipo de pesquisa mais relacionado com observação de fenômenos, pro-cessos e fatos ligados à vida real. Normalmente conduzida fora dos laboratórios, uma pesquisa de campo procura coletar dados que lhe permitam responder aos problemas relacionados a grupos, comunidades ou instituições, com o objetivo de compreender os mais diferentes aspectos de uma determinada rea-lidade, sendo mais frequentemente utilizada pelas áreas das ciências humanas e sociais, mediante técnicas observacionais e com a utilização de questionários para a coleta de dados. Um estudo epidemiológico de uma determinada doença é um bom exemplo de uma pesquisa de campo.

2.2.6 Quanto ao desenvolvimento no tempoPesquisa transversal e longitudinal

A diferença entre as duas é o intervalo de tempo que o pesquisador utiliza para a condução da pesquisa. No estudo transversal (ou seccional), a pesquisa é realizada em um curto período de tempo, em um determinado momento, ou seja, em um ponto no tempo, tal como agora, hoje. Como exemplo, temos um estudo de prevalência, uma enquete eleitoral. No estudo longitudinal (ou horizontal), o pesquisador acompanha o desenvolvimento de sua pesquisa ao longo do tempo, que pode ser dias, semanas, meses ou anos. Mais dinâmica que a transversal, a pesquisa longitudinal pode ser classificada como prospec-tiva e retrospectiva e tem como subtipos o estudo caso-controle e o estudo de coorte prospectivo. O Framinghan Heart Study representa um típico exemplo de estudo longitudinal.

Pesquisa prospectiva e retrospectiva

Nesta classificação, a diferença é o sentido da condução da pesquisa em relação ao tempo de sua realização. Na pesquisa prospectiva, o estudo é con-duzido a partir do momento presente e caminha em direção ao futuro, já na retrospectiva, o estudo é desenhado para explorar fatos do passado, podendo ser delineado para retornar, do momento atual até um determinado ponto no

BIOESTATISTICA_Vol_01.indb 60 25/06/12 17:12

Page 61: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

passado, há vários anos, por exemplo, como ocorre nos estudos caso-controle, ou o pesquisador pode marcar um ponto no passado e conduzir a pesquisa até o momento presente, pela análise documental, é óbvio, tal como acontece no estudo do tipo coorte retrospectivo (coorte histórica).

Não estranhe, portanto, se até aqui você não conseguiu definir com preci-são todos os tipos de pesquisas científicas acima descritas, até porque, como citado anteriormente, estes tipos não são estanques, e os autores não são unâ-nimes quanto à sua classificação. A princípio, elas parecem confusas, mas, mais importante do que saber definir ou classificá-las, é saber entender a essência de como elas são feitas, como funcionam, e que existe sempre mais de uma maneira de fazer a mesma coisa. Note que os diversos tipos podem ser combi-nados de diferentes maneiras, e o pesquisador deverá escolher a combinação que melhor se aplica à questão e aos objetivos do seu estudo. Uma vez esco-lhido o tipo de pesquisa, ele deverá passar a fase da escolha do delineamento (desenho) do estudo, assunto este que será discutido no capítulo a seguir.

BIOESTATISTICA_Vol_01.indb 61 25/06/12 17:12

Page 62: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental62

BIOESTATISTICA_Vol_01.indb 62 25/06/12 17:12

Page 63: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

3Delineamento dos Estudos

de Pesquisa

3.1 CLASSIFICAÇÃO DOS ESTUDOS DE PESQUISA

Uma vez que o pesquisador tenha escolhido o tema, definido a questão da pesquisa e se decidido pelo tipo de estudo que irá conduzir, o próximo passo é delinear o estudo, ou seja, planejar o tipo de estudo que melhor se aplique para que os objetivos propostos possam ser alcançados. Como a maioria das ques-tões de pesquisa pode ser respondida por mais de um tipo de delineamento, a escolha do desenho dependerá de uma série de fatores, tais como o tempo pre-visto para a realização, os recursos disponíveis, a disponibilidade de material e equipamentos, e, até, a experiência do pesquisador.

Tradicionalmente, a classificação mais adotada é aquela que considera a pesquisa quanto a sua natureza, isto é, em pesquisa observacional e pesquisa experimental, cada uma delas com seus desenhos característicos, os quais o pesquisador deverá entendê-los antes de se decidir por um dos tipos. Aqui, é bom lembrar que cada um dos diferentes tipos de delineamento de pes-quisa possui vantagens e desvantagens, e que nem todos os estudos servem para testar hipóteses, alguns deles somente devem ser utilizados para gerar hipóteses, como o estudo de corte transversal (inquérito transversal), por exemplo. O Quadro 3.1 mostra a classificação dos diferentes tipos de estudo de pesquisa.

BIOESTATISTICA_Vol_01.indb 63 25/06/12 17:12

Page 64: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental64

Quadro 3.1 – Classificação dos estudos de pesquisa conforme o delineamento adotado

Tipo de pesquisa Tipo de delineamento Modelos

Observacional

Estudo de série de casos• Estudo de caso• Série de casos

Estudo de corte transversal • Enquete, levantamento, survey.

Estudo caso-controle

Estudo de corte• Prospectivo• Retrospectivo (coorte histórica)

ExperimentalControlados

• Controles concorrentes - Randomizado - Não randomizado - Com cegamento• Controles seqüenciais - Autocontrolados - Cruzados• Controles externos

Não-controlados

Meta-análiseQuantitativa (agregada)Qualitativa (metodológica)

3.2 ESTUDOS OBSERVACIONAIS

3.2.1 Estudo de caso e série de casosUm estudo de caso é um tipo de pesquisa na qual um caso individual é ava-

liado detalhadamente, por um investigador, buscando focalizar características pouco frequentes, como de uma doença já conhecida, por exemplo, ou, mais especialmente, as características clínicas de uma doença pouco conhecida ou de uma, possivelmente, desconhecida. Um estudo de caso não precisa, neces-sariamente, ser somente descritivo, ele pode, também, apresentar um cunho analítico, que vise a fornecer um quadro detalhado do caso com o objetivo de chamar a atenção de outros pesquisadores que tenham efetuado observações semelhantes, criando, assim, condições para sua compreensão e para a for-mulação de hipóteses, constituindo o passo inicial ou uma base de dados para pesquisas comparativas subsequentes. Na área das ciências da saúde, este tipo de estudo tem sido apresentado nas publicações científicas como “relato de caso”, no qual um caso raro de uma determinada doença é descrito a partir da observação direta do paciente, com relatos dos sinais, sintomas, procedi-

BIOESTATISTICA_Vol_01.indb 64 25/06/12 17:12

Page 65: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 65

mentos diagnósticos, tipo de tratamento, evolução, desfecho clínico etc. Mas atenção: se um mesmo pesquisador apresenta vários casos de uma mesma doença, talvez ela não seja tão rara assim e não mereça ser apresentada como série de casos.

Uma série de casos consiste em um relato descritivo simples das caracte-rísticas mais importantes observadas em determinado grupo de pacientes. Frequentemente, este tipo de estudo é utilizado em epidemiologia para inves-tigar o aparecimento de uma nova doença a partir da análise rotineira de dados obtidos pela vigilância sanitária. Como na maioria das vezes não possuem par-ticipantes-controles, os estudos de série de casos não apresentam hipóteses investigativas e envolvem tanto o aspecto descritivo quanto a interpretação de dados, mas o principal objetivo é a utilização desses dados para avaliar a eficácia de alguma prática ou programa sobre o evento estudado. Por exemplo, Castro et alii (2005) relataram o primeiro caso brasileiro de hemangiomatose capilar pulmonar, em um paciente de 21 anos, com grave hipertensão pulmonar. Esta é uma doença rara, caracterizada pela proliferação de capilares que invadem o interstício do pulmão e o septo alveolar, tendo os autores do estudo concluído que o diagnóstico deve ser considerado em pacientes portadores de hiperten-são pulmonar com alterações sugestivas na tomografia computadorizada de alta resolução. Amatuzzi et alii (1997) estudaram 90 casos de fraturas supracondi-lianas do úmero, do tipo III de Felsenreich, em crianças tratadas cirurgicamente, comparando a redução cruenta com a incruenta, e os tipos de fixação com fios de Kirschner, cruzados e “em torre”. Através da análise do ângulo de Baumann e da função articular do cotovelo, pelos critérios de Flynn, obtiveram bons resultados com ambas as técnicas de redução e fixação deste tipo de fratura.

3.2.2 Estudo de corte transversalTambém conhecido como estudo seccional, estudo epidemiológico, estudo

de prevalência, enquete ou estudo de levantamento (survey), este tipo de pes-quisa usa como método a análise de dados coletados em um grupo de indivíduos, aleatoriamente selecionados, em um determinado ponto no tempo, em vez de acompanhá-los durante um intervalo de tempo bem definido. Para esses indiví-duos, geralmente pessoas, mas que, também, podem ser animais ou produtos, o estudo é delineado para possibilitar um diagnóstico instantâneo da situação de

BIOESTATISTICA_Vol_01.indb 65 25/06/12 17:12

Page 66: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental66

uma determinada característica de uma população, como a qualidade da saúde, por exemplo, com base na avaliação individual do estado de saúde de cada um dos seus membros. Isto é, o estudo fornece um “retrato” de como um desfecho, como uma doença, por exemplo, está relacionado com a exposição a um determi-nado fator de risco. Um exemplo típico de um estudo de corte transversal é uma pesquisa eleitoral, na qual a intenção de voto dos eleitores é mostrada naquele momento, sem que se possam fazer previsões para o futuro.

Quando realizados em populações bem definidas, permitem a obtenção de medidas de prevalência de fatores de risco e a frequência de casos prevalentes1 de doença, sendo, por isso, chamados de estudos de prevalência, e, como nos estudos de caso-controle, que serão descritos a seguir, podem ser desenhados para esclarecer questões de pesquisa elaboradas a partir de uma série de casos.

Em razão das suas características, os estudos de corte transversal são par-ticularmente indicados para medir e descrever a frequência e a distribuição das doenças em uma população, medir e descrever a frequência e a distribuição dos fatores de risco conhecidos, ou seja, são úteis para uma avaliação da situa-ção da saúde de uma população e para o planejamento de ações de controle de doenças e políticas públicas, visto que inquéritos transversais repetidos podem ser usados para investigar as mudanças nos fatores de risco e na frequência das doenças. É válido salientar que, os dados coletados a partir de inquéritos repetidos também podem ser associados de modo a gerar hipóteses, especial-mente quando a pesquisa é feita para identificar os fatores de risco relacionados à etiologia de doenças de início lento e de evolução longa, nas quais o diag-nóstico geralmente é feito num estágio mais avançado. Por exemplo, Pitanga et al (2004) estudaram a sensibilidade e especificidade do índice de conicidade2 como discriminador do risco coronariano de adultos residentes na cidade de Salvador. Esses autores selecionaram, randomicamente, uma amostra composta por 968 adultos de 30 a 74 anos de idade e analisaram, pela aplicação da curva Receiver Operating Characteristic (curva ROC), a sensibilidade e especificidade do melhor ponto de corte do índice de conicidade como discriminador de risco

1. Casos prevalentes – Número de pessoas, em uma determinada população, que tem uma doença específica ou condição em um ponto no tempo, geralmente o tempo em que o inquérito é feito.

2. No início da década de 1990, foi proposto o índice de conicidade para avaliação da distribuição da gordura corporal, com base nas medidas de peso, estatura e circunferência da cintura.

BIOESTATISTICA_Vol_01.indb 66 25/06/12 17:12

Page 67: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 67

coronariano elevado. Verificou-se, também, na área sob a curva ROC, a signifi-cância estatística entre o índice de conicidade e risco coronariano elevado. Os resultados encontrados sugerem que este índice deve ser comparado aos demais indicadores antropométricos de obesidade e pode vir a ser utilizado para discri-minar risco coronariano elevado.

Embora apresente muitas vantagens, uma das desvantagens dos estudos transver-sais está no fato de que a exposição e o efeito são mensurados em um mesmo ponto no tempo, o que dificulta a identificação do momento da exposição, isto é, se esta antecede o aparecimento da doença ou se a doença altera o modo de exposição a determinado fator de risco. Entretanto, para variáveis que permanecem inalteradas no tempo, como raça, sexo e grupo sanguíneo etc., esses estudos podem oferecer evidências válidas de uma associação estatística. Por esse motivo, as pesquisas de corte transversal têm sido mais comumente utilizadas como estudos puramente descritivos, sem testes de hipóteses, porém, se bem delineados, podem fornecer importantes informações esta-tísticas a respeito de possíveis associações entre pelo menos duas variáveis distintas classificadas como causa e efeito. A Figura 3.1 mostra o fluxograma de um estudo de corte transversal tradicional, no qual uma amostra aleatória é escolhida entre os indi-víduos de uma dada população. A partir dessa amostra, os indivíduos são analisados quanto à frequência e a distribuição do desfecho estudado. De outro modo, a Figura 3.2 apresenta o fluxograma de um delineamento mais abrangente de um estudo de corte transversal, no qual uma amostra aleatória de indivíduos foi retirada de uma determinada população, e separada em dois grupos, doentes e não-doentes, os quais foram separados conforme a exposição, ou não, a um determinado fator de risco. Nesse estudo, é possível a aplicação de métodos estatísticos apropriados para verificar a exis-tência de associação entre a exposição a um determinado fator de risco e a ocorrência de uma doença nos indivíduos examinados.

Sem desfecho clínico

Com desfecho clínico

Participantes do estudo

População

Fig. 3.1 - Fluxograma de um estudo de corte transversal. Os participantes são separados entre

aqueles com desfecho e sem desfecho

BIOESTATISTICA_Vol_01.indb 67 25/06/12 17:12

Page 68: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental68

Fig. 3.2 – Fluxograma de um estudo de corte transversal com amostra única estratificada em

quatro grupos conforme a exposição ao fator de risco

O Quadro 3.2 mostra valores fictícios para o exemplo exibido na Figura 3.2. Com os dados coletados, é possível calcular medidas epidemiológicas relativas à doença estudada na população alvo, tais como a prevalência e as razões de risco, assim como é possível calcular, com a aplicação de um teste estatístico adequado, a probabilidade da ocorrência de uma associação estatística real entre a exposi-ção ao fator de risco e a doença em questão, como mostrado a seguir.

Quadro 3.2 – Frequência de doença entre os indivíduos expostos e não-expostos a um

determinado fator de risco

Exposição ao fator de risco

Participantes selecionados para o estudo Risco do desfecho

Doentes Não-doentes Total

Expostos(a)

200(b)

400(a + b)

600 EaR =

a +b

Não-expostos(c)

300(d)

1.500(c + d)1.800 N

cR =c+ d

Total(a + c)

500(b + d)1.900

(a + b + c + d)2.400

100 D

a + cP =n e

E

N

RRR =R

RE = Risco para os expostos ao fator de risco.RN = Risco para os não-expostos ao fator de risco.PD = Prevalência da doença e RR = Razão de risco.

Pa c

nD= +

= +

=100

200 300

2 400100 20 83

., %

AmostraPopulação

Não-doentes

Doentes

Não-expostos

Expostos

Não-expostos

Expostos

BIOESTATISTICA_Vol_01.indb 68 25/06/12 17:12

Page 69: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 69

Ra

a bE=

+= =200

6000 33,

Rc

c dN=

+= =300

1 8000 16

.,

RRR

R

E

N

= = =

200

600

300

1 800

2 00

.

,

Teste de significância estatística: χ2 = 75,79 e valor P < 0,05.

Após calcular o risco da doença nos expostos e nos não-expostos, pode-se, então, compará-los para se verificar a existência, ou não, de associação entre a exposição ao fator de risco e a doença estudada. Se eles forem significativamente diferentes, segundo o teste estatístico3 empregado, pode-se concluir, com larga margem de acerto, pela existência de associação estatística entre exposição e doença. O raciocínio é o seguinte: se o risco de doença nos expostos for maior do que nos não-expostos (razão maior que 1), pode-se concluir que a exposição ao fator de risco estudado está positivamente associada à doença; se o risco nos expostos for menor do que nos não-expostos (razão menor que 1), conclui-se que a associação entre exposição e doença é negativa. Aqui uma observação: uma associação positiva não significa, necessariamente, que o fator de risco esteja, de fato, associado ao desenvolvimento da doença, isto pode ser apenas coincidência, isto é, pode ter ocorrido por acaso, e outros estudos devem ser conduzidos para esclarecer a questão. Do mesmo modo, uma associação nega-tiva não é, necessariamente, indicativa de que o fator estudado seja um fator de proteção contra o desenvolvimento da doença.

Os instrumentos de coleta de dados nos estudos de corte transversal podem ser, entre outros, registros, questionários, exames físico e clínico ou testes de laboratório, mas, de qualquer modo, como qualquer outro tipo de

3. A aplicação dos diferentes métodos estatísticos para verificação de hipóteses será abordada no capítulo referente à inferência estatística e teste de hipótese.

BIOESTATISTICA_Vol_01.indb 69 25/06/12 17:12

Page 70: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental70

pesquisa, este tipo de estudo apresenta vantagens e desvantagens, as quais são descritas no Quadro 3.5.

3.2.3 Estudo caso-controleO estudo caso-controle é um tipo de estudo observacional, no qual o pesqui-

sador seleciona, a partir de uma população, dois grupos de indivíduos (pessoas, animais, produtos). O primeiro grupo, chamado de caso, é constituído por indiví-duos portadores de uma doença ou uma condição específica, como um desfecho clínico, por exemplo. O segundo grupo, chamado de controle, é constituído por indivíduos sem a doença ou sem o desfecho clínico estudado. Os dois grupos são, então, comparados quanto à história de eventos anteriores na tentativa de detec-tar exposição passada a alguma característica, tal como a um determinado fator de risco, isto é, se a exposição ocorreu em maior ou menor frequência entre os casos ou entre os controles. Assim, a proporção de exposição ao fator de risco estudado é medida e comparada entre os dois grupos. Caso a proporção de expostos ao fator de risco seja maior no grupo caso que no grupo controle, é possível que esta exposição aumente o risco para a ocorrência da doença estu-dada. De outro modo, se esta proporção é menor, então a exposição estudada pode ser considerada como um fator protetor e não como um fator de risco. Ou seja, no estudo caso-controle, os pesquisadores perguntam “O que aconteceu?”, pois olham para trás, no tempo, para detectar as possíveis causas ou fatores de risco que possam ter sido observados em um estudo de série de casos. Neste tipo de estudo, o risco real (razão de risco, risco relativo ou risk ratio4) não pode ser determinado, pois a população básica não é conhecida, porém uma estimativa do risco relativo, chamada razão de chance (odds ratio4), pode sempre ser cal-culada. A Figura 3.3 mostra o fluxograma temporal de um estudo caso-controle.

Algumas vezes chamados de estudos retrospectivos, em razão da direção temporal seguida pela pesquisa, os estudos caso-controle são longitudinais, pois, diferentemente dos estudos transversais, cobrem um intervalo de tempo que pode ser considerado em dias, semanas, meses ou anos. Entretanto, tal como no estudo de corte transversal, no qual o investigador também estuda, simultane-

4. O cálculo do risco relativo e da razão de chance será abordado no capítulo específico que trata dos cálculos de risco.

BIOESTATISTICA_Vol_01.indb 70 25/06/12 17:12

Page 71: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 71

amente, a associação entre um desfecho (doença) e um fator de risco, o estudo de caso-controle é diferente porque, neste, a amostra para o estudo é escolhida especificamente entre os indivíduos com e sem a doença, ao passo que, no estudo transversal, a amostra é retirada diretamente da população como um todo e, somente depois, esta amostra é separada em dois grupos, com desfecho e sem desfecho. Uma maneira prática de diferenciar um estudo de corte transversal de um estudo caso-controle é verificar o objetivo de ambos: se for puramente descri-tivo, é provável que seja um estudo transversal, se o objetivo do estudo é explicar um fenômeno com base em eventos passados, o estudo é do tipo caso-controle.

Fig. 3.3 – Fluxograma de um estudo caso-controle. As áreas cinza representam os participantes

expostos ao fator de risco. As setas indicam as relações temporais do estudo

Em epidemiologia, os estudos caso-controle são bastante úteis para o estudo de doenças raras, uma vez que podem ser executados de maneira bastante rápida e com baixo custo, e, embora apenas um desfecho (doença) possa ser estudado a cada vez, vários fatores de risco podem ser considerados simultaneamente, o que faz desse tipo de estudo, o preferido para a geração de hipóteses no que diz respeito às causas de uma doença. Uma das suas des-vantagens refere-se à escolha dos indivíduos participantes do grupo controle. A escolha desses indivíduos deve seguir rígidos critérios de seleção na tenta-tiva de evitar vieses que possam comprometer a qualidade do estudo, assim

Expostos

Expostos

Não-expostos

Não-expostos

Direção da pesquisa Direção do tempo

Início da pesquisa

Casos

Controles

BIOESTATISTICA_Vol_01.indb 71 25/06/12 17:12

Page 72: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental72

como devem ser rígidos os procedimentos para o diagnóstico da doença nos indivíduos do grupo caso. Uma regra básica é a escolha do grupo controle o mais idêntico possível ao grupo caso, exceto pela presença da doença, isto é, que os indivíduos do grupo controle sejam retirados da mesma população ou do mesmo local de onde foram retirados os indivíduos do grupo caso, inclu-sive que os grupos sejam pareados no que tange às características individuais dos participantes, tal como a idade, sexo, raça etc., porém não necessariamente com o mesmo número de participantes, porque, muitas vezes, o investigador escolhe o grupo controle com um número de participantes três a quatro vezes maior que aqueles do grupo caso, ou escolhe mais de um grupo controle, sendo um deles retirado da população geral. Por exemplo, se um investigador deseja estudar os fatores de risco para o baixo peso ao nascer, em crianças filhas de mães jovens, para cada indivíduo do grupo caso deverá ser escolhido um indi-víduo do grupo controle, entre as crianças que nasceram na mesma época e no mesmo hospital, com o mesmo sexo e mesma raça, e com mãe de idade semelhante, procedente da mesma cidade. Este procedimento evita o viés5 de seleção. As vantagens e desvantagens do estudo caso-controle estão descritas no Quadro 3.5.

Por exemplo, Gamba et alii (2004) conduziram um estudo caso-controle cujo objetivo era detectar fatores associados a amputações de extremidades inferiores, em pessoas com diabetes mellitus. Os autores selecionaram, na rede de serviços do Município de São Paulo, dois grupos: para o grupo caso, foram selecionadas 117 pessoas com diabetes mellitus, submetidas a amputações de extremidades inferiores; para o grupo controle, 234 pessoas com diabe-tes mellitus, mas não submetidas a amputações. As variáveis consideradas no emparelhamento foram sexo, idade e duração da doença; as característi-cas sócio-demográficas, de hábitos de vida, clínicas e relativas à educação em saúde em diabetes mellitus foram analisadas. Foi realizada análise estatística para verificar as associações entre as amputações e as variáveis estudadas. O modelo de regressão logística com cálculo da odds ratio, como medida de asso-ciação, foi adotado para a análise multivariada.

5 Viés, vício ou tendenciosidades (bias), também conhecido como erro diferencial, corresponde a uma fonte de erro que produz desvios ou distorções nos resultados de uma pesquisa. Bias: palavra inglesa que significa viés.

BIOESTATISTICA_Vol_01.indb 72 25/06/12 17:12

Page 73: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 73

O Quadro 3.3 mostra valores relativos ao fator de risco vasculopatia, estu-dados no exemplo anterior. Com os dados coletados, é possível calcular a razão de chance (odds ratio) dividindo-se a chance de exposição entre os casos (a/c) pela chance exposição entre os controles (b/d), assim como é possível calcular a probabilidade da ocorrência de uma associação estatística real entre a expo-sição ao fator de risco e a doença em questão, como mostrados a seguir.

Como podemos observar, em um estudo caso-controle, o principal método estatístico utilizado para medir a força de associação entre a exposição ao fator de risco e a doença estudada é a razão de chance (odds ratio). No exemplo em questão, uma razão de chance de 8,98 significa que os pacientes expostos ao fator de risco estudado, no caso, a vasculopatia, têm 9 vezes mais chance de sofrer uma amputação quando comparados aos pacientes não expostos ao fator de risco. Caso a odds ratio encontrada fosse menor que um (1), digamos, 0,5, por exemplo, isso significaria que a chance da ocorrência da doença cairia pela metade na presença do fator de risco, e, nesse caso, a vasculopatia atuaria como um fator de proteção. Se a odds ratio encontrada é igual a um, isso significa que não existe associação entre a exposição ao fator de risco e a doença estudada. Porém, se uma associação é encontrada, o pesquisador deve empregar um teste de significância estatística para investigar se o resultado ocorreu apenas por acaso, ou se a associação é real, ou seja, se, de fato, o fator de risco atua como causa concorrente para a ocorrência da doença. Os testes de significância esta-tística serão discutidos no capítulo referente aos testes de hipóteses.

Quadro 3.3 – Valores ajustados para o fator de risco vasculopatia no estudo caso-controle

Fator de riscoParticipantes selecionados para o estudo

Casos ControlesPresença devasculopatia

(a)95

(b)76

Ausência devasculopatia

(c)22

(d)158

Total(a + c)

117(b + d)

234

Chances do desfecho C = acA C = b

dN

CA = Chance de adoecer e CN = Chance de não adoecerOR = CA / CN

BIOESTATISTICA_Vol_01.indb 73 25/06/12 17:12

Page 74: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental74

Razão de Chance (Odds Ratio) =Chance de adoecerr

Chance de não adoecer

158

22OR

a

c

b

d

ad

bc= = = ×

×95

76==8 98,

Teste de significância estatística: χ2 = 74,10 e valor P < 0,05.

Erroneamente, é comum a utilização do termo risco relativo para desig-nar as medidas calculadas pela razão de chance. Em termos práticos, as duas medidas apresentam fórmulas matemáticas diferentes. Mas, afinal, por que nos estudo caso-controle não pode ser utilizado o teste estatístico razão de risco? A questão é simples. Se fôssemos calcular a chance de doença no grupo exposto ao fator de risco, a fórmula seria a/b; ao passo que a chance de doença no grupo não exposto seria c/d, e a razão de chance entre os dois grupos seria OR = (a/b)/(c/d). Matematicamente, não teria diferença se a razão de chance fosse calculada desta maneira ou pela fórmula tradicionalmente correta, OR = (a/c)/(b/d), pois a multiplicação cruzada em cada caso seria sempre OR = ad/bc. Porém, em termos conceituais, não tem sentido usar a fórmula OR = (a/b)/(c/d), pois os valores das células a e b vêm de diferentes grupos estudados, isto é, a vem do grupo caso, enquanto b vem do grupo controle.

Note que, neste tipo de estudo, as únicas medidas disponíveis são as pro-porções de pessoas expostas entre os casos e entre os controles. Não temos dados sobre o número de pessoas expostas e não-expostas na população que produziu os casos e que, também, produziu os controles, pois o número de casos e controles é definido arbitrariamente pelo pesquisador e não reflete a proporção real entre o número de casos, ou controles, e o total de pessoas na população. Por este motivo, a apresentação dos dados tabulares nos estudos caso-controle não inclui a coluna de total, que soma casos e controles nos gru-pos expostos e não-expostos ao fator de risco. Por isso, não podemos calcular os riscos de doença em expostos e não-expostos, nem, tampouco, a razão de risco, daí porque em estudos caso-controle, os grupos são comparados quanto à frequência de exposição pela aplicação da razão de chance de exposição, que corresponde ao valor de quanto a exposição é mais frequente em um grupo em

BIOESTATISTICA_Vol_01.indb 74 25/06/12 17:12

Page 75: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 75

relação ao outro. Como a razão de chance de exposição e a razão de chance de doença, em expostos e não-expostos, são, matematicamente, iguais, esta última também pode ser calculada em estudos caso-controle, pois ela é semelhante à razão de risco de doença quando esta é relativamente rara, em especial quando sua incidência na população é menor que 5%, sendo a razão de chance uma boa estimativa da razão de risco. Nestes casos, a razão de chance é semelhante à razão de risco, e isso explica o uso do termo razão de risco ou risco relativo, quando a razão de chance é calculada em estudos do tipo caso-controle.

Nota: em razão de sua fórmula matemática, a odds ratio (OR) ou razão de chance também é conhecida como razão dos produtos cruzados.

3.2.4 Estudo de coorte (cohort)O termo “coorte” foi introduzido nos estudos epidemiológicos em 1935, por

Frost, e deriva da palavra inglesa cohort, que significa um grupo de pessoas, pois, na Roma antiga, era usado para designar um grupo de soldados que formavam um batalhão militar. Assim, uma coorte é definida como um grupo de indivíduos (pessoas, animais) claramente identificados e selecionados para serem estuda-dos e seguidos no tempo, com a finalidade de determinar se irão desenvolver, ou não, uma determinada condição (desfecho), como uma doença, por exemplo. Neste tipo de estudo, os pesquisadores selecionam uma ou mais coortes que são formadas tomando-se uma amostra aleatória da população, da qual são escolhi-dos os indivíduos participantes portadores, ou não, de alguma característica (ou características) de interesse do estudo, tal como a exposição a um ou a vários fatores de risco de uma doença. Depois que a coorte é selecionada, os participan-tes, tanto os expostos como os não-expostos ao fator de risco ou à característica estudada são seguidos durante um determinado período no tempo, que podem ser dias, semanas, meses ou anos, para determinar se irão desenvolver, ou não, a doença de interesse, e, assim, definir se os fatores de risco que foram medidos no início do estudo são fatores preditores da doença em questão. A Figura 3.4 mostra o fluxograma temporal de um estudo coorte.

Note que, nos estudos de coorte, os objetivos são analisar as associações entre os fatores de risco preditores dos desfechos, assim como descrever a incidência destes desfechos ao longo do tempo; por estes motivos, é o pesquisador quem define a data de início e do final do acompanhamento dos grupos participantes,

BIOESTATISTICA_Vol_01.indb 75 25/06/12 17:12

Page 76: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental76

e, durante o intervalo de tempo do desenvolvimento da pesquisa, as informações sobre as variáveis estudadas vão sendo colhidas conforme os interesses determi-nados pelo pesquisador. Deste modo, os estudos de coorte podem ser delineados com as mais diversas finalidades, além daquelas de estudar fator de risco e doença. Como exemplo, eles podem ser conduzidos para avaliar intervenções terapêuticas (ex.: verificar a taxa de recidivas em diferentes tipos de tratamentos de hérnia inguinal, ou taxa de sobrevida em diferentes tipos de tratamento de tumores malignos), avaliar a efetividade de fatores prognósticos (ex.: comparar as taxas de mortalidade associadas aos diferentes índices de trauma), comparar diferentes métodos de diagnósticos (ex.: mamografia versus ultra-sonografia no diagnóstico precoce do câncer de mama) etc. Além disso, os estudos de coorte podem ser conduzidos para comparar níveis diferentes de exposição aos mais diversos fatores de risco, sejam eles ambientais (radiação, exposição a agentes químicos), biológicos (diabetes, hipertensão), comportamentais (tabagismo, alcoolismo, dieta), sociais (escolaridade, saneamento, renda), entre outros.

Fig. 3.4 – Fluxograma de um estudo de coorte. A coorte selecionada foi dividida em dois grupos

de participantes conforme a exposição ao fator de risco estudado

Direção da pesquisaDireção do tempo

Início da pesquisa

Participantes (expostos) Com desfecho

estudado

Com desfecho estudado

Sem desfecho estudado

Sem desfecho estudadoControles

(não-expostos)

População

Coorte selecionada para o estudo

BIOESTATISTICA_Vol_01.indb 76 25/06/12 17:12

Page 77: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 77

Por outro lado, é bom lembrar que, dependendo do delineamento do estudo, um determinado tipo de variável pode ser considerado ora como um fator de risco, ora como um desfecho clínico. Tomemos como exemplo um estudo que investigue a influência dos fatores comportamentais e genéticos como causa de hipertensão arterial; nesse caso, a hipertensão é considerada como o desfecho a ser estudado. Mas, em outro estudo, cujo objetivo é investigar a influência da hipertensão como fator concorrente para as doenças coronarianas, a hipertensão arterial seria tratada como fator de risco. De qualquer modo, o ponto fundamental de um estudo de coorte é a seleção do grupo de indivíduos que serão escolhidos para compor a coorte inicial. Estes indivíduos devem ser apropriados para os objetivos relacio-nados à questão da pesquisa, além de apresentarem número adequado e disponibilidade para serem acompanhados ao longo do tempo de duração da investigação, pois a perda destes indivíduos pode comprometer a quali-dade do estudo.

Tradicionalmente, conforme a relação temporal entre o início da pes- quisa e a ocorrência do desfecho, os estudos de coorte são classificados como prospectivos (também conhecidos como concorrentes) e retrospectivos (tam-bém denominados como não-concorrentes ou coorte histórica). No estudo de coorte retrospectivo, a exposição ao fator de risco e o desfecho já ocorreram antes do início da pesquisa. Porém, no estudo prospectivo, a exposição pode, ou não, já ter ocorrido antes do início da pesquisa, mas o desfecho ainda não ocorreu. Nesse caso, o pesquisador deverá acompanhar a coorte selecionada por um período de tempo suficiente para que os desfechos ocorram. Um ter-ceiro tipo de estudo de coorte, chamado de estudos de coortes múltiplas, é citado por alguns autores. Nesse estudo, duas coortes são escolhidas a par-tir de duas populações diferentes; uma delas exposta a um potencial fator de risco, e a outra, não-exposta ou com níveis mais baixos de exposição ao mesmo fator de risco. A diferença entre este terceiro tipo e um estudo caso--controle é que, no estudo de coortes múltiplas, as amostras são escolhidas de populações diferentes e com base nos níveis de exposição, ao passo que, no estudo caso-controle, as amostras são escolhidas com base na presença ou ausência do desfecho, na mesma população. A Figura 3.5 mostra a relação temporal nos diferentes tipos de estudo de coorte.

BIOESTATISTICA_Vol_01.indb 77 25/06/12 17:12

Page 78: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental78

Fig. 3.5 – Fluxograma da relação temporal nos estudos de coorte prospectivo e retrospectivo

No estudo de coorte prospectivo, o pesquisador seleciona os grupos de estudo no tempo presente, coleta os dados de interesse no início do estudo e continua com a coleta dos dados ao longo do tempo estipulado para a pesquisa, até a ocorrência do desfecho inicialmente previsto. Por exemplo, Fontelles e Mantovani (2000) estudaram o uso da antibioticoterapia associada à drenagem pleural fechada pós-trauma torácico, com objetivo de verificar se à exposição ao antibiótico atuaria com fator de proteção contra as complicações pleuropulmona-res, tal como o empiema pleural e a pneumonia. Os pesquisadores selecionaram, aleatoriamente, uma amostra de 167 pacientes atendidos no Hospital de Pronto-Socorro Municipal de Belém, no período julho/98 a junho/99, com história de traumatismo torácico, submetidos à drenagem pleural fechada, segundo os cri-térios preconizados pelo ATLS6. Este grupo de pacientes foi dividido em duas coortes: a primeira, constituída por 63 pacientes que receberam antibioticote-rapia; a segunda, constituída por 104 pacientes, sem antibioticoterapia. Todos os pacientes foram acompanhados até o dia da alta hospitalar, mais um período de 30 dias. Dados referentes à evolução clínica, às variáveis hemodinâmicas, aos índices de trauma e às complicações (desfechos) foram anotados durante o tempo de realização do estudo. Os resultados do estudo mostraram que, no grupo de pacientes que não receberam a antibioticoterapia, o risco de complica-ções pleuropulmonares infecciosas foi 3,23 vezes maior, quando comparado ao

6. ATLS® - Advanced Trauma Life Support (Suporte avançado de Vida no Trauma).

Seleção da coorteColeta de dados sobre os fatores de risco

Seleção da coorteColeta de dados sobre os fatores de risco

Estudo de coorte retrospectivo

Estudo de coorte prospectivo

Análise dos desfechos

Análise dos desfechos

Direção da pesquisaDireção do tempo

PASSADO PRESENTE FUTURO

BIOESTATISTICA_Vol_01.indb 78 25/06/12 17:12

Page 79: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 79

grupo de pacientes que receberam o antibiótico. Este resultado indica que o uso do antibiótico atuou como um fator de proteção. O Quadro 3.4 mostra os dados relativos às complicações pleuropulmonares infecciosas.

Quadro 3.4 – Número de complicações pleuropulmonares conforme

o grupo de pacientes estudados

Coortes selecionadas

Desfecho Total

Com complicações pleuropulmonares

Sem complicações pleuropulmonares

Grupo sem

antibioticoterapia

(a)

16

(b)

88

(a + b)

104

Grupo com

antibioticoterapia

(c)

03

(d)

60

(c + d)

63

Total(a + c)

19

(b + d)

148

(a + b + c + d)

167

Razão de Risco (Risk Ratio) RR

a

a b

c

c d

= +

+

=

16

1044

3

63

3 23= ,

Razão de Chance (Odds Ratio) OR

a

c

b

d

= =

16

3

88

60

==3 64,

Teste de significância estatística: χ2 = 4,39 e valor P = 0,036.

No estudo de coorte retrospectivo o delineamento é, essencialmente, o mesmo do estudo prospectivo, com a diferença que o pesquisador volta na his-tória do tempo e define um grupo de risco para ser estudado, isto é, as medidas iniciais, o acompanhamento dos sujeitos e a avaliação subsequente dos des-fechos que ocorreram todos no passado. Obviamente que esse tipo de estudo só é possível se houver dados suficientemente confiáveis sobre os fatores de risco e os desfechos de interesse. Aqui, diferentes fontes de informação podem

BIOESTATISTICA_Vol_01.indb 79 25/06/12 17:12

Page 80: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental80

ser utilizadas, tais como os registros de prontuários médicos, relatórios de atividades industriais, entre outros. Por exemplo: Teixeira et alii (2004) estu-daram o impacto da multirresistência microbiana na morbidade e mortalidade de pacientes com pneumonia bacteriana associada à ventilação mecânica. Em concordância com Comissão de Controle de Infecção Hospitalar do Complexo Hospitalar Santa Casa de Porto Alegre, os autores do estudo revisaram os prontuários dos pacientes que tiveram o diagnóstico clínico de pneumonia associada à ventilação mecânica (PAVM) no período de janeiro de 1999 a abril de 2002. Todos os pacientes foram avaliados utilizando-se os critérios do Acute

Physiology and Chronic Health Evaluation (APACHE II). Um grupo constituído de 91 pacientes, os quais foram selecionados e divididos em duas coortes, segundo a pneumonia tenha sido causada por microorganismo multirresistente (75 casos) ou causada por microorganismo sensível à antibioticoterapia (16 casos), de acordo com os testes de sensibilidade aos antibióticos. O óbito ocor-reu em 46 pacientes do grupo com pneumonia causada por microorganismo multirresistente (61,3%), e em quatro pacientes com pneumonia causada por microorganismo sensível (25%), sendo essa diferença estatisticamente signi-ficativa (P = 0,008). Os dados obtidos no estudo mostram que, no grupo com pneumonia causada por microorganismos resistentes à antibioticoterapia, o risco de morte foi 2,45 vezes maior, quando comparado ao grupo de pacien-tes com pneumonia causada por microorganismos sensíveis aos antibióticos. Este resultado indica que a resistência do microorganismo ao antibiótico atuou como um fator de risco para o desfecho estudado. Os dados da mortalidade dos pacientes estudados estão representados no Quadro 3.5.

Quadro 3.5 – Número de óbitos conforme o grupo de pacientes estudados

Coortes selecionadas Desfecho Total

Com óbito Sem óbito

Grupo com microorganismo

multirresistente

(a)

46

(b)

29

(a + b)

75

Grupo com microorganismo

sensível

(c)

04

(d)

12

(c + d)

16

Total(a + c)

50

(b + d)

41

(a + b + c + d)

91

BIOESTATISTICA_Vol_01.indb 80 25/06/12 17:12

Page 81: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 81

Razão de Risco (Risk Ratio) RR

a

a b

c

c d

= +

+

=

46

75

44

16

2 45= ,

Razão de Chance (Odds Ratio) OR

a

c

b

d

= =

46

4

29

12

== 4 75,

Teste de significância estatística: χ2 = 7,03 e valor P = 0,008.

Duas variantes do estudo de coorte são os estudos caso-controle ani-

nhado e caso-coorte, que associam um estudo caso-controle a um estudo de coorte, prospectivo ou retrospectivo. No tipo caso-controle aninhado, inicial-mente um estudo de coorte é montado para avaliar, a partir de critérios bem definidos, um determinado desfecho de interesse, e, então, todos os indivíduos da coorte que desenvolveram o desfecho serão considerados como pertencen-tes ao grupo caso do estudo caso-controle associado e que será desenvolvido a partir de então. O próximo passo é definir o grupo-controle, o qual é sele-cionado a partir de uma amostra probabilística de indivíduos retirados entre aqueles que fazem parte da coorte, mas que não desenvolveram o desfecho de interesse. A partir de então, os casos e controles são comparados quanto à exposição ao fator ou fatores de risco estudado. Para cada caso, o pesquisador deverá parear um indivíduo para o grupo controle, isto é, deverá selecionar um indivíduo que apresente o mesmo tempo de acompanhamento, a mesma raça e idade, e o mesmo sexo.

No tipo caso-coorte, o delineamento é semelhante ao caso controle ani-nhado, com a diferença que, ao final do tempo de acompanhamento da coorte, o pesquisador seleciona uma amostra aleatória entre todos os membros dessa coorte, independentemente da ocorrência, ou não, do desfecho. Então, a partir dessa amostra, ele separa os casos (com desfecho) e os controles (sem desfe-cho) e os compara quanto à exposição, ou não, aos fatores de risco, no passado. As Figuras 3.6 e 3.7 mostram o fluxograma temporal das variantes dos estudos de coorte.

BIOESTATISTICA_Vol_01.indb 81 25/06/12 17:12

Page 82: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental82

Fig. 3.6 – Fluxograma da relação temporal no estudo de coorte do tipo caso-controle aninhado

Fig. 3.7 – Fluxograma da relação temporal no estudo do tipo caso-coorte

Num estudo de coorte, o processo de formação dos grupos que serão comparados envolve, em primeiro lugar, a seleção da população que será

ExpostosCom

desfecho

Sem desfecho

Expostos

A fase caso-controle volta no tempo

Nãoexpostos

Nãoexpostos

Direção da pesquisa

Direção do tempo

Início da pesquisa

Coorte selecionada para o estudo

Controles

Casos

Expostos

Seleção dos casos e

controles

Expostos

A fase caso-controle volta no tempo

Nãoexpostos

Nãoexpostos

Direção da pesquisa

Direção do tempo

Início da

pesquisa

Coorte selecionada para o estudo

Controles

Casos

BIOESTATISTICA_Vol_01.indb 82 25/06/12 17:12

Page 83: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 83

estudada. Esta deve ser escolhida com base em características que possam facilitar o recrutamento dos participantes, a coleta das informações de inte-resse e, em especial, o seguimento dos indivíduos selecionados. Desta forma, dá-se, sempre que possível, a preferência para a escolha de grupos popula-cionais restritos ou para grupos especiais de participantes, em relação ao acompanhamento de uma amostra de uma população, em geral. Entendem-se como grupos restritos, aqueles formados por indivíduos com características comuns e expostos às mesmas condições, tais como trabalhadores de uma determinada indústria, usuários do mesmo plano de saúde, profissionais de um mesmo ramo de atividade; e como grupos especiais, aqueles formados por indivíduos expostos a um fator de risco considerado raro na população em geral, tal como os indivíduos expostos à contaminação radioativa, por exem-plo. Quando estes grupos restritos ou especiais são estudados, o processo de formação das coortes de comparação envolve a seleção de dois grupos de participantes, um constituído por indivíduos expostos ao fator de risco de interesse do estudo, o outro, constituído por indivíduos não-expostos, porém com as mesmas características.

Em relação às características das populações estudadas num deline-amento do tipo coorte, estas podem ser classificadas em populações fixas ou dinâmicas. As fixas são aquelas que não admitem novos participantes no decorrer da pesquisa, embora alguns destes possam deixar o estudo desde que desenvolvam o desfecho de interesse antes do fim da pesquisa, e são constituídas por indivíduos selecionados segundo suas características que permanecem constantes durante o tempo de realização do estudo, tal como o sexo, a raça, o grupo sangüíneo, o fator Rh, por exemplo. As populações dinâmicas são aquelas que admitem a entrada de novos indivíduos durante o período de realização da pesquisa, e são constituídas por indivíduos cujas características e, também, a exposição ao fator de risco se modificam ao longo do estudo, tais como a idade, hábito de fumar etc. As vantagens e desvanta-gens dos estudos do tipo coorte estão descritas no Quadro 3.6. A Figura 3.8 mostra a relação temporal nos estudos observacionais.

BIOESTATISTICA_Vol_01.indb 83 25/06/12 17:12

Page 84: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental84

Quadro 3.6 – Vantagens e desvantagens dos diferentes tipos de estudos observacionais

Tipo de estudo Vantagens Desvantagens

Série de casos • Curto tempo de acompanhamento.• Sem controle.• Validade limitada.

Corte transversal• Rápido, fácil e de baixo custo.• Serve para formulação de hipótese.

• Dificuldade de identificação de doenças de curta duração.

• Dificuldade de separar a causa do efeito.• Pouco úteis para testar hipótese.

Caso-controle

• Rápido, fácil e de baixo custo.• Adequado para o estudo de eventos

(doenças) raros.• Estuda vários fatores de risco

simultaneamente.• Ideal para formulação de hipóteses

preliminares.

• Dificuldade na escolha do grupo controle.• Sujeito ao viés de recordação.• Estuda apenas um desfecho por vez.

Coorte

• Pode estudar vários desfechos simultaneamente.

• Bom para o estudo de fatores de risco raros.

• Permite a obtenção de medida de risco verdadeira.

• Os estudos retrospectivos são mais rápidos e menos dispendiosos que os prospectivos.

• Geralmente prolongados e de alto custo.• Restrito aos fatores de risco definidos no

início do estudo.• Pouco adequado para estudar desfechos

raros.• Os estudos retrospectivos podem ser

prejudicados por dados incompletos e pouco confiáveis.

Fig. 3.8 – Fluxograma da relação temporal nos estudos observacionais.

As setas indicam a direção da pesquisa, no tempo

Estudo caso-controle

Direção da pesquisaDireção do tempo

PASSADO PRESENTE FUTURO

Estudo de corte transversal

Coorte prospectiva

Coorte retrospectiva

BIOESTATISTICA_Vol_01.indb 84 25/06/12 17:12

Page 85: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 85

3.3 ESTUDOS EXPERIMENTAIS Os estudos experimentais realizados em indivíduos são denominados de

ensaios clínicos, uma vez que o seu objetivo é avaliar o impacto de um tratamento ou procedimento (intervenções) sobre um determinado desfecho de interesse. Sua principal vantagem, em relação aos estudos observacionais, repousa no fato de sua grande capacidade de demonstrar, estatisticamente, uma relação de causa e efeito. Nestes tipos de estudo, também chamados de “estudo de intervenção”, o pesquisador aplica um tratamento ou modifica a exposição ao fator de risco ou de proteção, sob condições controladas, e estuda os efeitos desses procedimen-tos sobre o desfecho, o qual pode ser uma doença ou uma característica qualquer do grupo estudado, que pode ser pessoas, animais ou mesmo produtos resultan-tes de processamentos industriais, como na indústria de alimentos, por exemplo.

Como regra geral, os estudos experimentais são subdivididos em contro-lados e não-controlados, conforme o pesquisador utilize, ou não, um grupo de comparação, geralmente chamado grupo controle. Os estudos controla-dos podem apresentar as variantes do tipo autocontrole ou controle cruzado. Quanto ao critério de seleção utilizado para a entrada dos sujeitos na pesquisa, estes estudos são ditos randomizados7 e não-randomizados, seja o critério de escolha considerado ao acaso ou aleatório, ou por indicação do pesquisador. Assim, tradicionalmente, alguns autores só consideram como estudo expe-rimental o estudo do tipo ensaio clínico controlado e randomizado. Mas, de qualquer forma, passaremos a descrever cada um dos tipos de estudos experi-mentais com suas vantagens e desvantagens.

3.3.1 Ensaios clínicos controladosOs ensaios clínicos controlados são estudos usados como padrão-ouro de

referência dos métodos de pesquisa científica experimental, sendo considera-dos como de maior valor que os não-controlados. Esses ensaios são estudos prospectivos, nos quais o pesquisador compara os efeitos de uma intervenção, profilática ou terapêutica, em grupos de indivíduos previamente seleciona-dos. A intervenção pode ser um procedimento experimental, uma nova droga a ser testada, um novo método de diagnóstico ou um processo industrial, entre

7. O termo randômico tem origem na palavra inglesa random, que significa acaso, aleatório.

BIOESTATISTICA_Vol_01.indb 85 25/06/12 17:12

Page 86: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental86

outros. Para que o estudo seja efetivado, dois grupos de indivíduos devem ser selecionados, um grupo experimental e um grupo controle, de tal modo que o investigador possa distribuir os procedimentos (intervenções) a serem analisados entre eles. Ao grupo experimental, é aplicado o procedimento expe-rimental, como um novo medicamento a ser testado, por exemplo; ao grupo controle, é administrado um placebo ou uma droga já bem aceita como fármaco. Ao final do estudo, os dois grupos são, então, comparados para que o efeito da intervenção possa ser avaliado. Assim, como o objetivo do experimento é deter-minar se existem diferenças entre os tratamentos instituídos para os grupos experimental e controle, os estudos controlados têm mais probabilidade que os não controlados de detectar se estas diferenças se devem ou não ao trata-mento experimental ou a qualquer outro fator, como o acaso, por exemplo. Isto é, nos estudos não-controlados é mais difícil provar que os efeitos observados possam ser atribuídos unicamente ao tratamento instituído.

Embora, tradicionalmente, os ensaios clínicos controlados utilizem apenas dois grupos de comparação, nada impede que o pesquisador trabalhe com três ou mais grupos, simultaneamente. Porém, nesses casos, a complexidade do deli-neamento e da análise estatística aumenta de maneira bastante considerável, necessitando, portanto, de técnicas estatísticas mais avançadas de análise multi-variada, o que requer maior experiência da parte do pesquisador. Os métodos de análise multivariada são discutidos em capítulo específico deste livro.

Quanto ao modo de seleção dos sujeitos da pesquisa, os ensaios clínicos controlados podem ser classificados em randomizados e não-randomizados, os quais serão descritos a seguir.

Ensaios clínicos controlados e randomizados

Nesse tipo de delineamento, os indivíduos selecionados para participar da pesquisa são alocados, aleatoriamente, para um dos grupos de estudo, seja para o grupo experimental, seja para o grupo controle, sem que haja interferência do pesquisador, pois a seleção é feita por sorteio. A técnica da randomização8 garante que os grupos sejam formados por um processo aleatório de decisão,

8. As técnicas de randomização serão discutidas mais detalhadamente em outro capítulo deste livro.

BIOESTATISTICA_Vol_01.indb 86 25/06/12 17:12

Page 87: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 87

o que torna os grupos mais homogêneos e livres de vieses de seleção. Isto faz com que características basais individuais, como sexo, raça, idade, entre outras, sejam igualmente distribuídos entre os grupos selecionados, exceto pela variação do acaso, o que, de outro modo, poderia comprometer a quali-dade do estudo, pois a desigualdade entre os grupos inicialmente formados pode atuar como fator de erro na pesquisa. Além do mais, o caráter aleatório da escolha dos participantes estabelece a base para a aplicação dos testes de significância estatística das diferenças encontradas nas medidas dos desfe-chos estudados nos grupos participantes. Assim, a randomização aplicada ao delineamento da pesquisa experimental tem sido considerada como a maneira mais segura para a obtenção de dados mais confiáveis, sem vieses, pois fornece provas mais concretas no que tange às conclusões da relação causa e efeito, garantindo com maior segurança que os resultados encontrados no estudo não ocorreram como uma consequência do acaso, e sim, da própria intervenção testada no experimento. A Figura 3.9 mostra o esquema da relação temporal em um ensaio clínico controlado e randomizado.

Por exemplo, Diccini et alii (1999) conduziram um ensaio clínico controlado e randomizado, com grupos paralelos, sobre a adição de brometo de ipratrópio ao fenoterol no tratamento da crise de asma, em adultos. O trabalho teve como objetivo avaliar se a adição da droga em tratamentos inalatórios repetidos, induz maior broncodilatação em pacientes em crise de asma grave. Para propósitos de randomização, 120 pacientes de ambos os sexos, em crise de asma e assistidos no Pronto-Atendimento da Disciplina de Pneumologia da Universidade Federal de São Paulo, durante o período de julho de 1995 a fevereiro de 1997, foram divi-didos em dois grupos de 60 indivíduos cada: um grupo com crise grave e outro grupo com crise muito grave. Os pacientes do grupo com crise grave e muito grave foram subdivididos, de forma randomizada e paralela, em dois esquemas tera-pêuticos: um grupo recebeu fenoterol (F) e o outro grupo, brometo de ipratrópio mais fenoterol (BIF). Cada grupo recebeu três tratamentos inalatórios, através de nebulímetro e câmara de expansão, administrados em intervalos de 30 minutos. Com base nos resultados, os autores concluíram que a adição de ipratrópio não tem efeito terapêutico adicional de impacto significativo em adultos, tratados na emergência, com crise grave de asma brônquica.

BIOESTATISTICA_Vol_01.indb 87 25/06/12 17:12

Page 88: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental88

Fig. 3.9 – Esquema do fluxograma da relação temporal de um ensaio clínico

controlado e randomizado

De qualquer modo, alguns outros pontos são importantes e devem ser considerados quando do delineamento de um ensaio clínico controlado e ran-domizado, entre eles destacamos:•Seleção dos participantes – A identificação da população a ser estuda

é o primeiro passo, e começa na fase do delineamento, quando, então, são definidos os critérios de amostragem e recrutamento dos sujeitos da pesquisa. A escolha da população deve ser a mais adequada possível para responder à questão da pesquisa. Assim, uma vez definidos os critérios de amostragem e recrutamento, os quais serão discutidos em detalhes no capítulo específico que trata do tamanho da amostra e da randomização, o próximo passo é definir os critérios de inclusão e exclusão dos parti-cipantes, no estudo. Como um ensaio clínico tem como objetivo medir o impacto de uma intervenção sobre um determinado desfecho, para que o resultados sejam estatisticamente significativos, os critérios de entrada dos sujeitos devem obedecer a certos aspectos que otimizem esses resul-tados, tais como o número ideal de indivíduos, as suas características clínicas e demográficas (sexo, idade, raça etc.). Outros fatores, como o grau de aderência ao tratamento, a facilidade de recrutamento e do acompanhamento dos sujeitos também devem ser considerados. Desse modo, o bom senso nas decisões parece ser a maneira mais correta. Por

Direção da pesquisaProcedimentos experimentais

Direção do tempo

Início da pesquisa

Com desfecho estudado

Grupo experimental

Randomização

Grupo controle

Com desfecho estudado

Sem desfecho estudado

Sem desfecho estudado

População

Indivíduos selecionados para o estudo

BIOESTATISTICA_Vol_01.indb 88 25/06/12 17:12

Page 89: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 89

exemplo: se o objeto do estudo é testar uma nova droga para o controle de uma determinada doença, critérios bem definidos de diagnóstico para referida doença devem ser estabelecidos; se a idade e o sexo, por exem-plo, são fatores importantes para o desfecho estudado, a faixa etária ideal e o sexo dos participantes deverão ser definidos no protocolo; da mesma maneira, se o objetivo é estudar os fatores de risco de uma doença rara, é necessário recrutar sujeitos com alto risco de exposição para o desfecho. Como no exemplo anterior, os critérios de inclusão foram: idade de 18 a 70 anos; diagnóstico de asma com história de, pelo menos, duas crises prévias de dispnéia e chiado, aliviadas com broncodilatador; surgimento ou agravamento dos sintomas de asma nos últimos dias ou horas; PFE9 e VEF110 menor que 50% do valor previsto.Quanto aos critérios de exclusão, esses também merecem a devida atenção da parte do pesquisador, pois a inclusão de sujeitos inapropriados para o estudo pode comprometer a qualidade dos resultados, invalidando a generalização dos achados para a população. Os indivíduos que devem ser excluídos são aqueles que seriam adequados para o estudo caso não apre-sentassem uma característica que pode interferir na qualidade dos dados, na interpretação dos resultados e no critério de randomização. Assim, todos os sujeitos recrutados para a pesquisa, que apresentarem alto risco de efeitos colaterais, grande probabilidade de perda no acompanhamento, incapacidade de fornecerem dados confiáveis ou problemas de ordem ética, devem ser excluídos do estudo. Por exemplo: se o objetivo é avaliar um novo tipo de tratamento fisioterápico para o controle da lombalgia associada à hérnia discal, o bom senso nos diz que todos os pacientes com história clínica de trauma raquimedular devem ser excluídos, assim como as pacientes grávidas; se a proposta da pesquisa é estudar a eficácia de uma nova vacina, os pacientes em uso de corticosteróide deverão ser excluídos; da mesma maneira, os indivíduos incapazes de fornecer informações pre-cisas (doentes mentais, p. ex.), os que poderão vir a abandonar a pesquisa (mudança de residência, p. ex.), os que apresentem questão de ordem ética

9. PEF – Pico de Fluxo Expiratório.

10. VEF1 – Volume expiratório forçado no 1º segundo.

BIOESTATISTICA_Vol_01.indb 89 25/06/12 17:12

Page 90: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental90

(criança, p. ex.) ou aqueles com dados limítrofes nos critérios de inclusão deverão ser retirados da amostra. No exemplo anterior, os critérios de exclusão foram para os seguintes pacientes: fumantes acima de 50 anos de idade ou com mais de 30 maços/ano de tabagismo; com tosse e expectoração crônica por mais de três meses/ano, durante pelo menos dois anos consecutivos; mulheres grávi-das ou em período de lactação; com doenças pulmonares associadas ou pregressas que resultaram em sequelas pulmonares; com infecção aguda das vias aéreas inferiores, caracterizada por pelo menos dois dos três acha-dos - febre, expectoração purulenta ou infiltrado pulmonar ao radiograma torácico; portadores de doenças cardíacas ou renais; com incapacidade de fazer prova de função pulmonar adequada, por não colaboração ou por estarem muito graves (em franca insuficiência respiratória, apresentando respiração toracoabdominal, com incapacidade de falar, presença de cia-nose), exigindo tratamento imediato, sem possibilidade de avaliação pelo protocolo; participação prévia no estudo.

•Tamanho da amostra – Calcular o tamanho da amostra é o segundo passo mais importante no planejamento de um ensaio clínico, uma vez que amos-tras muito pequenas podem ser insuficientes para detectar diferenças sutis entre os grupos estudados, comprometendo o resultado da pesquisa, e amostras extremamente grandes, além de gerar gastos desnecessários, são, geralmente, antiéticas. Assim, é fundamental que o pesquisador faça um bom planejamento quanto à seleção de sua amostra, pois esta deve ser acessível e de tamanho adequado para a aplicação dos testes de signifi-cância estatística. As fórmulas para calcular o tamanho da amostra estão descritas no capítulo 4 deste livro.

•Escolha do grupo controle – Como referido anteriormente, a escolha do grupo controle é tão importante quanto a escolha do grupo experimental. Como regra geral, e quando a pesquisa visa a testar uma nova droga, o grupo controle deve ser escolhido entre aqueles indivíduos que não estão rece-bendo nenhum tipo de intervenção ou tratamento. Para esses indivíduos, os quais deverão ser cegados11, deve-se administrar um placebo com as mesmas

11. As técnicas de cegamento serão discutidas a seguir.

BIOESTATISTICA_Vol_01.indb 90 25/06/12 17:12

Page 91: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 91

características físicas (forma, cor, tamanho etc.) da droga a ser testada, de tal modo que este, visualmente, apresente-se idêntico ao tratamento original instituído para o grupo experimental, porém destituído de qualquer a ação farmacológica. Esse procedimento serve para mascarar qualquer efeito da intervenção ativa induzido por sugestão (efeito placebo) ou por outros meca-nismos não atribuídos ao tratamento, de tal maneira que, qualquer diferença encontrada no desfecho possa ser atribuída unicamente ao efeito biológico do tratamento instituído, como a administração de uma nova droga. Mas há ocasiões em que o grupo controle pode receber um procedimento-padrão já existente e bem estabelecido pela ciência, o qual será comparado com um novo tratamento proposto para a mesma doença; ou, ainda, o grupo controle pode estar recebendo um determinado procedimento que, por questões éti-cas, não pode ser interrompido durante o experimento (washout12), como ocorre em pacientes sob tratamento para pressão arterial, por exemplo. No primeiro caso, a escolha do grupo controle é simples, pois os indivíduos escolhidos não estão recebendo qualquer tipo de tratamento. No segundo caso, o procedimento padrão (tratamento), que pode ser uma droga ou uma determinada intervenção, deve ter sido consagrado pela literatura quanto à sua real eficácia, ou seja, tem que ser comprovadamente efetivo, pois, caso contrário, o pesquisador estará comparando um novo tratamento com algo que é duvidoso e, portanto, destituído de valor científico. No terceiro caso, a questão é puramente ética, pois interromper a administração de um tra-tamento de uso contínuo, como uma droga, por exemplo, para que esta não interfira nos resultados, pode pôr em risco a saúde dos indivíduos selecio-nados para compor o grupo controle. Assim, dentre essas três situações, o pesquisador deverá escolher a amostra mais adequada para o delineamento proposto no projeto original.

Ensaios clínicos não-randomizados

Em alguns modelos de delineamentos de estudos controlados, o método da randomização não é aplicado quando da escolha dos grupos de comparação, daí

12. Washout period – Refere-se ao intervalo de tempo durante o qual uma medicação de uso contínuo é interrompida, para que ocorra sua total eliminação do organismo, de tal maneira que não haja qualquer efeito residual da mesma durante o experimento.

BIOESTATISTICA_Vol_01.indb 91 25/06/12 17:12

Page 92: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental92

o porquê desses estudos também receberem a denominação de estudos com-parativos. Nesses casos, a distribuição dos procedimentos de intervenção entre os grupos estudados fica a critério do pesquisador que coordena a pesquisa e, portanto, sujeita ao viés de seleção. Por isso, em razão da não-randomiza-ção, e para muitos pesquisadores, estes tipos de estudos são considerados como propensos a resultados questionáveis, pois são pouco conclusivos na questão concernente à associação causa e efeito. Assim, sempre que possí-vel, o pesquisador deve evitar, em seus experimentos, a realização de estudos não-randomizados, exceto em alguns casos de controles históricos, quando o objetivo é um estudo preliminar sobre um fato de interesse, como o tratamento de uma doença, por exemplo, e quando os controles históricos foram tratados pelos próprios pesquisadores, pois isso garante alguma semelhança entre os grupos estudados.

Estudos com cegamento

O processo de cegamento constitui-se num método científico amplamente utilizado para prevenir que os resultados da pesquisa sejam influenciados tanto pelo efeito placebo quanto pelo viés de observação. Embora o termo cegamento seja um tanto inapropriado, ele define uma situação prática na qual, em um experimento, o pesquisador ou sujeitos da pesquisa, ou ambos, desconhecem, entre os diferentes procedimentos previstos, qual aquele que está sendo utilizado em cada um dos grupos da pesquisa, seja ele o grupo experimental ou o grupo controle. Este método, que melhora a acuidade e aumenta a precisão dos resultados de uma pesquisa, tradicionalmente é clas-sificado da seguinte maneira:

•Estudo-cego (single-blind trial) – Nesse tipo de estudo, apenas o sujeito da pesquisa desconhece onde está alocado, se no grupo experimental ou no grupo controle, tendo o pesquisador amplo conhecimento da distribui-ção dos participantes. Ele deve ser utilizado em experimentos, nos quais o pesquisador precisa controlar todos os passos da pesquisa. Entretanto, neste tipo de cegamento, existe o risco de que o sujeito da pesquisa possa ser influenciado pela sua interação com o pesquisador (viés do obser-vador), especialmente em estudos nas áreas da psicologia e das ciências

BIOESTATISTICA_Vol_01.indb 92 25/06/12 17:12

Page 93: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 93

sociais, onde o pesquisador tem uma expectativa de qual poderá vir a ser o resultado da pesquisa e, consciente ou subconscientemente, influenciar o comportamento do pesquisado.

•Estudo duplo-cego (double-blind trial) – Considerado o padrão-ouro da pesquisa científica, neste tipo de estudo, nem os participantes nem os pesquisadores sabem em qual grupo, tratamento ou controle, cada sujeito da pesquisa está alocado, o que elimina o viés de subjetividade de ambos e confere à pesquisa um alto grau de rigor científico. Este método cien-tífico tem sido largamente empregado como uma importante ferramenta de pesquisa em muitas áreas do conhecimento, em especial na medicina clínica, onde novos tratamentos têm sido testados comparativamente a um placebo (estudo placebo-concorrente) ou a uma droga bem estabelecida. Sua grande vantagem é prevenir que os resultados da pesquisa sofram a influência do efeito placebo e do viés de observação, pois reduz as chances dos participantes e dos pesquisadores influenciarem, sugestivamente, nos resultados, ou seja, que estes resultados sejam induzidos por aquilo que sujeitos ou os pesquisadores desejam ter como desfecho.

Tomemos como exemplo uma pesquisa para testar uma nova droga para tratamento da hipertensão arterial, sendo esta uma condição clínica extrema-mente influenciada pelo estado emocional do paciente. Neste experimento, o pesquisador deverá selecionar um grupo de pacientes hipertensos e, então, dividi-los em dois grupos: grupo tratamento, que irá receber a nova droga; grupo controle, que irá receber o placebo. Se não houver o cegamento dos pacientes e dos pesquisadores, poderá ocorrer a seguinte situação: se um paciente, seguramente hipertenso, souber que está recebendo um placebo, ou seja, um comprimido inócuo, destituído de qualquer efeito terapêutico, este paciente poderá ter seu estado emocional afetado e, por conseguinte, ter sua pressão arterial aumentada por conta desse estado emocional; por outro lado, se este mesmo paciente recebe a nova droga e sabe que a está recebendo e que está sendo tratado para a sua doença, isto pode tranquilizá-lo e, portanto, fazer com que sua pressão arterial diminua por influência do seu estado emocional, independentemente do efeito da droga administrada. Nesse caso, o pesquisa-

BIOESTATISTICA_Vol_01.indb 93 25/06/12 17:12

Page 94: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental94

dor não terá como saber se a pressão arterial diminuiu pelo efeito da droga ou pelo efeito emocional do paciente. Este tipo de influência também atua sobre o pesquisador, produzindo o chamado viés subconsciente, pois se este souber que está avaliando um paciente que faz parte do grupo experimental, ao exa-miná-lo, pode ser induzido a pensar que o paciente não apresenta sintomas da doença estudada, porque está recebendo a droga a ser testada. De maneira inversa, se souber que está avaliando um paciente do grupo controle, poderá ser induzido a acreditar que o paciente apresenta os sintomas da hipertensão arterial, uma vez que está recebendo o placebo. Daí porque tanto os pacientes como os pesquisadores devem ser cegados.

Uma boa maneira de se conduzir um estudo duplo-cego, quando quere-mos verificar a eficácia de uma nova droga para uma determinada doença, é a seguinte: o pesquisador coordenador determina que seus auxiliares (médicos, farmacêuticos etc.) administrem aos pacientes voluntários, uma cápsula (ou comprimido, xarope etc.) que pode ou não conter a droga a ser testada. Esta droga é manipulada em dois tipos idênticos (forma, cor, tamanho etc.) de cáp-sulas: uma contendo o pó da droga estudada, e a outra que contém a substância inerte (farinha de trigo, p. ex.). O auxiliar médico anota o número da cápsula sem saber se esta contém o medicamento ou o placebo. Tampouco o paciente sabe a composição real da cápsula. Após o período determinado para que ocorra o efeito da droga, o mesmo médico examina o paciente e anota quanti-tativamente a melhora ou não das alterações esperadas na doença. A seguir, a ficha é devolvida ao pesquisador que tabula os resultados sabendo qual tipo de cápsula foi ingerida pelo paciente. Desta maneira, consegue-se excluir o efeito placebo existente em um medicamento inerte e validar um medicamento que realmente faça o efeito desejado.

Assim, somente após todos os dados terem sido coletados e compilados, e, em alguns casos analisados, os pesquisadores tomam conhecimento da distribuição dos sujeitos da pesquisa nos grupos estudados, o que diminui o efeito placebo e o viés do observador. Deste modo, os códigos que identificam os sujeitos da pesquisa, e a qual grupo eles pertencem, permanecem guarda-dos com uma terceira pessoa, não sendo conhecidos pelo pesquisador até que a pesquisa tenha sido terminada. Da mesma maneira, a alocação randômica dos participantes, em cada um dos grupos, experimental ou controle, é uma

BIOESTATISTICA_Vol_01.indb 94 25/06/12 17:12

Page 95: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 95

parte importante do estudo duplo-cego, pois garante a eliminação do viés de seleção, sendo, desta maneira, considerado como um tipo especial de ensaio clínico controlado e randomizado.

A aplicação dos estudos duplo-cegos pode ocorrer em qualquer expe-rimento onde existe a possibilidade de que os resultados possam ser influenciados pelos vieses consciente ou subconsciente, tanto da parte do pes-quisador quanto da parte dos sujeitos da pesquisa, os quais, obviamente, só podem ser seres humanos.

Por exemplo, Caetano et al conduziram um estudo duplo-cego em 37 pacien-tes ambulatoriais, adultos e de ambos os sexos, para avaliar, comparativamente, a eficácia e a tolerância da buspirona e do lorazepam no tratamento da ansiedade generalizada. Vinte e um pacientes receberam buspirona, 5mg três vezes ao dia, e 16 pacientes receberam lorazepam, 1mg três vezes ao dia, por um período de quatro semanas. A eficácia, avaliada através da escala de Hamilton, para ansie-dade, foi similar para as duas drogas. A tolerância foi boa com ambas as drogas, assim como também elas foram equivalentes nos efeitos colaterais, a não ser quanto à sonolência, presente somente no grupo lorazepam.

•Estudo triplo-cego (triple-blind trial) – Esse estudo corresponde a uma variante do estudo duplo-cego, no qual os demais profissionais envolvidos na pesquisa também são cegados quando da leitura e interpretação dos resultados clínicos e laboratoriais, tais como os radiologistas, patologis-tas, laboratoristas e, até mesmo, os estatísticos envolvidos nas análises dos dados, por exemplo.

Estudos autocontrolados

Ensaios clínicos autocontrolados são aqueles em que um ou mais grupos de pessoas são randomicamente selecionados para participar da pesquisa, e cada indivíduo serve como seu próprio controle na avaliação do efeito do tratamento a ser testado, ou seja, cada paciente, em cada um dos grupos, é avaliado antes e depois da intervenção. Um bom exemplo para este tipo de estudo é um delineamento no qual um investigador deseja testar uma nova droga para controle da hipercolesterolemia. Neste estudo, o pesquisador seleciona um grupo de pacientes hipercolesterolêmicos e os subdivide, ou

BIOESTATISTICA_Vol_01.indb 95 25/06/12 17:12

Page 96: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental96

não, aleatoriamente, em dois ou mais grupos, e cada grupo vai receber uma droga a ser estudada. Sendo em um único, ou mais de um grupo, cada paciente do estudo tem sua taxa de colesterol plasmático medida no início do estudo, ou seja, antes da administração da droga e, somente depois de transcorrido o tempo necessário para que ela atue efetivamente, uma nova dosagem é efeti-vada para efeito de comparação.

Neste tipo de estudo, quando apenas um grupo é selecionado, a falta de um grupo controle paralelo constitui uma desvantagem, pois a aparente melhora dos sujeitos da pesquisa pode ter ocorrido em razão dos mesmos terem recebido uma atenção especial decorrente de sua participação no estudo e não como consequência da própria intervenção estudada, uma vez que pessoas podem alterar seu comportamento inconscientemente. Esta condição é conhecida como efeito Hawthorne, fenômeno segundo o qual os sujeitos sob observação podem agir de maneira particular. Ele des-creve uma mudança temporária no comportamento e no desempenho em resposta a uma alteração das condições ambientais, com a resposta sendo, tipicamente, uma melhora. O termo foi concebido em 1955, por Henry A. Landsberg, quando este analisou antigas experiências com trabalhadores da fábrica Hawthorne (Chicago, USA). Este tipo de variação pode ser decor-rente do efeito aprendizado, por exemplo, quando os participantes do estudo apresentam um melhor desempenho nas avaliações finais em razão de terem aprendido com as avaliações iniciais, como ocorre em estudos que dependam do fator memória.

Uma boa estratégia para diminuir o efeito Hawthorne é iniciar e inter-romper, repetidas vezes, a intervenção que está sendo testada, desde que a variável desfecho responda rápida e irreversivelmente a esta. Se as sucessivas aplicações e retiradas da intervenção produzem resposta similares, os resulta-dos indicam, com boa margem de segurança, que as mudanças se devem a esta e não a outros fatores.

Estudos cruzados (cross-over)

Os delineamentos cruzados correspondem a uma variação dos estudos autocontrolados. Neste tipo de ensaio, um grupo de participantes é aleato-riamente subdividido em dois grupos: um grupo experimental, ao qual é

BIOESTATISTICA_Vol_01.indb 96 25/06/12 17:12

Page 97: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 97

aplicado o tratamento ou a intervenção a ser testada; e um grupo controle, que pode receber um placebo ou um tratamento já bem definido. Após o perí-odo de tempo necessário para que a intervenção ou o tratamento possam ser avaliados, os participantes são submetidos a um período de “descanso”, durante o qual não recebem nenhuma intervenção ou tratamento (washout) até que se tenha certeza de que não há nenhum efeito residual (efeito

carryover)13 no grupo experimental. Depois de transcorrido o período de “descanso”, os grupos, experimental e controle, são, então, invertidos; ou seja, o grupo experimental passa a receber o placebo ou o tratamento bem definido, e os participantes do grupo controle recebem o tratamento ou a intervenção que está sendo testada. A Figura 3.10 mostra o fluxograma do delineamento de um estudo cruzado.

Os ensaios com cruzamento têm sido bastante utilizados em estudos clí-nicos para avaliação de novos fármacos e, quando bem delineados, constituem uma poderosa ferramenta de pesquisa científica. Apesar de apresentarem algumas desvantagens, como a possível presença do efeito carryover, o que demanda um período de washout, e a necessidade de um maior tempo de dura-ção da pesquisa, em razão das duas etapas necessárias e consecutivas para completar o cruzamento, estes estudos apresentam grandes vantagens na sua execução, pois minimizam o viés de confundimento e diminuem o número de participante, uma vez que cada indivíduo serve como seu próprio controle. Um outro aspecto importante é a possibilidade de se trabalhar com três ou mais grupos, simultaneamente, de modo que se possa fazer uma avaliação entre eles, porém, nessa condição, é necessária uma abordagem que utilize o método do quadrado latino14, para que se proceda a uma perfeita combinação nos cruza-mentos dos grupos estudados.

13. Tradicionalmente, é o efeito causado pelas sucessivas passagens de substâncias poluentes através de diferentes organismos de uma cadeia alimentar. Em pesquisa experimental, é o efeito residual que passa de uma condição experimental para outra.

14. Corresponde a uma matriz n × n, preenchida com n diferentes símbolos, de tal maneira que cada símbolo ocorre no máximo uma vez em cada linha ou coluna. Tem sua origem atribuída ao matemático e físico suíço Leonhard Paul Euler (1707-1783).

BIOESTATISTICA_Vol_01.indb 97 25/06/12 17:12

Page 98: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental98

Fig. 3.10 – Esquema do fluxograma da relação temporal de um ensaio clínico com cruzamento

Estudos com controles externos

Os ensaios com controle externo constituem uma alternativa para a rea-lização de estudos de experimentação clínica. Neste tipo de estudo, o grupo controle é estabelecido a partir do resultado da pesquisa de outro pesquisador, a qual é utilizada para efeito de comparação. Outra opção são os controles

históricos, frequentemente utilizados para o estudo de condições raras, como doenças, por exemplo, ou em estudos preliminares. Nestes, o pesquisador uti-liza seus casos antigos, anteriormente tratados, como grupo controle, porém sempre observando se, desde a época do tratamento não ocorreram mudanças nos fatores estudados. A grande vantagem dos controles históricos sobre os controles externos é que, nos primeiros, o pesquisador foi responsável pela condução da pesquisa anterior e, por isso, saberá selecionar melhor os casos que concorrerão para compor o grupo controle da pesquisa atual, ao passo que, nos controles externos, esta seleção poderá estar comprometida pela inexati-dão dos dados publicados na literatura.

Direção da pesquisa

Primeira intervenção

Segunda intervenção

Período de descanso

Direção do tempo

Início da pesquisa

Com desfecho

Com desfecho

Com desfecho

Com desfecho

Grupo experimental

Grupo experimental

Grupo controle

Grupo controle

Randomização

Sem desfecho

Sem desfecho

Sem desfecho

Sem desfecho

População

Indivíduos selecionados para o estudo

BIOESTATISTICA_Vol_01.indb 98 25/06/12 17:12

Page 99: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 99

3.3.2 Ensaios clínicos não-controladosNa prática clínica, existem situações em que os estudos de intervenção têm

sido efetivados sem o acompanhamento de um grupo controle, e que, à luz da metodologia científica, não podem ser definidos como ensaios ou experimen-tos. Por este motivo, a maior parte da comunidade científica tem se negado a aceitar a utilização de estudos não-controlados para determinar a eficácia de um determinado procedimento terapêutico, especialmente quando este proce-dimento envolve um medicamento. Assim, a ausência do grupo controle confere menor qualidade e menor confiabilidade aos resultados da pesquisa, uma vez que, muito raramente, estes estudos são randomizados e nunca delineados no modelo com cegamento, tal como em um estudo duplo-cego. Mas, por outro lado, quando se cerca de critérios metodológicos bem definidos e que atendam ao rigor científico, mesmo com a utilização de estudos não-controlados, o pes-quisador poderá obter resultados de boa qualidade.

Por exemplo, Troiano et alii (2004) publicaram os resultados de um ensaio clínico não-controlado que utilizou o propranolol de ação prolongada no tra-tamento de pacientes com tremor essencial. Nesse estudo, 40 pacientes foram submetidos a um protocolo de avaliação pré-estabelecido em que constavam escalas de classificação e escalas de avaliação da severidade do tremor. Os autores do estudo objetivaram relatar os resultados do uso do propranolol de ação prolongada em pacientes com tremor essencial, virgens de tratamentos anteriores. Todos os pacientes foram submetidos à avaliação inicial e após um mês de tratamento, o qual foi instituído com o aumento progressivo da dose de propranolol até 320mg ao dia ou dose suficiente para controle do tremor (160mg ou 240mg ao dia), sem o aparecimento de efeitos colaterais incapaci-tantes. Como não houve comparação com um grupo de pacientes tratados de outra maneira, este estudo é classificado como não-controlado.

3.4 ESTUDOS DE META-ANÁLISE

Define-se como meta-análise, uma revisão sistemática da literatura espe-cializada, que utiliza uma abordagem bem definida e uniforme na seleção de artigos científicos, no intuito de responder a uma questão clínica específica, com o emprego de técnicas estatísticas que combinam ou integram os resul-

BIOESTATISTICA_Vol_01.indb 99 25/06/12 17:12

Page 100: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental100

tados de diversos estudos independentes voltados a um assunto de interesse. Ou seja, a meta-análise é um tipo de análise estatística de dados, em que os resultados de vários estudos de pesquisa são agrupados e analisados como se fosse o resultado de um único grande estudo, sem que, necessariamente, algum deles tenha encontrado algo de significância estatística, não sendo, portanto, um estudo de observação ou experimental.

O termo meta-análise, que advém do prefixo grego met(a), e expressa as idéias de participação, mistura ou intermediação e sucessão, teve suas apli-cações iniciais ainda na primeira metade do século XIX, na astronomia, com base nos trabalhos do matemático alemão Johann Carl Friedrich Gauss (1777-1855) e do matemático francês Pierre-Simon Laplace (1749-1827), quando se determinou que a combinação de dados de diferentes estudos teria resul-tados mais confiáveis que a observação de cada um deles, individualmente. Posteriormente, cerca de um século depois, um cientista social norte-ameri-cano, o psicólogo Gene Glass, foi o primeiro a denominar o processo de revisão sistemática da literatura, de meta-análise. Do mesmo modo, já no século XX, no idos de 1904, o matemático e estatístico inglês Karl Pearson (1857-1936) foi responsável pela publicação, na Revista Britânica de Medicina (British Medical Journal), do primeiro trabalho de pesquisa com a utilização das técnicas de meta-análise, quando o governo britânico pediu a ele que revisasse a evidência dos efeitos preventivos de uma vacina contra a febre tifóide.

Assim, embora os procedimentos da meta-análise tenham sido desen-volvidos por estatísticos durante os 60 anos subsequentes, foi somente na década de 1970 que este método começou a ser mais cientificamente difundido, inicialmente nas ciências sociais e, posteriormente, por pesqui-sadores das áreas das ciências da saúde, sendo, atualmente, uma ferramenta amplamente utilizada na área médica, especialmente em estudos de revisão sistemática de ensaios clínicos randomizados, com intuito de tentar eluci-dar questões controversas no que tange ao melhor tratamento para pacientes com uma condição clínica específica. Deste modo, um estudo de meta-análise deve utilizar métodos apropriados para identificar, selecionar e avaliar, crite-riosamente, os resultados dos estudos os quais serão incluídos na revisão, de maneira a integrar, eficientemente, as informações existentes, criando dados que auxiliem na tomada de decisão. Portanto, uma etapa importante é a sele-

BIOESTATISTICA_Vol_01.indb 100 25/06/12 17:12

Page 101: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 101

ção dos estudos que irão compor a meta-análise, os quais serão classificados conforme a sua qualidade.

3.4.1 Tipos de meta-análiseMetodologicamente, um estudo de meta-análise é classificado segundo

sejam os critérios qualitativos ou quantitativos empregados na análise dos estudos envolvidos. Assim temos:

Meta-análise qualitativa

Também chamada de análise metodológica, esta técnica é empregada quando se deseja conhecer se existe qualquer tipo de benefício quanto ao uso de uma determinada intervenção, sem considerar, no entanto, o quanto de benefício possa existir. Neste tipo, cada um dos trabalhos analisados para o estudo é pontuado segundo critérios previamente definidos pelo pesqui-sador, que, então, seleciona aqueles metodologicamente mais consistentes, analisa-os conjuntamente e determina se a questão da pesquisa é respondida quanto à existência ou não de benefícios do tratamento estudado. Este tipo de meta-análise tem sido bastante discutido quanto a sua validade em razão das dificuldades de se estabelecer critérios consistentes de avaliação e, por isso, tem sido pouco empregado.

Meta-análise quantitativa

Neste tipo de meta-análise, também chamada de análise agregada, o principal objetivo é associar, quantitativamente, os resultados de vários estudos publicados sobre um determinado procedimento, tal como uma intervenção, e desenvolver estimativas da quantidade de benefícios com base na combinação ponderada dos dados desses estudos. Neste tipo de meta-análise, a questão a ser respondida não é apenas se existe, ou não, qualquer tipo de benefício na aplicação do procedimento estudado, mas o quanto deste benefício pode ser estimado pela aplicação de técnicas esta-tísticas especiais. Neste sentido, vários são os parâmetros que podem ser calculados para determinar os resultados de uma meta-análise, e, entre eles, os mais usuais são o cálculo da razão de risco (risco relativo ou risk ratio), da razão de chance (odds ratio), do odds ratio meta-analítico de Mantel-

BIOESTATISTICA_Vol_01.indb 101 25/06/12 17:12

Page 102: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental102

Haenszel e do odds ratio meta-analítico de Peto, além da aplicação do teste Q de homogeneidade de Cochran e do cálculo do peso de cada estudo, sepa-radamente, todos abordados no item que trata dos métodos estatísticos para a meta-análise (item 3.4.3).

3.4.2 Etapas para a meta-análiseIgualmente como na elaboração de qualquer projeto de pesquisa, tam-

bém na elaboração de uma meta-análise, os procedimentos para completar cada uma de suas etapas devem ser delineados em um protocolo de pesquisa previamente identificado, antes que se proceda à revisão sistemática da lite-ratura. Dentre essas etapas, além da escolha da questão da pesquisa, a qual deverá ser submetida aos critérios FINER, descritos no item 2.1.2. deste livro, que trata da formulação da questão da pesquisa, merecem destaque os critérios utilizados para a identificação e seleção dos estudos que passarão a compor a meta-análise, critérios estes que discutiremos a seguir. A Figura 3.11 mostra um fluxograma que contempla cada uma das etapas de uma meta-análise, com os seus respectivos procedimentos.

Identificação dos estudos

Por questão de praticidade, as fontes a serem consultadas e os procedi-mentos para identificação dos possíveis estudos que comporão a meta-análise deverão ser previamente determinadas, isto é, todos os critérios de iden-tificação devem ser definidos antes do início da pesquisa. Esta estratégia, quando bem definida, permite uma busca bastante abrangente e livre de vieses de seleção. Outro ponto importante é a escolha das bases de dados a serem consultadas, as quais deverão, também, ser definidas a priori e, via de regra, deverão conter os trabalhos relacionados à questão da pesquisa. Neste item, não deve o pesquisador limitar-se apenas àquelas bibliotecas eletrôni-cas mais importantes e tradicionais, tais como MEDLINE, LILACS, PubMed ou Sciencedirect, devendo incluir outras bases menores, assim como publica-ções presentes em bibliotecas, na forma de livros e revistas. Mas, de qualquer forma, a busca metódica é ponto crucial, e, nesse sentido, a escolha de pala-vras-chave associadas à questão da pesquisa é um bom começo para iniciar a busca da literatura.

BIOESTATISTICA_Vol_01.indb 102 25/06/12 17:12

Page 103: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 103

Fig. 3.11 – Fluxograma relativo aos procedimentos de uma meta-análise

conforme cada uma de suas etapas

Etapas Procedimentos

Elaboração do protocolo• Escolha da questão da pesquisa• Testar o critério FINER

Identificação dos estudos• Consulta à base de dados - MEDLINE,

LILACS, PubMed, Sciencedirect etc.

Seleção dos estudos

• Definir o tipo de estudo• Definir os critérios de inclusão• Definir o período das publicações• Proceder à revisão sistemática dos

estudos selecionados

Coleta de dados

• Utilizar de formulários próprios• Definir o método para cálculo do

tamanho do efeito do tratamento – odds ratio, risk ratio, IC95%

Análise do viés de publicação

• Fazer a análise de sensibilidade• Utilizar gráfico de distribuição conjunta

Cálculo do efeito do tratamento

• Calcular a odds ratio ou risk ratio etc., para cada estudo.

• Usar os testes de homogeneidade de Cochran e Estatística I2

Cálculo do efeito-sumário

• Determinar o peso de cada estudo• Determinar se modelo fixo ou modelo

aleatório

Representação gráfica• Desenhar o gráfico• Interpretar seus resultados

BIOESTATISTICA_Vol_01.indb 103 25/06/12 17:12

Page 104: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental104

Seleção dos estudos

Nesta parte do planejamento da meta-análise, serão definidos os crité-rios para inclusão e exclusão dos estudos previamente identificados, sendo esta etapa considerada, por muitos autores, como a mais difícil e laboriosa. Dentre estes critérios, destacamos como os mais importantes o tipo de estudo a ser considerado, se ensaio clínico controlado e randomizado, estudo caso--controle ou duplo-cego; o período de publicação dos artigos selecionados, se nos últimos dez ou vinte anos, por exemplo, assim como o tempo mínimo de acompanhamento dos grupos considerados nestes estudos. Outros critérios poderão incluir o tipo de população selecionada, o tamanho da amostra sufi-ciente para que o resultado do estudo possa ser confiável, a presença de um grupo controle bem definido e, em especial, que o método empregado obedeça, rigorosamente, a todos os preceitos da boa metodologia científica. Aqui, não é inoportuno lembrar que, todos os estudos selecionados deverão abordar a mesma doença, intervenção ou condição de interesse, objeto da meta-análise, assim como, todos eles deverão utilizar métodos idênticos, pois não parece lógico misturar resultados de estudos com métodos científicos diferentes, tal como em uma meta-análise que tomasse como base estudos caso-controle e de coorte, simultaneamente.

Assim, uma vez que os artigos tenham sido selecionados, cada um deles passará por uma minuciosa revisão, a qual deverá ser feita por dois ou mais revisores, os quais, por questão de prudência, deverão ser cegados quanto à origem do artigo científico no que tange ao nome da revista científica, aos auto-res e à data de publicação, de modo a evitar possíveis escolhas tendenciosas. Em caso de discordância entre os revisores, um terceiro revisor deverá anali-sar o estudo em questão no sentido de dirimir dúvidas, sendo as pendências, sempre que possível, resolvidas mediante consenso. De qualquer maneira, os critérios de exclusão deverão ser bem definidos, e cada estudo excluído deverá ter o motivo bem determinado por cada um dos revisores.

Coleta dos dados

Neste passo, a utilização de formulários específicos é a maneira mais prática e correta para a extração dos dados de interesse presentes nos artigos selecio-nados para a meta-análise. Estes formulários devem ser elaborados de forma

BIOESTATISTICA_Vol_01.indb 104 25/06/12 17:12

Page 105: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 105

clara e objetiva, de tal maneira que todas as informações numéricas presentes nas tabelas, figuras ou mesmo no texto desses artigos possam ser catalogadas para posterior análise. Eles devem conter, também, as características do deli-neamento, o número de indivíduos presentes em cada grupo e subgrupo do estudo, assim como o resultado do desfecho. Lembre-se, na meta-análise do tipo quantitativa os dados numéricos serão utilizados para o cálculo dos testes estatísticos que determinarão os resultados finais da meta-análise, tais como o cálculo da razão de risco (risco relativo ou risk ratio), da razão de chance (odds ratio) e dos intervalos de confiança de cada um dos estudos, isoladamente e em conjunto, devendo, portanto, ser obtidos de maneira uniforme e livre de vieses. Com este intuito, além das características importantes de cada estudo, isolada-mente, como citado anteriormente, cada formulário deverá ser construído de modo a conter as estimativas de risco e os intervalos de confiança de cada um deles, os quais deverão ser demonstrados em tabelas e gráficos (ou figuras) próprios para este tipo análise. Por último, o formulário deverá apresentar o resultado combinado (também descrito como estimativa-sumário) da odds ratio ou do risk ratio, e o intervalo de confiança final, tomando por base os resultados de todos os estudos incluídos na revisão.

Cabe, aqui, uma observação importante a respeito do cálculo dos resultados finais de uma meta-análise: desde que todas as informações importantes estejam disponíveis nos artigos selecionados, é sempre possível calcular os valores das razões de chance, dos riscos relativos e dos intervalos de confiança com base nos dados brutos apresentados em estudos do tipo ensaio clínico randomizado, mas, geralmente, é impossível, por razões já citadas no item 3.2.3 deste capítulo, calcu-lar as estimativas de risco e os intervalos de confiança a partir dos dados brutos de estudos observacionais do tipo caso-controle, uma vez que, nestes estudos, a população básica não é conhecida, a não ser que haja informações suficientes para calculá-la. Nestes casos, deve o pesquisador contatar os autores do artigo no sen-tido de tentar obter as informações que não estão incluídas no texto, e, quando isto não é possível, é mais prudente que o artigo seja excluído da meta-análise.

Análise do viés de publicação

Um outro fator que deve ser examinado, quando da avaliação dos estudos selecionados para a meta-análise, é o potencial para um viés de publicação, o

BIOESTATISTICA_Vol_01.indb 105 25/06/12 17:12

Page 106: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental106

qual é definido como uma condição em que os estudos publicados sobre um determinado assunto não são representativos da totalidade dos estudos reali-zados ou quando a análise de estudos não-publicados apresentam resultados muito diferentes daqueles de estudos publicados. Esta condição decorre do fato de que é muito mais comum a publicação de estudos com resultados positi-vos que aqueles com resultados negativos. Aqui um problema: como identificar os estudos não-publicados? Isto é uma questão que deverá ser decidida pelo pesquisador. Talvez em dissertações ou teses, resumos de congressos? Porém, muito frequentemente, estes resumos não apresentam dados suficientes que possam ser extraídos, daí porque, geralmente, os estudos não-publicados não são incluídos nas meta-análises.

Por outro lado, sempre que estudos não-publicados e pouco confiáveis são encontrados, é conveniente saber se estes estudos, quando incluídos, podem modificar, de maneira consistente, o resultado final da meta-análise, ou seja, o resultado combinado obtido a partir de todos os estudos publicados e pré--selecionados. A esse procedimento dá-se o nome de análise de sensibilidade, a qual é tida como positiva quando a inclusão desses estudos modifica o resul-tado final da pesquisa.

Assim, no sentido de evitar qualquer tipo de erro no resultado final de uma meta-análise, a maneira mais eficaz é proceder-se a análise da inten-sidade do viés de publicação, a qual é realizada mediante a aplicação de um gráfico de distribuição conjunta (gráfico de dispersão), onde os logaritmos dos riscos relativos (ou das razões de chance) dos estudos selecionados são colocados no eixo das abscissas (x), e os valores dos tamanhos das amostras desses estudos, no eixo das ordenadas (y). Nesse processo, uma forte corre-lação entre os desfechos e os tamanhos das amostras sugere um possível viés de publicação, e o gráfico mostrará uma distribuição de forma pouco definida e de aspecto truncado. Porém, se não houver qualquer tipo de viés de publi-cação, é pouco provável que ocorra uma associação entre os tamanhos dos estudos e seus desfechos, com o gráfico mostrando uma curva em forma de sino ou de funil, com seu ápice situado próximo do resultado final combinado (estimativa-sumário) dos estudos.

Este tipo de associação, entre o tamanho da amostra e o resultado do estudo, ocorre porque estudos de pequeno porte geralmente não são publicados, espe-

BIOESTATISTICA_Vol_01.indb 106 25/06/12 17:12

Page 107: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 107

cialmente quando seus resultados são desfavoráveis, ou seja, quando não tenham encontrado correlação entre a intervenção e o desfecho, ao passo que os estu-dos de grande porte, independente dos resultados encontrados, tendem a ser publicados. Do mesmo modo, todos os estudos com resultados positivos são geralmente publicados, independente do tamanho, o que cria um viés, porque se pode encontrar um resultado positivo na estimativa-sumário apenas pelo fato de estudos de grande porte terem sido selecionados para compor a meta-análise ou pela tendência de seleção de estudos com resultados positivos.

A Figura 3.12 mostra o gráfico de distribuição conjunta de um estudo de meta-análise com dezenove artigos selecionados. A figura em forma de funil informa que o viés de publicação foi mínimo, pois estudos com pequenas amos-tras apresentaram tanto resultados negativos e como positivos, demonstrando que a seleção dos estudos foi bem elaborada.

Portanto, toda vez em que for elevada a chance da ocorrência de um grande viés de publicação, o resultado final da meta-análise de ser interpretado com bastante parcimônia, ou não deve ser calculado. No primeiro caso, é conve-niente uma breve discussão sobre o potencial viés, quando da publicação dos resultados, para que o leitor possa formar um juízo de valor a respeito desses resultados. Aqui um lembrete: muito mais importante que o número, é a quali-dade de artigos selecionados, uma vez que estudos de baixa qualidade tendem a produzir resultados pouco confiáveis.

 

Fig. 3.12 – Gráfico em “funil” sugerindo pouco viés de publicação

BIOESTATISTICA_Vol_01.indb 107 25/06/12 17:12

Page 108: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental108

3.4.3 Métodos estatísticos para a meta-análiseLembre-se sempre, o principal objetivo de uma meta-análise é calcular

uma estimativa que combina o resultado de diversos estudos sobre um mesmo tema. Assim, uma vez que entre todos os estudos identificados, tenham sido selecionados aqueles que preencham os critérios de inclusão e exclusão, e os seus dados tenham sido catalogados, é hora de calcular uma estimativa-sumá-rio, isto é, o resultado final combinado da meta-análise com base no cálculo do risco relativo-combinado, da razão de chance-combinada e do intervalo de confiança, sendo este resultado, um valor médio, ponderado de acordo com o tamanho de cada um dos estudos. Logo, estudos com grandes amostras rece-bem peso maior, ao passo que estudos pequenos recebem peso menor.

Para tanto, vários são os procedimentos estatísticos que podem ser utiliza-dos a fim de calcular o sumário dos efeitos em uma meta-análise, os quais serão discutidos a seguir, sendo a escolha do método um procedimento que depende do tipo de desfecho estudado. Assim sendo, para efeito de ilustração dos cálcu-los que serão aqui apresentados, será utilizada uma meta-análise elaborada a partir de 16 estudos fictícios, do tipo ensaio clínico controlado e randomizado, cujos dados estão expressos na Tabela 3.1. Cada um dos 16 estudos é consti-tuído por dois grupos: um Grupo Tratamento e um Grupo Controle, sendo o tratamento a ser testado, uma intervenção clínica. O desfecho estudado será o sucesso do tratamento, o qual será expresso como presente (sim), ou ausente (não), em ambos os grupos. Aqui é válido lembrar que estudos de coorte ou caso-controle também podem ser utilizados, desde que preencham todos os critérios de inclusão e exclusão, como discutidos anteriormente.

A - medidas do tamanho do efeito do tratamento

Nos trabalhos de meta-análise, uma estimativa do tamanho do efeito do tratamento deve ser calculada para cada um dos estudos previamente selecio-nados. Este procedimento tem por objetivo analisar as diferenças existentes entre os dois grupos definidos em cada um desses estudos, isoladamente, o que permite avaliar o efeito da intervenção neles testada, de tal modo que qualquer diferença encontrada entre os grupos avaliados possa ser atribu-ída unicamente à intervenção que está sendo estudada (efeito específico), e não a efeitos inespecíficos do tipo efeito placebo, decorrente da aplicação de

BIOESTATISTICA_Vol_01.indb 108 25/06/12 17:12

Page 109: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 109

uma intervenção semelhante, mas que não tem uma ação específica conhecida, ou efeito Hawthorne, fenômeno segundo o qual, os sujeitos sob observação podem agir de maneira particular, ambos discutidos no item 3.3.1, deste capí-tulo. Da mesma forma, as medidas do tamanho do efeito do tratamento, tais como a razão de risco e a odds ratio, serão utilizadas como parâmetros para calcular a intensidade do viés de publicação, conforme demonstrado, anterior-mente, neste capítulo.

Diante do exposto, podemos escolher, dentre as diversas maneiras pelas quais podemos avaliar o tamanho do efeito do tratamento, em uma meta-aná-lise, aquela que mais se adequa ao estudo desejado, sendo as mais utilizadas o risco relativo (RR) e a razão de chance (OR). Outras, tais como a redução abso-luta de risco (RAR), a redução relativa de risco (RRR) e o número necessário para tratar (NNT) também podem ser calculados.

A seguir demonstraremos o cálculo dessas medidas, cujos resultados estão contemplados na Tabela 3.1. Para tanto, utilizaremos, como guia prático, uma tabela de contingência 2 x 2 (Tabela 3.2) amplamente empregada em cál-culos epidemiológicos de medidas de efeito e medidas de associação entre uma determinada intervenção e o seu desfecho.

Odds ratio (OR)

Também chamada razão de chance, é uma medida que estima a força da associação entre a intervenção (tratamento) a ser estudada e a ocorrência do desfecho considerado no estudo, cujo objetivo é verificar se a chance da ocor-rência do desfecho (doença, p.ex.) no grupo exposto à intervenção (ou ao fator de risco) é maior, ou menor, do que no grupo não exposto. Desse modo, podemos dizer que a odds ratio é a razão (quociente) entre a chance de um evento ocorrer nos indivíduos submetidos a um determinado tratamento e a chance da ocor-rência deste mesmo evento nos indivíduos do grupo controle. Por exemplo, se em um grupo de indivíduos submetidos a um determinado tratamento, a chance para a ocorrência de complicações é igual a 60%, e a chance de ocorrer a mesma complicação no grupo controle é igual a 40%, logo a odds ratio é igual a 0,6/0,4 = 1,5. Isto significa que a chance de ocorrer complicação no grupo tratamento equivale a 1,5 vezes a chance de ocorrer a mesma complicação no grupo controle. Assim, uma odds ratio igual a 1, indica que a chance de ocorrer complicações no

BIOESTATISTICA_Vol_01.indb 109 25/06/12 17:12

Page 110: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental110

grupo tratamento é igual à chance de ocorrer complicações no grupo controle, sendo, portanto, o tratamento considerado como não causador das complicações.

Assim, para o estudo 01, mostrado na Tabela 3.1, temos:

OR

a

c

b

d

ad

bc= = = ×

×= =8

162

1 312

9721 35

164

6

.,

Portanto, considerando o resultado calculado para o estudo 01, podemos afirmar que a chance da ocorrência do desfecho, no grupo tratamento, é 1,35 vezes maior quando comparada à chance para ocorrência do mesmo desfecho no grupo controle. Para os demais estudos mostrados na Tabela 3.1, o cálculo da odds ratio é realizado de maneira semelhante.

Tabela 3.1 – Resultados fictícios relativos a dezesseis ensaios clínicos controlados e randomizados

Estudo

Grupo TratamentoDesfecho

Grupo ControleDesfecho

Total(n)

OR RR IC95% Valor PSim(a)

Não(b)

Sim(c)

Não(d)

01 8 162 6 164 14/340 1,35 1,33 0,41 - 4,49 0,784

02 19 111 8 122 27/260 2,61 2,38 2,61 - 1,03 0,042

03 1 69 2 138 3/210 1,00 1,00 0,09 - 10,84 0,537

04 65 342 9 441 74/857 9,31 7,99 4,41 - 20,33 < 0,05

05 22 176 17 181 39/396 1,33 1,29 0,65 - 2,73 0,499

06 4 94 25 241 29/364 0,41 0,43 0,12 - 1,29 0,148

07 35 103 14 179 49/331 4,34 3,50 2,14 - 8,93 < 0,05

08 13 149 27 393 40/582 1,27 1,25 0,60 - 2,64 0,617

09 22 87 16 93 38/218 1,47 1,38 0,69 - 3,16 0,372

10 4 64 1 33 5/102 2,06 2,00 0,20 - 50,48 0,662

11 13 100 10 113 23/236 1,47 1,42 0,57 - 3,80 0,513

12 5 34 27 205 32/271 1,12 1,10 0,35 - 3,33 0,791

13 53 145 66 274 119/538 1,52 1,38 0,98 - 2,34 0,060

14 32 317 16 326 48/691 2,06 1,96 1,07 - 4,00 0,029

15 14 47 15 54 29/130 1,07 1,06 0,43 - 2,65 0,963

16 3 46 13 318 16/380 1,60 1,56 0,35 - 6,32 0,445

Total 313 2.046 272 3.275 585/5.906 1,91 1,59 - 2,30 <0,0001

BIOESTATISTICA_Vol_01.indb 110 25/06/12 17:12

Page 111: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 111

Odds ratio de Peto (ORP)

Pode haver estudos em que o desfecho de interesse não ocorre, nem entre os indivíduos do grupo tratamento ou mesmo do grupo controle, sendo o valor de a ou c, igual a zero. Nessa condição, a odds ratio não pode ser calculada pela fórmula usual, pois a expressão apresenta o valor zero em seu denominador. Esta condição é comumente verificada em estudos com pequenas amostras, nas quais o número de indivíduos não foi grande o suficiente para que ao menos um desfecho ocorresse. Nestes casos, a odds ratio de Peto (ORP) é a alternativa a ser considerada. Assim temos:

O= a (valor observado).

(valor esEa b a c

n= + +( )( )

pperado).

ORO E

VP= −

exp onde:

Va b c d a c b d

n n= + + + +

−( )( )( )( )

( )2 1 Variância para

a diferença entre os valores observados e esperados de a(0-E).n= Total de indivíduos do estudo

Assim, a fórmula completa é dada por:

OR

aa b a c

n

a b c d a c b d

n n

P=

− + +

+ + + +−

exp

( )( )

( )( )( )( )

( )2 1

= + + +, onde n a b c d

Considerando o estudo 01 da Tabela 3.1, temos:

OR

P= exp

88 162 8 6

340

8 162 6 16

− + +

+ +

( )( )

( )( 44 8 6 162 164

340 340 12

)( )( )

( - )

+ +

BIOESTATISTICA_Vol_01.indb 111 25/06/12 17:12

Page 112: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental112

OR

OR

P

P= 1,34

= −

=exp

,exp ,

8 7

3 36570 2971

Assim, considerando o cálculo da odds ratio pelo método de Peto, podemos notar que o valor encontrado é muito próximo ao valor calculado pelo método convencional, especialmente quando o valor da OR é próximo ao valor 1.

O cálculo dos intervalos de confiança para a odds ratio pode ser realizado pela aplicação do método de Woolf (1955). Usualmente, programas estatísti-cos, como o BioEstat e o Epi Info, fornecem o cálculo do intervalo de confiança ao nível de 95% (IC95%) quando o cálculo da odds ratio é solicitado.

IC

O E z V

V( %)

( )/

952=

− ±

expα

Onde: zα/2 = Valor bicaudal da distribuição normal padronizada.

Risk ratio (RR)

Também chamada razão de risco, é uma medida que estima o risco da ocorrência do desfecho no grupo tratamento e o compara com o risco da ocor-rência do desfecho no grupo controle. Ou seja, é a razão (quociente) entre o risco de um evento ocorrer nos indivíduos submetidos a um determinado tratamento e o risco da ocorrência deste mesmo evento nos indivíduos do grupo controle. Por exemplo, se em um grupo de indivíduos submetidos a um determinado tratamento, o risco para a ocorrência de complicações é igual a 45%, e a chance de ocorrer a mesma complicação no grupo controle é igual a 35%, logo a risk ratio é igual a 45%/35% = 1,28. Com um raciocínio igual ao da odds ratio, isto significa que o risco de ocorrer complicação no grupo tratamento equivale a 1,28 vezes o risco de ocorrer a mesma complicação no grupo controle. Desse modo, uma razão de risco igual a 1, indica que o risco de ocorrer complicações no grupo tratamento é igual ao risco de ocorrer complicações no grupo controle, sendo, portanto, o tratamento considerado como não causador das complicações.

BIOESTATISTICA_Vol_01.indb 112 25/06/12 17:12

Page 113: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 113

Assim, para o estudo 01, mostrado na Tabela 3.1, temos:

RR

a

a b

c

c d

= +

+

= = ××

=

8

170

6

170

8

170

1 360

1

170

6

.

.00201 33= ,

Novamente lembramos que a razão de risco (risk ratio) ou risco relativo não deve ser empregada como estimativa de desfecho em estudos do tipo caso-con-trole. A Tabela 3.2 mostra as fórmulas da razão de risco e da razão de chance.

Tabela 3.2 – Tabela de contingência 2 x 2 para a distribuição de desfechos nos Grupos

Tratamento e Controle

GruposDesfecho de interesse

Total Risco do desfechoPresente Ausente

Tratamento a b a + b RT = a / (a + b)Controle c d c + d RC = c / (c + d)

Total a + c b + d a+b+c+dCD+ = a / cCD- = b / d

RT = Risco da ocorrência do desfecho no Grupo TratamentoRC = Risco da ocorrência do desfecho no Grupo Controle

CD+ = Chance da ocorrência do desfechoCD- = Chance da não-ocorrência do desfecho

Redução absoluta de risco (RAR)

É expressa pela diferença de risco entre o grupo controle (RC) e o grupo tratamento (RT), isto é, RAR = RC – RT. Portanto, valores positivos para a RAR

indicam que o risco do desfecho estudado é maior no grupo de indivíduos do grupo controle, ao passo que, valores negativos mostram que o risco do desfecho é maior no grupo de indivíduos submetidos ao tratamento (inter-venção) avaliado.

Assim, para o estudo 06, mostrado na Tabela 3.1, temos:

RAR R R RARc

c d

a

a bC T

= − ∴ =+

−+

RAR = − =25

266

4

982 30,

BIOESTATISTICA_Vol_01.indb 113 25/06/12 17:12

Page 114: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental114

Ou seja, no grupo controle, o risco do desfecho foi maior que no grupo tratamento. Isto é, no grupo controle, a ocorrência do risco do desfecho foi 2,3 vezes maior que no grupo tratamento.

Redução relativa de risco (RRR)

Essa medida expressa a redução percentual do risco do desfecho nos indiví-duos do grupo tratamento (RT) em relação aos indivíduos do grupo controle (RC).

Assim, para o estudo 06, mostrado na Tabela 3.1, temos:

RRRR

RRRR RRT

C

= −

∴ = −1 100 1 100( )

RRR = − =( , ) %1 0 43 100 57

Este resultado mostra que o tratamento instituído possibilitou uma redu-ção de 57% na ocorrência do desfecho, quando comparada ao grupo controle.

B – Medidas para cálculo do efeito-sumário

As revisões sistemáticas do tipo meta-análise devem incluir uma análise estatística dos resultados dos estudos selecionados, com o objetivo de combinar esses resultados em um único valor, o qual costuma ser chamado de efeito-sumá-rio. A seguir, demonstraremos exemplos para os cálculos das mais utilizadas.

Peso de cada estudo

Numa revisão de meta-análise, os estudos selecionados geralmente apresentam-se de tamanhos amostrais bastante diferentes e, portanto, com diferentes “forças” de influência na determinação do efeito-sumário, de modo que a contribuição de cada um deles deve ser calculada com base no tamanho do estudo e no número de desfechos observados. Assim, uma maneira bastante simples para se fazer isso é calcular, para cada um deles, o produto do risco relativo pelo tamanho da amostra (peso), somar os produtos e, então, dividir o resultado pela soma dos pesos.

Porém, na prática, emprega-se como peso para cada estudo, o inverso de sua variância (1/variância), sendo este um melhor parâmetro para mensurar

BIOESTATISTICA_Vol_01.indb 114 25/06/12 17:12

Page 115: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 115

a acurácia da estimativa do efeito, em relação ao tamanho da amostra, pois considera o número de desfechos assim como sua contribuição. O uso do inverso da variância é justificado, porque, geralmente, estudos de pequeno porte apresentam grande variância e um grande intervalo de confiança em torno da estimativa de risco, ao passo que estudo de grande porte apresen-tam pequena variância e um intervalo de confiança pequeno em torno da estimativa de risco. Deste modo, estudos com grandes amostras recebem um peso maior (1/pequena variância), enquanto que estudos com peque-nas amostras recebem um peso menor (1/grande variância), de tal forma que a distorção possa ser corrigida. Assim, a estimativa-sumário é calculada multiplicando-se o peso de cada estudo pelo logaritmo da estimativa de risco (risco relativo ou razão de chance, p. ex.); então, a soma desses produtos é dividida pela soma dos pesos.

De qualquer forma, quando se utiliza como estimativa de risco a odds ratio tradicional, uma maneira bem fácil de calcular o peso de cada estudo é pela aplicação da seguinte relação: Peso = bc/n, onde n = a + b + c + d. Para efeito de ilustração do cálculo do peso de cada estudo, a Tabela 3.3 mostra os dados relativos aos estudos 01 a 04 expressos na Tabela 3.1.

Tabela 3.3 – Resultados fictícios relativos a quatro ensaios clínicos controlados e randomizados

Estudo

Grupo TratamentoDesfecho

Grupo ControleDesfecho Total

(n)OR IC95% Peso

Peso(%)Sim

(a)Não (b)

Sim (c)

Não (d)

01 8 162 6 164 14/340 1,35 0,41 - 4,49 2,859 27,17

02 19 111 8 122 27/260 2,61 2,61 - 1,03 3,415 32,46

03 1 69 2 138 3/210 1,00 0,09 - 10,84 0,657 6,24

04 65 342 9 441 74/857 9,31 4,41 - 20,33 3,591 34,13

Total 93 684 25 865 118/1.667 4,45 2,83 - 7,00 10,522 100,00

Assim, para o estudo 01 da Tabela 3.3, o cálculo do peso é dado por:

Peso =+ + +

= × = =bc

a b c d

162 6

340

972

3402 859,

BIOESTATISTICA_Vol_01.indb 115 25/06/12 17:12

Page 116: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental116

Do mesmo modo, para os estudos 02, 03 e 04 da Tabela 3.3, os valores seriam, respectivamente: 3,415, 0,657 e 3,591. Com isso, uma vez determinado o peso de cada estudo, a contribuição relativa (em percentagem) de cada um deles, à meta-análise, pode ser agora calculada dividindo-se o peso de cada um pela soma de todos os pesos, sendo o resultado multiplicado por 100. Assim, para o estudo 01, temos:

PesoPeso

Soma dos pesos10

%

.

,= × = ×100

2 859

10 52200= 27 17, %

Para os casos em que a odds ratio tradicional não pode ser calculada, como

demonstrado anteriormente, a odds ratio de Peto (ORP) deve utilizada como medida de estimativa de efeito, sendo o peso de Peto (PP), de cada estudo, representado pelo valor V da fórmula de Peto, ou seja, pela variância para a diferença entre o valor observado e o valor esperado de a, tal como demons-trado segundo a seguinte fórmula:

Pa b c d a c b d

n nn a b c

P= + + + +

−= + +( )( )( )( )

( ),

2 1onde ++d

Para efeito de demonstração do cálculo do peso de Peto (PP), a Tabela 3.4 mostra os dados fictícios de uma meta-análise constituída por seis estudos clí-nicos controlados e randomizados.

Tabela 3.4 – Dados relativos a uma meta-análise fictícia constituída por seis ensaios clínicos

controlados e randomizados

Estudo

Grupo TratamentoDesfecho

Grupo ControleDesfecho

Total(n)

ORP O E O – E PPSim(a)

Não(b)

Sim(c)

Não(d)

01 6 54 4 56 10/120 1,541 6 5,000 1,000 2,311

02 4 38 1 39 5/82 3,359 4 2,561 1,439 1,188

03 0 26 2 24 2/52 0,130 0 1,000 –1,000 0,490

04 7 53 4 116 11/180 4,239 7 3,667 3,333 2,308

05 0 42 4 38 4/84 0,125 0 2,000 –2,000 0,964

06 4 56 12 108 16/180 0,664 4 5,333 –1,333 3,258

Total 21 269 27 381 48/698 1,15 1,439 10,519

BIOESTATISTICA_Vol_01.indb 116 25/06/12 17:12

Page 117: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 117

Assim, para o estudo 03 da Tabela 3.4, temos:

PP= + + + +

−=( )( )( )( )

( )

. ,0 26 2 24 0 2 26 24

52 52 1

67 600 00

12 337 904 000 490

. ,,=

Odds ratio meta-analítico de Peto (ORMP)

É a opção para o cálculo do efeito-sumário (combinado) de uma meta-aná-lise quando um dos estudos selecionados não apresenta nenhum desfecho no grupo tratamento, no grupo controle ou em ambos. É dada pela função expo-nencial do quociente entre a soma dos valores das variâncias (O – E) e a soma dos valores dos pesos dos estudos (PP).

Assim, para os estudos apresentados na Tabela 3.4, temos:

ORM

O E

V

P

i ii

k

i

k=

∴=

=

∑exp

( )

1

11

OORM

ORM

P

P

=

=

=

exp exp 0,1371 439

10 519

1 15

,

,

,

Portanto, com o resultado encontrado, quando os seis estudos da meta--análise foram combinados, podemos afirmar que, a chance da ocorrência do desfecho foi 1,15 vezes maior para os indivíduos do grupo tratamento em rela-ção aos indivíduos do grupo controle. O intervalo de confiança de 95% (IC95%) pode ser calculado segundo a fórmula:

IC

O E z V

V

i i ii

k

i

k

ii

k95

211

1

%

/

=−( ) ±

==

=

∑∑

∑exp

α

Para o exemplo mostrado na Tabela 3.4, o intervalo de confiança de 95%, relativo ao resultado final, é calculado da seguinte maneira:

BIOESTATISTICA_Vol_01.indb 117 25/06/12 17:12

Page 118: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental118

IC ORMP

951 439 1 96 10 519

10 519%( )

, ( , )( , )

,= ±

exp

IIC ORM

IC

P95

1 439 20 617

10 519

95

%( ), ,

,

%(

= ±

exp

OORMP)

, ,

,= exp

1 439 20 617

10 519

= exp (limite inf− =1 8232 0 16, , eerior)

expIC ORMP

951 439 20 617

10 519%( )

, ,

,= +

= 2,0967 = 8,14 (exp llimite superior)

IC ORMP

95 0 16 8 14%( ) , ,= < <µ

Odds ratio meta-analítico de Mantel-Haenszel (ORMMH)

Considerado como o mais robusto, este método é empregado quando a odds ratio para cada estudo é calculada pelo método tradicional. É dado pela soma dos produtos entre a odds ratio de cada estudo e o seu respec-tivo peso, dividida pelo somatório dos pesos de todos os estudos. A Tabela 3.5 mostra uma meta-análise constituída por 10 estudos do tipo caso-con-trole. Seus dados serão utilizados como exemplo da aplicação do método de Mantel-Haenszel.

Com base nos resultados obtidos, para uma ORMMH = 4,68, podemos afirmar que, nos indivíduos do grupo caso, a chance da ocorrência do desfecho asso-ciado ao fator de risco estudado foi 4,68 vezes maior quando comparados aos indivíduos do grupo controle. Se o objetivo do estudo fosse avaliar a associação entre o hábito de fumar (fator de risco) e a ocorrência de câncer de pulmão (desfecho), por exemplo, poderíamos afirmar que, no grupo de pacientes com câncer (grupo caso), o hábito de fumar foi 4,68 vezes maior quando compa-rado ao grupo de pacientes sem câncer (grupo controle). Isto é, considerando a combinação de todos os estudos da meta-análise, a chance da ocorrência de câncer de pulmão foi 4,68 vezes maior para os pacientes fumantes quando

BIOESTATISTICA_Vol_01.indb 118 25/06/12 17:12

Page 119: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 119

comparados aos pacientes não-fumantes. Ou seja, o tabagismo aumentou em 4,68 vezes a chance da ocorrência da doença.

O intervalo de confiança mostra, com 95% de certeza, que, na população estudada, a verdadeira chance da ocorrência de câncer de pulmão, nos indi-víduos fumantes, está compreendida entre os valores 3,88 e 5,74 quando comparados aos indivíduos não-fumantes. O valor calculado de P < 0,00001 mostra que na meta-análise em questão, a associação entre o hábito de fumar e a ocorrência de câncer de pulmão foi real, isto é, não ocorreu por acaso.

Aqui cabe uma observação: a ORMP e a ORMMH são medidas calculadas tendo-se em conta que os estudos selecionados são homogêneos no que tange ao aspecto de suas amostras e de seus resultados, ou seja, que a variabilidade entre eles tenha ocorrido por acaso e não em razão de possíveis diferenças entre as populações, aos tipos de intervenção e aos métodos empregados. Nesse sentido, a ORMP pode ser fonte de vieses, especialmente quando existe uma substancial diferença entre os tamanhos dos grupos tratamento e con-trole, porém com bons resultados em muitas situações.

Tabela 3.5 – Dados relativos a uma meta-análise constituída por 10 estudos caso-controle

Estudo

Grupo CasoFator de risco

Grupo ControleFator de risco

OR IC95% Peso P valorPresente

(a)Ausente

(b)Presente

(c)Ausente

(d)

01 83 3 72 14 5,38 1,37 - 24,62 1,45 0,010

02 90 3 227 43 5,68 1,64 - 23,57 0,74 0,002

03 129 7 81 19 4,32 1,63 - 11,91 3,83 0,001

04 412 32 299 131 5,64 3,66 - 8,73 15,1 < 0,001

05 1.350 7 1.296 61 9,08 3,98 - 21,76 3,48 < 0,001

06 60 3 106 27 5,09 1,39 - 22,05 0,92 0,009

07 459 18 534 81 3,87 2,23 - 6,78 7,57 < 0,001

08 499 19 462 56 3,18 1,81 - 5,64 9,15 < 0,001

09 451 39 1.729 636 4,25 2,99 - 6,07 6,16 < 0,001

10 260 5 259 28 5,62 2,03 - 16,85 2,36 < 0,001

Combinado 3.793 136 5.065 1.096 4,68 3,88 - 5,74 < 0,0001

BIOESTATISTICA_Vol_01.indb 119 25/06/12 17:12

Page 120: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental120

Assim, temos:

ORMsoma OR Peso

soma PesoMH =×( )

( )OR

ad

bc=

Peso sendo= = + + +bc

nn a b c d,

ORMMH

= =302 83

64 684 68

,

,,

, onde

Risk ratio meta-analítico de Mantel-Haenszel(RRMMH)

É uma medida do efeito do desfecho que pode ser tomada como alter-nativa à odds ratio quando o estudo é do tipo ensaio clínico controlado e randomizado ou do tipo coorte. A fórmula para o efeito-sumário é mostrada a seguir. O intervalo de confiança é calculado segundo o método proposto por Greenland-Robins (1985). Para efeito de demonstração, a Tabela 3.6 mostra uma meta-análise constituída por sete estudos do tipo ensaio clínico contro-lado e randomizado.

Tabela 3.6 – Dados relativos a uma meta-análise constituída por sete ensaios clínicos

controlados e randomizados

Estudo

Grupo TratamentoDesfecho

Grupo ControleDesfecho

Total(n)

RR IC95% Peso Valor PPresente

(a)Ausente

(b)Presente

(c)Ausente

(d)

01 49 566 67 557 1.239 0,74 0,52 - 1,05 33,25 0,094

02 44 714 64 707 1.529 0,70 0,48 - 1,01 31,72 0,056

03 102 730 126 724 1.682 0,83 0,65 - 1,05 62,32 0,124

04 32 285 38 271 626 0,82 0,53 - 1,28 19,24 0,382

05 85 725 52 354 1.216 0,82 0,59 - 1,13 34,64 0,228

06 246 2.021 239 2.038 4.544 1,03 0,87 - 1,22 109,74 0,698

07 1.570 7.017 1.720 6.880 17.187 0,91 0,86 - 0,97 859,34 0,004

Combinado 2.128 12.058 2.306 11.531 28.023 0,94 0,86 - 0,96 0,001

BIOESTATISTICA_Vol_01.indb 120 25/06/12 17:12

Page 121: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 121

Assim, temos:

RRM

b d

na

a c

nb

MH

i i

i

ii

k

i i

i

ii

=

+

+

=

=

∑1

11

1 766 53

1 8

k i i i i i

MH

onde n a b c d

RRR

∑= + + +

=

, :

. ,

. 774 850 94

,,=

Com base nos resultados obtidos para o efeito-sumário da meta-análise, pode-se concluir que, nos indivíduos do grupo tratamento, o risco para a ocor-rência do desfecho foi 0,94 vezes maior quando comparados aos indivíduos do grupo controle. Ou seja, o risco para a ocorrência do desfecho no grupo con-trole foi maior que no grupo tratamento. O intervalo de confiança mostra, com 95% de certeza, que, na população estudada, o risco da ocorrência do desfecho nos indivíduos do grupo tratamento está compreendido entre os valores 0,86 e 0,96 quando comparados aos indivíduos do grupo controle. O valor calculado de P = 0,001 mostra que, na meta-análise em questão, a diferença encontrada entre os grupos tratamento e controle, quando todos os estudos foram combi-nados, foi real, isto é, não ocorreu por acaso.

Teste de homogeneidade

Num estudo de meta-análise, não é correto utilizar estudos que difiram entre si quanto aos aspectos metodológicos ou que apresentem grandes dife-renças quanto aos seus resultados, mesmo que sejam metodologicamente idênticos, pois resultados significativamente diferentes sugerem que deve ter ocorrido alguma diferença importante entre eles, além do próprio acaso. Por esse motivo, toda meta-análise deve incluir um teste de homogeneidade com o cálculo do valor P. Estes testes, embora com pouco poder estatístico, consideram, inicialmente, que os estudos são homogêneos (hipótese de nuli-dade). Assim, se os resultados apoiarem a hipótese nula, com valor P > 0,10, o investigador deverá aceitar que os estudos selecionados são homogêneos. Caso contrário, se o valor P < 0,10, a hipótese nula deverá ser rejeitada, e os estudos,

BIOESTATISTICA_Vol_01.indb 121 25/06/12 17:12

Page 122: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental122

considerados heterogêneos, ou seja, que há diferenças significativas nas amos-tras selecionadas ou nas variáveis preditoras ou de desfecho.

Portanto, lembre-se sempre que, em uma meta-análise, a variabilidade entre os estudos deve ser casual e não em razão de possíveis erros na seleção dos mesmos, no tocante a possíveis diferenças entre as populações ou tipo de intervenção, por exemplo, pois, quanto mais homogêneos forem os estudos a ser combinados, mais confiável será a estimativa-sumário.

Conceitualmente, a heterogeneidade em um estudo de meta-análise refere--se à variação dos resultados entre os estudos selecionados, de tal modo que a maioria dos programas estatísticos fornece testes de hipóteses para avaliar a homogeneidade entre os diversos estudos, sendo o Teste de Cochran (Teste Q) considerado o modelo clássico, o qual descreveremos a seguir.

•Teste de homogeneidade de Cochran (Teste Q) – Este teste deve ser aplicado quando a odds ratio de Peto (ORP) é utilizada como medida de efeito. É um teste de baixo poder para detectar a homogeneidade, espe-cialmente quando o número de estudos da meta-análise é pequeno. Do mesmo modo, quando o número de estudos é grande, o poder do teste de Cochran será alto em detectar uma heterogeneidade entre eles, mesmo que essa heterogeneidade não seja clinicamente importante para a inter-pretação do efeito-sumário.

Tomando-se como hipótese nula que os estudos são homogêneos, o teste

Q segue uma distribuição qui-quadrado15 com k – 1 graus de liberdade (gl), sendo k o número de estudos da meta-análise. Os valores de P são obtidos comparando-se o valor de Q, calculado na meta-análise, com uma distribuição qui-quadrado. Assim, quando o valor calculado de P é grande (valor P > 0,10), podemos considerar que os estudos são homogêneos, pois a hipótese nula não é rejeitada.

Para o exemplo apresentado na Tabela 3.4, contendo dados relativos a uma meta-análise fictícia constituída por seis ensaios clínicos controlados e rando-mizados, o teste Q é dado pela seguinte fórmula:

15. A distribuição qui-quadrado será apresentada no capítulo que trata sobre a inferência para variáveis dicotômicas e nominais (testes não-paramétricos).

BIOESTATISTICA_Vol_01.indb 122 25/06/12 17:12

Page 123: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 123

QO E

V

O E

i i

ii

k i ii

k

=−

−( )

=

=∑∑

( )2

1

1

2

VVi

i

k

=∑

= − =

1

2

13 7241 439

10 51913 527,

,

,,

Para um valor Q = 13,527, com k – 1 graus de liberdade, temos:

gl kgl

cal

= − = − = ∴ = =1 6 1 5 9 242

5 010

2

Como

χ χ

χ

α; ; ,,

cc

P

2

5 010

213 527 9 24

0 0189

= > =

=

, ,

,

; ,χ

Então, valor

Portanto, com um valor P < 0,10, a hipótese nula deverá ser rejeitada,

e os estudos considerados heterogêneos, ou seja, que há diferenças significativas nas amostras selecionadas ou nas variáveis preditoras ou de desfecho.

Quando a medida de efeito utilizada é a odds ratio tradicional, o teste Q é calculado pela soma dos quadrados das diferenças entre o logaritmo da OR de cada estudo e o logaritmo da ORMMH, com cada termo da soma sendo multiplicado pelo peso do estudo. Assim, para os dados da Tabela 3.5, temos:

Q OR OR Qi MH i

i

k

= −( ) ∴ ==∑ log log ,

2

1

19 25x peso

Para um valor Q = 19,252, com k – 1 graus de liberdade, temos:

gl kgl

c

= − = − = ∴ = =1 10 1 9 14 682

9 010

2

Como

χ χ

χ

α; ; ,,

aalc

P

2

5 010

219 25 14 68

0 023

= > =

=

, ,

,

; ,χ

Então, valor

BIOESTATISTICA_Vol_01.indb 123 25/06/12 17:12

Page 124: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental124

Estatística I2

É tida como uma alternativa para o teste de Cochran, pois tem a finalidade de quantificar a heterogeneidade entre os diversos estudos de uma meta-aná-lise, sendo interpretada como a porcentagem total de variação entre eles, a qual é decorrente desta heterogeneidade.

Ao contrário do teste Q, a estatística I2 é uma simples expressão intuitiva, a qual é corrigida pelo número de estudos considerados na meta-análise, sendo calculada pela equação I2 = 100%(Q – K + 1)/Q, onde Q é o valor calculado para o teste de homogeneidade de Cochran, e k o número de estudos da meta-aná-lise, com os resultados variando de 0% a 100%. Os resultados negativos são considerados iguais a zero, o que mostra uma homogeneidade entre os estu-dos, e valores grandes evidenciam a quantidade da heterogeneidade. Assim para os estudos mostrados na Tabela 3.4, temos:

IQ k

Q

I

2

2

100 1

100 13 52 6 1

13 5248 22

= − +

= − + =

%( )

%( , )

,, %

Este resultado mostra que os estudos apresentam um alto grau de hetero-geneidade, o que confirma o teste de Cochran. O método de escolha proposto para o cálculo dos intervalos de confiança é aquele apresentado por Hedges and Piggott (2001).

C – Modelos de efeito fixo x efeito aleatório

Como foi visto até aqui, para uma revisão sistemática do tipo meta-análise, existem vários métodos estatísticos que podem ser utilizados para calcular o efeito-sumário, e a escolha de um ou de outro método depende do tipo de des-fecho calculado para os estudos selecionados: se odds ratio, risk ratio, redução absoluta de risco etc., sem grandes diferenças entre eles. Porém, um aspecto relevante a ser considerado, o qual pode alterar significativamente a inter-pretação do desfecho de uma meta-análise de ensaios clínicos, é a escolha do modelo empregado, se de efeito fixo ou de efeito aleatório. O modelo de efeito

fixo considera um único efeito de tratamento, e qualquer variabilidade encon-

BIOESTATISTICA_Vol_01.indb 124 25/06/12 17:12

Page 125: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 125

trada para os efeitos estimados dos estudos é decorrente da variabilidade amostral interna de cada um deles, ou seja, simplesmente que todos os estu-dos foram conduzidos sob as mesmas condições, sendo a variância do efeito sumário calculada tomando-se por base o inverso da soma dos pesos dos estu-dos. Por outro lado, o modelo de efeito aleatório assume que os estudos não são homogêneos e que a variação entre os estudos é decorrente das diferenças entre as populações estudadas ou dos protocolos empregados, ou seja, que os estudos considerados foram conduzidos em diferentes condições.

De todo jeito, independente do método escolhido, seja o modelo de efeito fixo ou o de efeito aleatório, as estimativas do desfecho-sumário são, geral-mente, muito semelhantes, porém com a variância do desfecho-sumário maior no modelo de efeito aleatório, pois, neste modelo, existe uma heterogeneidade entre os estudos, com um intervalo de confiança maior, o que causa uma grande probabilidade de ocorrer uma menor significância estatística. Assim, se existe apenas uma pequena variação entre os estudos, com um pequeno valor calcu-lado para a estatística I2, a escolha pelo modelo de efeito fixo pode ser a mais apropriada, mesmo que muitos autores considerem o modelo de efeito aleató-rio o mais indicado para tomada de decisões na área médica.

Tomemos como exemplo os dados dos estudos apresentados na Tabela 3.5. Quando a odds ratio é calculada pelo método de efeito fixo, como proposto por Mantel-Haenszel, Robins-Breslow-Greenland, temos: ORMH = 4,68; IC95% = 3,86 – 5,66 e valor P < 0,0001. Quando calculada pelo método de efeito alea-tório, como proposto por DerSimonian-Laird, temos: OR = 4,62; IC95% = 3,82 – 5,59 e valor P < 0,0001.

C – Representação gráfica meta-analítica

A apresentação gráfica sistemática dos dados constitui uma fase essencial de uma meta-análise, pois permite, pela visualização, uma rápida interpreta-ção das informações nela contidas. Por esse motivo, o método tradicional de representação visual é constituído pelo gráfico chamado forest plot, o qual apresenta uma aparência de uma “floresta de linhas”. Assim, para efeito de ilus-tração, a Figura 3.13 mostra um gráfico do tipo forest plot construído com os dados contidos na Tabela 3.1, que contempla uma meta-análise elaborada a partir de 16 estudos do tipo ensaio clínico controlado e randomizado.

BIOESTATISTICA_Vol_01.indb 125 25/06/12 17:12

Page 126: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental126

 

Estudo 01

Estudo 02

Estudo 03

Estudo 04

Estudo 05

Estudo 06

Estudo 07

Estudo 08

Estudo 09

Estudo 10

Estudo 11

Estudo 12

Estudo 13

Estudo 14

Estudo 15

Estudo 16

Combinado

3.46

4.13

0.79

3.45

9.15

7.81

5.27

8.37

7.73

0.76

5.13

4.10

21.54

8.89

6.57

1.90

Peso OR IC95%

6/170

8/130

2/140

9/450

17/198

25/266

14/183

27/420

16/109

1/44

10/123

27/232

66/340

16/342

15/69

13/331

8/170

19/30

1/70

6/407

22/198

4/98

35/139

13/162

22/109

4/68

13/113

5/38

53/198

32/349

14/61

3/49

Trat. Cont.

Odds ratio meta-analítico (efeito fixo)

Odds Ratio (Intervalo de confiança de 95%)

Fig. 3.13 – Forest plot para uma meta-análise fictícia constituída por 16 ensaios clínicos

controlados e randomizados

Para que todas as informações possam ser corretamente obtidas, a análise visual do gráfico deve seguir um método sistematizado, pois nele, cada coluna de dados e cada linha, seja horizontal ou vertical, representa uma informação importante a ser interpretada. A seguir, com o intuito de melhor esclarecer o leitor, passaremos a descrever o conteúdo de cada uma delas.

• Na primeira coluna, à esquerda da figura, estão listados os 16 estudos sele-cionados para a meta-análise. Nela, devem constar os nomes dos autores dos estudos e os respectivos anos de suas publicações;

BIOESTATISTICA_Vol_01.indb 126 25/06/12 17:12

Page 127: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 127

• A segunda coluna contempla os dados referentes ao grupo tratamento de cada um dos estudos, cujos valores indicam, no numerador, o número de desfechos (a) e, no denominador, o tamanho da amostra (a + b);

• A terceira coluna, igualmente à segunda, representa os dados relativos ao grupo controle, com os valores dos desfechos (c) e o total amostral do grupo (c + d);

• Na quarta coluna, estão respectivos pesos dos estudos que constituem a meta-análise;

• Na quinta coluna, visualizamos os valores da odds ratio de cada estudo, individualmente;

• Na sexta coluna estão os valores numéricos dos intervalos de confiança de 95% (IC95%) de cada um dos estudos;

• A linha vertical contínua representa uma odds ratio igual a 1, cujo traçado coincide com o valor 1 da linha horizontal que mostra uma escala loga-rítmica dos valores das odds ratios consideradas para o estudo. Dessa forma, uma odds ratio com valor igual a 1 corresponde a uma chance igual para a ocorrência do desfecho nos dois grupos de cada estudo. Os valores da odds ratio representados à esquerda desta linha, portanto menores que 1, mostram que o desfecho tem maior chance de ocorrer nos indivíduos do grupo controle, ao passo que odds ratios posicionadas à direita, representam uma maior chance de ocorrência do desfecho nos indivíduos do grupo tratamento;

• A linha vertical pontilhada corresponde à odds ratio calculada para o efeito-sumário da meta-análise, cujo valor pode ser conferido na última linha da coluna numérica correspondente (quinta coluna). No caso em questão, o valor da OR = 1,92;

• As linhas horizontais mostram as amplitudes dos intervalos de confiança de 95% da odds ratio calculada para cada um dos estudos. Nelas, o leitor pode notar que tamanhos amostrais pequenos, geralmente causam inter-valos com amplitudes maiores e, portanto, menor precisão para o estudo considerado;

• O quadrado colocado sobre cada linha representa o valor da odds ratio do estudo, sendo o tamanho de cada quadrado diretamente proporcional ao peso do estudo, conforme mostrado na coluna correspondente. Notar que

BIOESTATISTICA_Vol_01.indb 127 25/06/12 17:12

Page 128: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental128

os quadrados devem estar posicionados no centro de cada linha, uma vez que os intervalos de confiança, embora não sejam simétricos em relação aos valores da odds ratio, estão representados em escala logarítmica. Assim, se uma linha horizontal, correspondente à amplitude de um inter-

valo de confiança de 95%, cruza a linha vertical contínua, isso significa que este intervalo contém o valor 1 e, naquele estudo, o efeito do tratamento sobre a ocorrência do desfecho não é estatisticamente significante, isto é, que, em algum momento do estudo, as chances da ocorrência do desfecho foram iguais em ambos os grupos. Portanto, para que haja uma diferença estatisticamente significante entre os resultados encontrados no grupo tratamento e no grupo controle, é necessário que a linha horizontal não atravesse a linha vertical con-tínua, tal como ocorre nos estudos 04 e 07 da Figura 3.13. Por outro lado, é válido salientar que, nos estudos com tamanho amostral pequeno, a signifi-cância estatística pode não ter sido atingida em razão do número reduzido de indivíduos na amostra, como ocorreu com o estudo 10.

• O losango representa, tradicionalmente, o efeito-sumário (combinado), que, no exemplo dado, corresponde ao odds ratio meta-analítico de Mantel-Haenszel (ORMMH), calculado pelo método de efeito fixo. Este apresenta um intervalo de confiança com menor amplitude que os demais, uma vez que resulta da combinação de todos os estudos considerados na meta-análise. Notar que o seu intervalo de confiança não cruza a linha vertical, o que nos permite afirmar que, na meta-análise em questão, há uma diferença estatisticamente significativa entre os grupos tratamento e controle, com um valor para a ORMMH igual a 1,92. Com este valor encontrado, podemos concluir que: os indivíduos do grupo tratamento apresentam uma chance 1,92 vezes maior para a ocorrência do desfecho quando comparados aos indivíduos do grupo controle.

3.4.4 Outras informações importantesComo parte de uma revisão sistemática, a meta-análise vem ganhando ter-

reno como método de pesquisa bibliográfica, despertando grande interesse em diversas áreas do conhecimento científico, especialmente em assuntos que não apresentam consenso entre os estudos publicados, sendo esta apenas uma

BIOESTATISTICA_Vol_01.indb 128 25/06/12 17:12

Page 129: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

delineamento dos estudos de pesquisa 129

das etapas de um minucioso processo que resulta em uma tomada de decisão. Assim, como um procedimento que utiliza métodos estatísticos, é importante que cada uma de suas etapas seja realizada de maneira criteriosa e que atenda aos mais rigorosos princípios da metodologia científica. Para tanto, é necessá-rio que se tenha um conhecimento adequado de suas técnicas, assim como a respeito da interpretação dos seus resultados, para que falsas conclusões pos-sam ser evitadas.

Por outro lado, mesmo que venha sendo mundialmente consagrada como ferramenta de pesquisa, a meta-análise ainda tem recebido críticas de pesqui-sadores que alegam ser seus resultados pouco conclusivos, e que carecem de estudos mais específicos, especialmente no que tange aos possíveis vieses de seleção, sempre passíveis de acontecer, de modo que, objetivando orientar o leitor quanto aos possíveis erros na interpretação, cada uma das etapas foi minuciosamente apresentada neste capítulo, com ênfase para os procedimen-tos estatísticos e suas respectivas interpretações.

De qualquer maneira, atualmente, existem disponíveis no mercado de softwares, diversos programas computacionais estatísticos de uso bastante simplificado, que contemplam ferramentas adequadas para o planejamento e execução de meta-análises. Entre eles destacamos o StatsDirect, o programa SAS, o Epi Info e o BioEstat, entre outros, os quais deverão ser de amplo domí-nio do usuário, de maneira que, interpretações errôneas possam ser evitadas quando da análise dos seus resultados.

BIOESTATISTICA_Vol_01.indb 129 25/06/12 17:12

Page 130: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

BIOESTATISTICA_Vol_01.indb 130 25/06/12 17:12

Page 131: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

4Tamanho da Amostra e

Randomização

4.1 AMOSTRAGEM E RECRUTAMENTO

O objetivo mais importante de qualquer projeto de pesquisa é fazer infe-rências, a partir do estudo de uma amostra, sobre uma determinada população de interesse, da qual a amostra foi retirada. E, com esse objetivo, a escolha apropriada dos sujeitos que comporão a amostra a ser selecionada, tanto no que diz respeito ao número de indivíduos participantes e à especificação de suas características, é para garantir que os resultados representem o mais fielmente possível o que ocorre na população. Assim, a fim de que se possam realizar inferências estatísticas que sejam válidas para uma população, a partir dos resultados obtidos de uma amostra, é necessário que a amostra seja de fato representativa da população, condição esta que somente é conseguida com a aplicação de procedimentos apropriados de recrutamento e métodos aleató-rios de amostragem, os quais serão discutidos a seguir. Mas, por sua vez, se faz necessário conhecer o conceito de população, amostra e estimativa.

População

Também chamado de universo amostral, define-se como um grande conjunto de itens (pessoas, animais, vegetais ou objetos) que apresentam determinadas características comuns, de caráter demográfico, clínico e tem-

BIOESTATISTICA_Vol_01.indb 131 25/06/12 17:12

Page 132: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental132

poral, as quais são de interesse para o estudo. Nesse sentido, definimos como base populacional, o conjunto total de indivíduos a partir dos quais serão retirados aqueles que comporão a amostra, e população-alvo, o conjunto de indivíduos para os quais as inferências estatísticas, obtidas a partir da amostra, sejam válidas. Portanto, com base no tamanho da população, temos:•População ilimitada – Ou infinita, é aquela que possui um grande número

de elementos que, na prática, não são passíveis de serem contados. Temos como exemplo, os habitantes de uma determinada cidade ou país, os quais, por razões óbvias, não são facilmente contados, demandando o emprego de grandes recursos e longo período de realização, o que torna inviável seu estudo como um todo.

•População limitada – Ou finita, é aquela que possui um número determi-nado de elementos, passíveis de serem contados. Tomemos como exemplo os estudantes de uma determinada escola, para a qual se planeja uma dada pesquisa. O total de alunos será considerado a base populacional e, tam-bém, a população-alvo.

Amostra

Corresponde a um subconjunto, a uma parte da população-alvo, cujos indivíduos foram randomicamente selecionados para ser estudados como representantes de uma população maior.

Portanto, como as populações de interesse, que atendam aos critérios de seleção, costumam ser excessivamente grandes para serem estudadas na sua plenitude, os pesquisadores optam por retirar amostras que sejam repre-sentativas dessas populações, sendo o processo de amostragem baseado em métodos probabilísticos, os quais serão objetos desse capítulo. Assim, com o intuito de justificar ao leitor, listamos, a seguir, algumas boas razões para a escolha de uma amostra representativa em detrimento de se estudar toda uma população:•Economia – Estudos com amostras demandam menos recursos, uma vez

que contemplam um número menor de participantes. Esta economia pode ser importante quando se trabalha com poucos recursos.

•Rapidez – Como o volume de informações a serem coletadas e analisadas é menor, os estudos com amostras costumam ser mais rápidos. Isto é espe-

BIOESTATISTICA_Vol_01.indb 132 25/06/12 17:12

Page 133: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tamanho da amostra e randomização 133

cialmente importante quando se tem pressa em determinar causa e efeito, como em estudos do tipo caso-controle.

• Acurácia e precisão – As medidas com amostras são frequentemente mais acuradas, pois diminuem a ocorrência de vieses, traduzindo-se em infe-rências mais precisas para a população. Uma amostra bem randomizada diminui consideravelmente o viés de seleção.

• Estimativa de erro – Quando as amostras são corretamente selecionadas, o pesquisador pode, com a utilização de métodos probabilísticos, estimar a margem de erro nos resultados estatísticos.

• Homogeneidade – Como os indivíduos que compõem a amostra atendem a um critério de seleção e exclusão, esta se apresenta mais homogênea em relação à população. Este fato é importante quando se deseja estudar uma determinada característica de uma população, como a exposição, ou não, a um dado fator de risco, por exemplo.

Por outro lado, situações existem em que não é justificável que o pesqui-sador selecione uma amostra, como, por exemplo, quando a população a ser estudada é muito pequena; ou quando a característica a ser estudada é tão comum que não justifique a escolha de uma amostra. No primeiro caso, o mais conveniente seria estudar toda a população-alvo.

Estimativas

São as informações estatísticas obtidas a partir do estudo de uma amostra, e que correspondem às estimativas dos verdadeiros valores de uma população. Como exemplo, temos: a média aritmética calculada a partir de uma amostra cor-responde a uma estimativa da verdadeira média da população a partir da qual a amostra foi selecionada. Assim, tomando-se por base uma única amostra de uma dada população, pode-se apenas estimar o parâmetro estudado, processo este cha-mado de estimação de parâmetro, uma vez que, diferentes amostras, extraídas da mesma população, podem produzir resultados diferentes em razão do fenômeno da aleatoriedade, que produz o erro aleatório (ou erro amostral), a não ser que se utilizem um número muito grande de amostras ou toda a população. Por esta razão, uma estimativa eficiente de um determinado parâmetro requer procedi-mentos estatísticos eficientes e apropriados, livres de vieses.

BIOESTATISTICA_Vol_01.indb 133 25/06/12 17:12

Page 134: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental134

4.2 MÉTODOS DE AMOSTRAGEM

Denomina-se de amostragem ao processo de obtenção de uma amostra de uma determinada base populacional. Desta forma, a maneira mais correta de garantir o sucesso de uma pesquisa, passa, inicialmente, pela escolha correta da amostra. E para que uma amostra possa produzir resultados confiáveis, que garantam inferências fidedignas para a população-alvo, é necessário que cada indivíduo tenha uma probabilidade igual de pertencer a um dos grupos sele-cionados para o estudo, e que essa probabilidade seja conhecida para cada um dos indivíduos. Esse processo, chamado de amostragem probabilística, tem por objetivo garantir que procedimentos estatísticos possam ser empregados de modo a auxiliar o pesquisador a fazer inferências mais precisas a respeito da população estudada, sendo este processo o mais confiável e, por conseguinte, o mais indicado. Por outro lado, existem as amostra não-aleatórias, aquelas em que os indivíduos são selecionados sem sorteio e que também podem ser uti-lizadas, dependendo das características dos indivíduos a serem recrutados na população-alvo.

Assim, com base no critério de seleção dos indivíduos, as amostras podem ser classificadas como probabilísticas e não-probabilísticas, as quais serão des-critas a seguir.

4.2.1 Amostras probabilísticasSão aquelas que utilizam um processo aleatório (sorteio) para a escolha

dos indivíduos que comporão o grupo ou grupos que serão estudados. Esse procedimento assegura que cada indivíduo da população tenha uma chance igual aos demais, de ser selecionado para o estudo. São consideradas como o padrão-ouro, pois garantem, estatisticamente, que os resultados do estudo podem ser generalizados para a população de onde foi retirada, de tal sorte que a estimação de parâmetros, como o intervalo de confiança e a significân-cia estatística, podem ser calculados com muita fidelidade. Portanto, ao ser utilizada uma estatística descritiva com a aplicação de testes de hipóteses para se verificar a significância estatística, e posterior inferência sobre uma determinada população, pressupõe-se que a seleção da amostra foi probabi-lística. São elas:

BIOESTATISTICA_Vol_01.indb 134 25/06/12 17:12

Page 135: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tamanho da amostra e randomização 135

Amostra aleatória simples

Também conhecida como amostragem randômica, casual ou ocasio-nal, é um tipo de amostragem de fácil aplicação, muito usual e que serve de modelo de comparação para os demais tipos de amostragem, sendo obtida de tal modo que cada um dos indivíduos da população tem igual probabili-dade de ser selecionado para o estudo. Assim, para se obter uma amostra do tipo aleatória simples, é necessário, inicialmente, que todos os elementos da população sejam conhecidos. A seguir, é confeccionada uma relação completa na qual se atribui um número de ordem a cada um dos elementos que com-põem a população, e, a partir dessa relação e com a utilização de um processo aleatório, procede-se ao acaso, ou seja, por sorteio, a escolha de cada um dos indivíduos, até constituir o número de observações requerido para a amostra. Esse procedimento garante que nenhum indivíduo, em razão de uma caracte-rística especial, tenha uma maior oportunidade de ser selecionado, uma vez que a escolha independe da vontade do pesquisador que procede à seleção. A maior aplicação deste método ocorre quando o pesquisador dispõe de uma população maior que a necessária e, então, seleciona um subconjunto repre-sentativo desta população.

O método aleatório a ser empregado para a escolha dos elementos da amos-tra pode ser pela utilização de uma urna, onde se colocam todos os números correspondentes aos elementos da população e, então, são retirados, ao acaso, aqueles correspondentes ao tamanho da amostra, o qual deve ser previamente calculado1. Pode-se utilizar, também, a tabela de números aleatórios2 (ver tabelas), ou, ainda, a escolha pode ser feita através de algoritmos numéricos para geração de números aleatórios, presentes em programas estatísticos para computador pessoal. É valido salientar que, num processo de amostragem ale-atória simples, quando cada elemento da população não pode ser escolhido mais de uma vez, o método é dito sem reposição, e quando o elemento sorteado é colocado novamente de volta à urna, antes de se fazer um novo sorteio, o método é dito com reposição.

1. O cálculo do tamanho amostral será discutido, a seguir, ainda neste capítulo.

2. O método de utilização da tabela de números aleatórios está descrito no item 4.4 deste capítulo.

BIOESTATISTICA_Vol_01.indb 135 25/06/12 17:12

Page 136: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental136

Amostra aleatória estratificada

Este tipo de amostragem deve ser utilizado quando a população a ser estudada é constituída de subpopulações ou estratos, e cuja variável de inte-resse apresenta diferentes comportamentos em cada um desses estratos. Nesta condição, para que uma amostra seja de fato representativa, ela deve apresentar a mesma estratificação da população de origem. Assim, para cada um dos estratos será sorteada uma amostra aleatória simples, observando-se a proporcionalidade dos tamanhos dos estratos na amostra (amostragem estra-tificada proporcional). Por sua vez, a população e também a amostra podem ser estratificadas segundo algum fator de interesse, tal como a idade, sexo, raça ou condição socioeconômica.

Tomemos como exemplo um pesquisador que deseja avaliar a taxa média do colesterol sérico em funcionários de uma dada empresa. Como o valor dessa variável depende do nível socioeconômico de cada funcio- nário, é razoável separá-los em estratos e selecionar uma amostra aleató-ria simples, independente, para cada um desses estratos, sendo a amostra final o resultado da união das amostras de cada estrato. Para isso, é neces- sário que:

• Os funcionários sejam separados em estratos de acordo com o nível socio-econômico, como exemplo A, B e C;

• A participação relativa de cada estrato, na população, seja previamente determinada. Por exemplo: A= 5%, B= 15% e C=80%;

• O tamanho da amostra seja determinado. No caso em tela, para uma amos-tra de 200 funcionários, temos: 10 funcionários deverão ser do estrato A (5% de 200), 30 funcionários do estrato B (15% de 200) e 160 funcioná-rios do estrato C (80% de 200);

• Sejam sorteados, aleatoriamente, 10 funcionários dentre aqueles do estrato A, 30 dentre aqueles do estrato B e 160 dentre aqueles do estrato C. Ou, então, procede-se ao sorteio diretamente do total de funcionários e preenchem-se as subamostras conforme os funcionários vão sendo sele-cionados. Caso seja selecionado um funcionário para uma subamostra que já tenha sido completada, este elemento é desprezado, e o sorteio prosse-gue até que toda a amostra seja concluída.

BIOESTATISTICA_Vol_01.indb 136 25/06/12 17:12

Page 137: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tamanho da amostra e randomização 137

Amostra por conglomerado

Muito útil para estudar populações nas quais se torna impos- sível identificar e listar todos os seus elementos. Neste método, a amostragem é realizada entre os grupamentos (conglomerados) que ocor-rem naturalmente em uma população, tal como um bairro, por exemplo. Assim, este tipo de amostragem é realizado em duas etapas: primeiro um subconjunto dos conglomerados é aleatoriamente escolhido entre aqueles que compõem uma região geográfica, como os quarteirões de uma cidade e, em uma segunda etapa, para cada conglomerado selecionado, é escolhida uma amostra aleatória simples para ser incluída na amostra final, ou, quando possível, analisam-se todos os indivíduos pertencentes aos conglomerados selecionados.

Como exemplo, citamos um pesquisador que deseja investigar o nível de aprendizado de escolares em uma cidade. Inicialmente, ele deverá identificar e numerar todas as escolas situadas na área urbana da referida cidade, e, a seguir, sortear uma determinada quantidade de escolas. Então, todas as crianças de cada uma das escolas escolhidas deverão ser entrevistadas para obtenção dos dados desejados. Se preferir, pode, também, selecionar uma amostra aleatória simples para cada escola a ser estudada.

Amostra aleatória sistemática

Este tipo de amostra é selecionado quando os elementos da população estão, de alguma forma, naturalmente ordenados, tal como em número serial, em forma de listas, relação de prontuários, filas etc. A amostragem processa--se como na amostra aleatória simples, porém com a seleção dos componentes seguindo um processo periódico preordenado de escolha. Por exemplo: um investigador deseja estudar o padrão do hemograma de pacientes atendidos em um determinado hospital. Os dados estão dispostos em 600 prontuários, numerados em série. O tamanho calculado da amostra foi de 60 pacientes, ou seja, 10% do total, ou um para cada 10 indivíduos da população. Inicialmente, o pesquisador deverá selecionar, aleatoriamente, um dentre os 10 primeiros prontuários da série; por exemplo, o de número 7. A seguir, retirar os demais 59 prontuários, sendo o segundo a ser retirado, o de número 17; o terceiro, o de número 27, e assim, sucessivamente.

BIOESTATISTICA_Vol_01.indb 137 25/06/12 17:12

Page 138: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental138

Este tipo de amostragem pode ser preferível à amostragem aleatória simples, pois é de mais fácil execução e fornece informações mais precisas, e, portanto, menos sujeita a vieses. Porém, não deve ser aplicada nos casos em que a variável a ser estudada apresente certa periodicidade ou ciclos que coin-cidam com a frequência de repetições para a escolha da amostra.

4.2.2 Amostras não-probabilísticasAmostra de conveniência

É aquela que não utiliza um processo aleatório (sorteio) para a escolha dos indivíduos que comporão o grupo ou os grupos que serão estudados, devendo ser empregada em pesquisas onde não se pode dispor de uma lista completa que identifique todos os elementos da população-alvo, tal como ocorre para a amostragem aleatória simples. Este tipo de amostragem constitui um método de rápida execução e de baixo custo para selecionar, dentre todos os indivíduos de uma população-alvo, aqueles que atendem aos critérios de inclusão para o estudo, objetivando descrever suas características principais, sem, no entanto, generalizar as informações para a população de onde a amostra foi retirada, em razão do potencial viés de seleção.

Na amostragem de conveniência, com o intuito de minimizar um potencial viés de seleção, a escolha dos sujeitos deve ser realizada de modo sequencial (consecutiva), e por um período de tempo suficientemente longo de tal modo que possa abranger todas as possíveis variações temporais que incidem sobre a população. Mas, de qualquer forma, a maioria dos autores concorda que, neste tipo de amostragem, a validade do estudo depende de critérios puramente subjetivos, e, quando bem selecionada, ela atende ao pressuposto de ser ade-quadamente representativa da população-alvo.

Amostra por cota

Bastante análoga ao método de amostragem estratificada, neste tipo de amostra, são constituídos diversos estratos dentro da população, mas com a diferença que a escolha dos indivíduos, dentro de cada estrato, é feita por cotas não-aleatórias (por conveniência) de tamanho proporcional ao estrato em rela-ção à população. Os estratos são geralmente escolhidos tomando-se por base determinadas características da população, tal como idade, sexo, raça, classe

BIOESTATISTICA_Vol_01.indb 138 25/06/12 17:12

Page 139: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tamanho da amostra e randomização 139

social etc. Como uma desvantagem deste tipo de amostragem, citamos o viés de seleção, pois a amostra pode não ser representativa dos indivíduos dos estratos correspondentes, uma vez que esta não foi escolhida por sorteio e, portanto, não é possível se fazer inferências estatísticas fidedignas para a estimação de parâmetros da população. Por outro lado, este tipo de amostra costuma ser de fácil obtenção, de baixo custo e com resultados bastante rápidos, sendo usual-mente empregada em pesquisa de mercado e de opinião pública.

4.2.3 Erros no processo de amostragemComo em uma pesquisa não se costuma estudar toda uma população, e sim

uma amostra, em qualquer processo de amostragem, mesmo que cuidadosa-mente executado, existe certa margem de erro, sendo essa margem calculada em função do tamanho da amostra. Assim, para um mesmo tamanho de amos-tra, quanto maior a homogeneidade da população a ser pesquisada, menor será o erro amostral, e, quanto maior o seu tamanho, menor será o erro cometido e vice-versa. Portanto, com base nestes princípios, não se pode esperar que duas amostras, independentemente retiradas da mesma população, forneçam resul-tados semelhantes, uma vez que a amostra não corresponde a uma perfeita representação da população, pois existem variabilidades nas estimativas, e os resultados que elas fornecem, são, de alguma forma, imprecisos. Deste modo, quando se trabalha com amostra, sempre existe um erro amostral, cujo valor pode ser conhecido e calculado. Por essa razão, um perfeito planejamento, assim como a execução correta da pesquisa, tendem a reduzir ou até evitar qualquer uma das duas possíveis fontes de erro.

Erro amostral

Também conhecido como variabilidade amostral, corresponde à dife-rença entre o valor estimado para um parâmetro, calculado a partir de uma amostra da população, e o verdadeiro valor do parâmetro na população, calculado levando-se em conta todos os seus elementos. Obviamente, este conceito só é válido para as amostras aleatórias, e partindo-se do pressu-posto que as mesmas foram obtidas sem viés de seleção, pois as estimativas comportam-se aleatoriamente em torno do verdadeiro valor do parâmetro da população estudada. Lembre-se: não se pode evitar a ocorrência do erro

BIOESTATISTICA_Vol_01.indb 139 25/06/12 17:12

Page 140: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental140

amostral, porém podemos reduzir seu valor mediante a escolha de uma amos-tra de tamanho adequado.

Erro não amostral

É um tipo de erro não mensurável, pois advém de fatores inerentes ao erro de planejamento e de execução da pesquisa. Geralmente, são decorrentes da aplicação de questionários com perguntas mal elaboradas, de entrevistas mal aplicadas, da falta de informações sobre a população estudada, da utilização de aparelhos de medição mal calibrados ou até de erros de digitação durante a introdução dos dados.

4.2.4 RecrutamentoQuando tratamos com humanos, a escolha do método de recrutamento de sujeitos para um determinado estudo de pesquisa é uma etapa importante no processo do planejamento experimental. Por essa razão, uma vez escolhida a população, a identificação dos sujeitos acessíveis ao estudo e a escolha do procedimento de amostragem devem ter dois objetivos: assegurar que a amos-tra selecionada seja representativa da população-alvo e recrutar sujeitos em número suficiente que atenda ao tamanho da amostra calculado para o estudo. Estes objetivos serão explicados, a seguir:

•Amostra representativa da população – A qualidade mais importante de uma amostra é que ela deve possuir as mesmas características básicas da população da qual foi retirada, de modo que, para se conseguir este requi-sito, o método de recrutamento utilizado pelo pesquisador deve garantir que todos os critérios de inclusão dos participantes sejam fielmente cumpridos, além de propiciar mecanismos de acompanhamento desses sujeitos, ao longo de toda a pesquisa, assim como, favorecer a sua aderên-cia ao estudo, evitando, de todas as formas, uma perda considerável, que, de toda sorte, pode comprometer a viabilidade do mesmo.

De qualquer forma, em estudos clínicos, medidas devem ser tomadas para minimizar possíveis falta de aderência ou desistências, que se traduzem na recusa em participar da pesquisa ou na não-resposta aos questionários

BIOESTATISTICA_Vol_01.indb 140 25/06/12 17:12

Page 141: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tamanho da amostra e randomização 141

enviados, ou mesmo, na impossibilidade de contatar os possíveis partici-pantes. Dentre estas medidas, destacamos: o uso de métodos alternativos de contato, como carta ou telefone; o emprego de questionários descomplicados, auto-explicativos e traduzidos, quando em outra língua; a aplicação de testes não-invasivos, de diagnóstico; e, até mesmo, o reembolso de possíveis despesas, tal como aquelas com transporte e outras, justificáveis. Assim, é interessante notar que o pesquisador deve tentar despertar o interesse do pesquisado, sobre o estudo, mostrando a utilidade deste para a sociedade e para a ciência.

•Número suficiente de sujeitos – Para se conseguir que o tamanho da amostra seja igual ao inicialmente previsto para o estudo, o planejamento da pesquisa deve considerar o recrutamento maior que o necessário, uma vez que o número de sujeitos que se enquadram nos critérios de inclusão e que concordam em participar, é, geralmente, muito mais baixo que aquele inicialmente projetado. Consequentemente, o pesquisador deve buscar soluções que garantam um número representativo de sujeitos, de tal modo que as perdas sejam mínimas durante o desenvolvimento do estudo. Para tanto, é necessário, inicialmente, que ele conheça as características bási-cas da população a ser investigada, para que possa, posteriormente, traçar um plano coerente de amostragem que garanta o acesso a todos os indiví-duos elegíveis para o estudo. Lembre-se sempre: amostras excessivamente grandes causam desperdício de tempo e de recursos, e amostras pequenas podem não ser representativas da população de onde foi retirada.

4.3 CÁLCULOS PARA O TAMANHO DA AMOSTRA

Ao planejar a análise estatística de um dado experimento científico, um dos problemas que mais frequentemente acometem um investigador, refere--se ao número de sujeitos ou observações que devem ser incluídos na amostra para que esta seja, de fato, representativa da população, e que se tenha um estudo com resultados precisos e validade estatisticamente significativa. Isto é, qual o tamanho da amostra.

BIOESTATISTICA_Vol_01.indb 141 25/06/12 17:12

Page 142: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental142

Isto posto, podemos afirmar que não existe uma receita fechada para cal-cular o tamanho da amostra, e cada caso é um caso, o qual deverá ser analisado à luz dos objetivos e do delineamento do estudo. Assim, o cálculo deve con-templar o tamanho mínimo da amostra, o qual é obtido com base na análise estatística que se deseja realizar com os dados colhidos do experimento. Por conseguinte, o cálculo do tamanho amostral depende de vários fatores, dentre os quais destacamos:

•Oobjetivoda amostra – Se os dados colhidos a partir da amostra serão utilizados, no estudo, para a estimação de parâmetros ou para testar hipó-teses. Ou seja, se o estudo é puramente descritivo ou do tipo analítico (com teste de hipótese). Estudos descritivos costumam exigir amostra com menor número de participantes.

•O tipo de variável3 – Se a variável ou variáveis estudadas são do tipo quan-titativa ou qualitativa. As variáveis qualitativas costumam exigir amostras maiores que as variáveis quantitativas, que, por sua vez, exigem amostras maiores quanto maior for a variação nos dados amostrais.

•O delineamento do estudo – O planejamento experimental é fundamental para o cálculo do tamanho amostral, pois, dependendo do tipo de estudo será escolhido um tipo de teste estatístico para verificação da hipótese, e para cada tipo de teste será aplicada uma fórmula para o cálculo amos-tral. Por exemplo: um estudo pareado requer uma amostra com metade do número de sujeitos, quando comparados aos estudos não-pareados.

•O valor estimado para erro alfa – O erro alfa ou erro tipo I corresponde ao erro máximo que o pesquisador aceita cometer ao fazer o teste de hipótese para aceitar ou rejeitar a hipótese nula. É erro máximo que ele aceita para um erro falso-positivo, ou seja, em afirmar que existe diferença estatisti-camente significante entre os grupos estudados, quando, na verdade, essa diferença não existe. Tradicionalmente, para a área das ciências da saúde é estipulado em 5%. Assim, quanto menor a magnitude do erro alfa esti-pulado pelo pesquisador, maior será o tamanho estimado para a amostra.

3. Para entender a classificação das variáveis, remeta-se ao capítulo seis desta parte.

BIOESTATISTICA_Vol_01.indb 142 25/06/12 17:12

Page 143: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tamanho da amostra e randomização 143

•O poder do teste estatístico – Corresponde à probabilidade de que o estudo detecte uma diferença real entre os grupos estudados, que é igual um menos a probabilidade do erro tipo II, ou erro beta (1 - erro β), o qual se traduz pela probabilidade do pesquisador cometer um erro falso--negativo ao fazer o teste de hipótese para aceitar ou rejeitar a hipótese nula. Ou seja, em afirmar que não existe diferença estatisticamente sig-nificante entre os grupos estudados, quando, na verdade, essa diferença existe. Tradicionalmente, na área das ciências da saúde, o poder do teste é arbitrado em 80%, 85% ou 90%, que corresponde a um erro beta de 20%, 15% e 10%, respectivamente. Assim, quanto maior o tamanho da amostra, maior será o poder do estudo em detectar uma diferença ou um efeito real. Valores maiores, tais como 95% ou 99%, podem ser considerados, mas exi-gem amostras demasiadamente grandes.

•O tamanho da diferença – Corresponde ao tamanho da verdadeira dife-rença que se deseja discriminar como significativa, entre as médias da variável considerada no estudo. Pequenas diferenças exigem amostras maiores.

•O tamanho da população – Intuitivamente, podemos dizer que, quanto maior o tamanho da população, maior deverá ser o tamanho da amostra para que o estudo tenha relevância estatística. Porém, esta relação de pro-porcionalidade somente é importante para as pequenas populações. Para as grandes, o tamanho da amostra não é influenciado pelo tamanho da população, pois a mesma deverá ser considerada como ilimitada (infinita). Com base nesse raciocínio, podemos considerar que o tamanho da amos-tra, em si, tem mais interesse que a proporcionalidade que esta representa em relação ao tamanho da população, pois uma amostra constituída por 10% dos indivíduos, pode ser excessivamente grande ou extremamente pequena, dependendo do tamanho da população estudada.

•Dos recursos e do tempo disponível – É outro fator limitante que, não menos importante, pode influenciar no tamanho da amostra.

Portanto, com base nestes princípios, pode-se calcular o tamanho da amostra para duas finalidades: cálculo do tamanho da amostra para estudos

analíticos, aqueles que exigem teste de hipótese; e cálculo do tamanho da

BIOESTATISTICA_Vol_01.indb 143 25/06/12 17:12

Page 144: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental144

amostra para estudos descritivos, nos quais a estimação de parâmetros é o objetivo principal. Mas, de qualquer sorte, seja para teste de hipótese ou, sim-plesmente, para estimação de parâmetros (média, porcentagem, intervalo de confiança, etc.), existe uma multiplicidade de fórmulas, sendo as mais usuais, mostradas neste capítulo. Assim, neste processo, devem-se seguir passos lógi-cos, os quais são mostrados a seguir:

a. Primeiro passo – É escolher a fórmula apropriada tomando-se por base o tipo de estudo, se analítico ou descritivo, e o tipo de erro a ser conside-rado no estudo: erro alfa ou erro alfa e beta.

b. Segundo passo – É especificar os valores dos parâmetros que serão uti-lizados na fórmula escolhida para o cálculo do tamanho da amostra. Dentre esses parâmetros, temos:– Variância esperada (s2) – Deve ser obtida com base em conhecimen-

tos prévios sobre o estudo a ser realizado. No caso de variáveis do tipo contínuas, esta pode ser estimada com base em estudos semelhantes publicados na literatura, ou pela realização de um estudo piloto, previa-mente executado.

– Erro alfa (zα) – Deve ser estimado com base no critério de exigência do pesquisador. Usualmente, na área das ciências da saúde, é estimado em 5%. Porém, dependendo do grau de exigência da pesquisa, pode ser esti-mado em 1%. Outros valores, como 10%, podem ser selecionados, porém devem ser justificados, uma vez que denotam baixo grau de exigência da parte do pesquisador.

– Erro beta (zβ) – Usualmente, é considerado em 20%, porém pode ser estimado em 15% ou 10%. Como o erro beta é igual a um menos o poder do teste (zβ = 1 – P), quanto menor o erro beta estipulado, maior o poder do teste.

– Diferença estimada entre os grupos ( d ) – Corresponde à diferença mínima a ser detectada entre as médias da variável estudada (média arit-mética, por exemplo) em cada um dos grupos da pesquisa. Ou à diferença mínima entre a média da amostra ( x ) e a verdadeira média da popula-ção (μ).

BIOESTATISTICA_Vol_01.indb 144 25/06/12 17:12

Page 145: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tamanho da amostra e randomização 145

– Variância das proporções esperadas (p) – Se o parâmetro a ser estudado é uma proporção, digamos, proporção de sucesso para um determinado tratamento, e assumindo-se que os grupos são iguais no tamanho, o pesquisador deve determinar a proporção média (p) no estudo, ou seja, no grupo inteiro. A fórmula para calcular a variância das proporções é: p p p= −( )1 .

Nas fórmulas, valores do erro alfa e do erro beta, arbitrados pelo pesqui-sador, devem ser introduzidos com base nos valores de zα e zβ, determinados na distribuição normal gaussiana, conforme expresso no Quadro 4.1, abaixo, sendo zα, rotineiramente, bicaudal, e zβ, unicaudal.

Quadro 4.1 – valores calculados de zα e zβ conforme o valor do erro alfa e do erro beta estipulados para um estudo

Erro α Bicaudal(zα/2)

Poder do teste(1- β )

Unicaudal(zβ)

0,01 2,58 0,95 2,33

0,05 1,96 0,90 1,64

0,10 1,64 0,85 1,28

0,20 1,28 0,80 0,84

NotaçãoNas fórmulas estatísticas, os valores do erro alfa devem ser representados da seguinte maneira:zα - Teste unicaudalzα/2 - Teste bicaudal.

Assim, uma vez que as informações tenham sido reunidas, o pesquisador poderá, então, calcular o tamanho amostral (n) mínimo necessário para o estudo, segundo a fórmula selecionada. Aqui, é válido salientar que esse procedimento, na maior parte das vezes, é baseado em suposições que o investigador faz a respeito dos possíveis resultados esperados, tendo como base sua experiência sobre o assunto estudado, uma vez que algumas informações são puramente arbitrárias, como o erro alfa, por exemplo. Do mesmo modo, é necessário que

BIOESTATISTICA_Vol_01.indb 145 25/06/12 17:12

Page 146: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental146

o pesquisador estipule, previamente, se deseja trabalhar somente com o erro alfa, ou, se com o erro alfa e o erro beta, simultaneamente, pois, quando utiliza os dois tipos de erro, o tamanho da amostra é maior. Na prática, os progra-mas estatísticos para computador pessoal, tal como o BioEstat, trazem diversas opções para o cálculo do tamanho amostral, devendo, o pesquisador, escolher aquela que se aplica à sua pesquisa. Para tanto, é necessário que ele conheça o tipo de estudo e o tipo de teste estatístico a ser empregado na referida pesquisa.

Mas de qualquer maneira, é interessante notar que, tradicionalmente, a fórmula para calcular o tamanho da amostra (n) para que se obtenha uma esti-mativa confiável da média populacional (μ) é:

nz

E=

α σ/.2

2

Onde: zα/2 = Valor de z na curva normal segundo α (geralmente bicaudal). σ = Desvio padrão populacional da variável estudada. E = Diferença máxima estimada entre a média amostral ( x ) e a

verdadeira média populacional (μ). É a margem de erro ou erro máximo de estimativa.

Observando-se a fórmula acima, verificamos que o desvio padrão popu-lacional é exigido para o cálculo do tamanho amostral. Mas, se a população for do tipo ilimitado (infinita), para a qual não se pode calcular o desvio padrão? Como devemos proceder? Nesse caso, o pesquisador deverá realizar um estudo piloto com uma amostra aleatória de pelo menos 31 indivíduos da população, calcular o desvio padrão (s) dessa amostra e substituir, na fórmula, o valor σ pelo valor s. Ou utilizar, para o desvio padrão, um valor extraído de estudos semelhantes publicados na literatura. Ou ainda, utilizar um valor aproximado para o desvio padrão da variável, o qual é dado por: σ ≅ amplitude/4.

Por outro lado, uma variante desta fórmula é aquela que utiliza, tam-bém, o erro beta. Deste modo, temos dois tipos de fórmula: as que utilizam somente o erro alfa e as que utilizam o erro alfa e o erro beta, concomitante-

BIOESTATISTICA_Vol_01.indb 146 25/06/12 17:12

Page 147: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tamanho da amostra e randomização 147

mente, como proposto por Snedecor & Cochran, 1967 e Steel & Torrie, 1980. A explicação sobre qual das fórmulas deve ser utilizada será mostrada adiante. Assim, as fórmulas para o cálculo do tamanho da amostra podem ser escritas da seguinte maneira:

• Com erro alfa: nz s

x

=( ) ( )

−( )α

µ

/.

2

2 2

2, onde: = Diferença máxima

estimada entre a média amostral e a verdadeira média populacional.

x −µ

• Com erro alfa e beta:

nz z s

x

=+( ) ( )−( )

α β

µ

/.

2

2 2

2, onde: zα/2 = Valor crítico da

distribuição normal gaussiana.zβ = 1 – P, sendo P o poder do teste.

O Quadro 4.2 mostra os valores calculados para (zα+zβ)2 e (zα/2+zβ)2, segundo Snedecor & Cochran, 1967.

Quadro 4.2 – valores calculados para (zα+zβ)2 e (zα/2+zβ)2

Testes bicaudais (bilaterais)(zα/2+zβ)

2

Testes unicaudais (unilaterais)(zα+zβ)

2

Poder do teste(P)

Nível de significância alfa Nível de significância alfa

0,01 0,05 0,10 0,01 0,05 0,10

0,80 11,7 7,9 6,2 10,0 6,2 4,5

0,90 14,9 10,5 8,6 13,0 8,6 6,6

0.95 17,8 13,0 10,8 15,8 10,8 8,6

Note que, com base nas fórmulas apresentadas, ao calcular o tamanho da mostra, o pesquisador deverá considerar os seguintes pontos:

BIOESTATISTICA_Vol_01.indb 147 25/06/12 17:12

Page 148: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental148

• Como a variância (s2) encontra-se no numerador da fórmula, quanto maior for o seu valor, maior será o tamanho da amostra necessária para detectar uma grande variação na estimativa do parâmetro estudado;

• Para que o estudo seja confiável, o pesquisador necessita escolher um nível de significância (erro alfa) pequeno. Isto implica em um valor elevado para zα, pois, quanto menor o erro alfa, maior será o valor crítico (zα) na tabela normal gaussiana. Como este valor encontra-se no numerador da fórmula, quanto menor o nível de significância, maior será o valor do n amostral. Por exemplo, se o pesquisador decidir por um nível alfa de 10%, bicaudal, o valor de zα que deve ser introduzido na fórmula é de 1,64, que, elevado ao quadrado, seria igual a 2,68. Caso o mesmo pesquisador decida ser mais exigente e opte por um nível de significância menor, como 5%, por exemplo, o valor de zα intro-duzido na fórmula seria 1,96, que, elevado ao quadrado daria um valor igual a 3,84. Assim, esta opção, por uma redução no nível de significância, de 10% para 5%, iria requerer um aumento de 43% no tamanho da amostra;

• Se a diferença entre a média amostral entre os dois grupos estudados, ou entre a média amostral e a verdadeira média da população, a ser detectada, for pequena, isto irá requerer um tamanho amostral maior, uma vez que este valor encontra-se no denominador da fórmula. Assim, um tamanho maior da amostra é necessário para que uma pequena diferença possa ser detectada;

• O erro beta, ao qual deve ser dada especial atenção. Se em uma determi-nada pesquisa, para um nível alfa preestabelecido (5%, p. ex.), o investigador encontra uma diferença estatisticamente significativa entre as médias da vari-ável estudada, não há necessidade de investigar o erro beta. Porém, se num dado experimento, no qual o investigador esperava encontrar uma diferença clinicamente significativa entre as médias dos grupos estudados, mas essa diferença estatística não ocorreu, mesmo que os dados induzam o contrário, o erro beta pode ter ocorrido. Nesse caso, o pesquisador deverá aumentar o tamanho da amostra, a qual deverá ser recalculada com a fórmula que utiliza ambos os erros, alfa e beta. Lembre-se sempre: no delineamento de uma pes-quisa, o cálculo do tamanho da amostra deve ser realizado de modo a evitar a ocorrência do erro alfa (falso-positivo) e do erro beta (falso-negativo);

• As fórmulas apresentadas são aplicadas em estudos que utilizam o teste t

de Student pareado, no qual cada indivíduo é o seu próprio controle. Em

BIOESTATISTICA_Vol_01.indb 148 25/06/12 17:12

Page 149: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tamanho da amostra e randomização 149

estudos com dois ou mais grupos (experimental e controle, p. ex.), o tama-nho da amostra deve ser calculado para cada um dos grupos isoladamente. Porém, se o delineamento exige que os grupos sejam do mesmo tamanho, basta multiplicar o resultado calculado pelo número total de grupos.

4.3.1 Cálculo do n amostral para estudos descritivos

Cálculo de n para estimar a média da população (μ)

n s

xt gl=

−( )×( )

2

2

2

µα: x = média da amostra e μ = média da população.

tα = valor crítico da tabela t de Student e gl = n – 1.

, onde

• O valor da variância (s2) deve ser obtida da literatura ou de um estudo piloto.• É necessário estabelecer uma diferença máxima razoável entre a média

obtida da amostra e a verdadeira média da população ( - )x µ .• O valor de tα;gl não pode ser diretamente estimado, pois depende do erro

alfa e de gl (graus de liberdade) = n –1. Como não se tem n (o qual se quer calcular), deve-se escolher um tamanho amostral provisório (n0) para cal-cular gl e, então, obter tα;gl. Os valores provisórios gl e tα;gl obtidos são, então, reintroduzidos na fórmula para que um novo valor de n seja encontrado, o qual é utilizado para se obter um novo valor de tα;gl. Este procedimento é repetido até que o valor de n se estabilize.

Exemplo: A síndrome metabólica, um transtorno complexo, é caracterizada por um conjunto de fatores de risco cardiovasculares relacionados com resistên-cia à insulina e com a obesidade abdominal. Um pesquisador deseja conhecer a média dos valores dos triglicerídeos séricos em pacientes portadores desta sín-drome. Quantos pacientes ele deve avaliar para obter uma estimativa segura?

Assim, para calcular n, o pesquisador necessita da variância (s2), a qual pode ser obtida da literatura ou de um projeto piloto. Suponhamos que o investigador realizou um projeto piloto com 20 pacientes e encontrou uma taxa de triglicerídeos igual a 170 ± 31 mg/dL (média ± desvio padrão). Esse desvio padrão (s) pode ser utilizado como uma estimativa provisória para o cálculo de n.

BIOESTATISTICA_Vol_01.indb 149 25/06/12 17:12

Page 150: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental150

Agora, é necessário estabelecer uma diferença máxima razoável, admitida entre a média obtida da amostra e a verdadeira média da população ( - )x µ . Digamos que o pesquisador estabeleceu essa diferença em 10 mg/dL. Essa dife-rença corresponde ao erro de estimação admissível na pesquisa, a qual o método escolhido é capaz de detectar.

O erro alfa estipulado foi de 5% e o n0 = 30. Logo, gl(n – 1) = 29. Assim, quando se busca, na tabela4, os valores críticos da distribuição t de Student, temos: tα;gl = t0,05;29 = 2,045. Substituindo os valores na fórmula, vamos obter:

ns

xt

n

1

2

2

2 2

2

2

1

31

10=

−( ) =

=

( )

( )

( );µ αx xgl (2,045)

9,661 4,182= 40,19x

Com o valor obtido (40,19), considera-se a aproximação para o inteiro imediatamente superior, daí n1 = 41. Logo, se n1 = 41, temos gl = 40 e t0,05;40 = 2,021.

Assim, para calcular n2, temos:

ns

xt

n

2

2

2

2 2

2

2

2

31

102 021

9

=−

( ) =

=

( )

( )

( )( , )

,

;µ αx xgl

661 4 084 39 24x , ,=

Com o valor de n2 = 40, temos tα;gl = t0,05;39 = 2,021, logo o valor de n3 = 40. Ou seja, o valor de n fica estabilizado em 40. Portanto, com base nos cálcu-los efetuados, o pesquisador necessitará de uma amostra de 40 pacientes para estimar, com 95% de confiança, a média dos valores de triglicerídeos séricos em pacientes com síndrome metabólica. Como o tamanho da amostra é calcu-lado com base em suposições, o pesquisador poderá modificá-lo simplesmente alterando o valor escolhido para o erro alfa ou para a diferença entre os valores médios da amostra e a verdadeira média da população ( - )x µ .

4. Ver tabela dos valores críticos da distribuição t de Student, na parte referente a tabelas, no final deste livro.

BIOESTATISTICA_Vol_01.indb 150 25/06/12 17:12

Page 151: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tamanho da amostra e randomização 151

Uma maneira mais fácil e mais direta de calcular o tamanho da amostra é usar o zα em vez de tα;gl . Isto pode produzir uma discreta subestimação no tamanho amostral, mas, na prática, este método tem sido usado rotineira-mente, como demonstrado a seguir:

ns

xz

n

=−

=

=

2

2 2

22

2

231

101 96

9 61

( )( )

( )

( )( , )

,

/µ αx x

x 3 84 36 90 37, ,= ∴ =n

Cálculo de n para estimar o coeficiente de correlação

• Fórmula utilizada para o cálculo do tamanho amostral para um estudo que correlaciona duas variáveis paramétricas (contínuas), como peso x esta-tura, por exemplo.

nr t

rgl n=

−= −

( ) ( );

12

2 2

2+ 2, onde:

x α gl

Neste caso, é necessário que o investigador suponha um dado valor para a correlação, o qual pode ser encontrado na literatura ou em um pequeno estudo piloto. O nível alfa deve ser previamente estipulado.

Exemplo: Um pesquisador deseja investigar a correlação entre o peso e a estatura de crianças, ao nascer. Uma pesquisa piloto revelou um coefi-ciente de correlação (r) igual a 0,7. Considere o erro alfa igual 0,05% e n0 = 10. Então gl = 8 e tα;gl = t0,05;8 = 2,306.

n

n

x

x

1

2 2

2

1

1 0 7 2 306

0 72

0 51 5 31

= − +

=

( , ) ( , )

,

, , 77

0 492 7 53

,,+ =

Logo n1 = 8. Novos cálculos deverão ser efetuados até que o valor de n estabilize, como demonstrado no exemplo anterior. Se o erro beta for considerado em 20%, o valor encontrado para n será igual a 16.

BIOESTATISTICA_Vol_01.indb 151 25/06/12 17:12

Page 152: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental152

Cálculo de n para estimar uma proporção na população

• Fórmula utilizada para estimar a proporção de uma variável dicotômica, como proporção de sobreviventes sim x não.

nP P z

p P

=−( )−( )

1

2

2

2

. α P(1 – P) = Variância das proporções na população.

(p – P) = Diferença mínima a ser detectada entre o valor da proporção esperada e o verdadeiro valor da população.

, onde

Exemplo: Um investigador deseja conhecer, em uma população, qual a proporção de sobreviventes depois de transcorridos cinco anos do diagnóstico de uma determinada doença. Qual deve ser o tamanho amostral para que o investigador possa detectar uma diferença mínima entre a proporção esperada (p) e a verdadeira proporção na população (P) igual a 10%, considerando uma proporção estimada de sobreviventes igual a 40% e α = 0,05.

n

nx

= −

= =

0 40 1 0 40 1 96

0 1

0 24 3 84

0 0192

2

2

, ( , )( , )

( , )

, ,

,,,16 93∴ =n

O investigador necessita de uma amostra constituída por 93 indivíduos da população.

4.3.2 Cálculo do n amostral para estudos analíticos

Cálculo de n para o teste t de Student considerando os

erros alfa e beta

• Fórmula utilizada para calcular o tamanho amostral para um estudo que compare as médias de dois grupos independentes, considerando as variâncias iguais nos dois grupos.

BIOESTATISTICA_Vol_01.indb 152 25/06/12 17:12

Page 153: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tamanho da amostra e randomização 153

z = Valor do erro alfa (bicaudal).

z = Valor do

α

β

2

erro beta.

s = desvio padr o.

= Diferen a m n

ã

d ç í iima a ser detectada.

ns

dz z= +2 2

2 2

2.( )

( )( ) ,

/x α β onde:

Exemplo: Em um determinado município, um pesquisador deseja avaliar a estatura média de crianças matriculadas em escolas públicas e compará-las com crianças matriculadas em escolas particulares. Qual deve ser o tamanho da amostra para que o pesquisador possa identificar, com 95% de confiança (erro α = 0,05), uma diferença, se houver, de pelo menos 5 cm, entre as médias dos valores da estatura dos dois grupos de crianças? Um estudo piloto mostrou um desvio padrão (s) igual a 12 cm. Considere o poder do teste de 80% (erro β = 0,20).

n

nx

= +

=

×

×

2 12

51 96 0 84

2 144

257 84

2

2

2.( )

( )( , , )

( ,

)). ,

,= = ∴ =2 257 92

2590 31 91n

Logo o pesquisador irá precisar de uma amostra de 182 crianças, o que corresponde a 91 crianças para cada grupo estudado.

• Fórmula para comparar as médias de dois grupos independentes, conside-rando as variâncias desiguais nos dois grupos.

n

s s

dz zA B=

++

2 2

2 2

2

( )( ) ,

/x α β onde: s s

A B

2 2e = Variâncias estimadas para

as populações A e B.

Obs. Em ambas as fórmulas, pode-se substituir zα/2 e zβ por tα;gl e tβ, respectiva-mente, e adotar o procedimento descrito no primeiro exemplo, que trata do cálculo do tamanho amostral para estimar a média da população (μ).

BIOESTATISTICA_Vol_01.indb 153 25/06/12 17:12

Page 154: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental154

Cálculo de n para comparar duas proporções amostrais

nz P Q z P Q P Q

P P

O O A A B B

A B

=+ +

−( )α β/

,2

2

2

2

onde: PA = Proporção no grupo A. QA = Complemento de PA (1- PA). PB = Proporção no grupo B. QB = Complemento de PB (1– PB). PO = (PA + PB)/2. QO = Complemento de PO (1 – PO). PA – PB = Diferença mínima a ser detectada no estudo.

Exemplo: Em uma indústria alimentícia, um engenheiro químico deseja comparar dois tipos distintos de embalagem para conservação de um determi-nado alimento, com o objetivo testar a efetividade de ambas por um período de seis meses. O profissional observou que a embalagem A conserva cerca de 60% do alimento testado, enquanto que a embalagem B conserva cerca de 80%, para o mesmo período de tempo. A fim de comparar os dois tipos de embalagem (A e B), quais devem ser os tamanhos amostrais para que o investigador possa demonstrar que esta diferença apresenta significância estatística, considerando α = 0,05 e poder do teste = 0,80.

Dados do problema

PA = 0,60 (proporção para a embalagem A)PB = 0,80 (proporção para a embalagem B)PO = (0,60 + 0,80)/2 = 0,70α = 0,05. Logo z0,05 = 1,96Poder do teste = 0,80. Logo zβ = 0,84

n =+1 96 0 84, ,2 0,7 0,3 (0,6 0,4)+(0,8 0,2)x x x x

−( )=

−=

0 6 0 8

1 270 0 531

0 281

2

2

2

2

, ,

( , , )

( , ),n

+009 82∴ =n

BIOESTATISTICA_Vol_01.indb 154 25/06/12 17:12

Page 155: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tamanho da amostra e randomização 155

n =+1 96 0 84, ,2 0,7 0,3 (0,6 0,4)+(0,8 0,2)x x x x

−( )=

−=

0 6 0 8

1 270 0 531

0 281

2

2

2

2

, ,

( , , )

( , ),n

+009 82∴ =n

Logo o pesquisador irá precisar de uma amostra de 164 embalagens, o que corresponde a 82 embalagens do tipo A e 82 do tipo B.

Nota: Algumas vezes, o pesquisador é obrigado a calcular diferentes tamanhos amostrais em delineamentos experimentais que envolvam duas amostras distintas. Esse procedimento é particularmente exigido quando os tama-nhos das populações comparadas no estudo são, proporcionalmente, bastante diferentes. Neste caso, deve-se determinar quantas vezes uma amostra será maior que a outra para que os tamanhos amostrais possam ser ajustados. Esse ajustamento é feito com base no Quadro 4.3, proposto por Kirkwood (1988), mostrado a seguir.

Quadro 4.3 – Fator de ajuste para o tamanho de duas amostras

c* Fator de ajuste**

2 3/4

3 2/3

4 5/8

5 3/5

6 7/12

7 4/7

8 9/16

9 5/9

10 11/20 * Indica quantas vezes uma amostra é maior que a outra

** Usado para calcular o tamanho da amostra menor

Assim, tomando-se como ilustração o exemplo anterior, suponha que, nesta indústria, para cada quatro embalagens do tipo A, é utilizado apenas uma embalagem do tipo B, o que dá uma relação 4:1. Com base nesta relação, como deve proceder, o pesquisador, para que a amostra da embalagem A (nA) seja o quádruplo da embalagem B (nB)?

BIOESTATISTICA_Vol_01.indb 155 25/06/12 17:12

Page 156: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental156

Observe que, para a condição acima proposta, para c = 4 (amostra maior = 4 x amostra menor), o fator de ajuste corresponde a 5/8. Assim, o valor calcu-lado para n será multiplicado pelo fator de ajuste 5/8 para determinar a amostra menor (nB). A amostra maior (nA) será calculada multiplicando-se o valor da amostra menor (nB) pelo valor de ‘c’.

Logo, temos:

Amostra calculada ( ) = 82

Amostra menor ( )

n

n nB

= xx x= 82 = 51,2

Amostra maio

5

8

5

852∴ =n

B

rr ( ) = c = 52 4 = 208n nA B

x x

O pesquisador irá precisar de uma amostra de 260 embalagens, o que cor-responde a 208 embalagens do tipo A e 52 embalagens do tipo B. Note que, para um mesmo tipo de teste estatístico, com tamanhos amostrais diferentes, o número total de embalagens estudadas é maior que aquele necessário se as amostras fossem de tamanhos iguais.

Cálculo de n para comparar uma proporção amostral com

uma proporção populacional

nz p Q z P Q

P P

O O A A

A O

=+

α β/

( ),

2

2

2onde: PA = Proporção amostral.

QA = Complemento de PA (1 – PA).PO = Proporção na população.QO = Complemento de PO (1– PO).PA – PO = Diferença mínima a ser detectada no estudo.

Exemplo: Em uma determinada região de agropecuária, um pesquisador deseja estimar a proporção de bovinos acometidos por uma doença. Sabe-se, pela literatura, que a prevalência da doença em questão é algo em torno de 12%. Um estudo piloto realizado na mesma região mostrou uma proporção de 18% dos animais selecionados. Qual deve ser o tamanho da amostra, rando-

BIOESTATISTICA_Vol_01.indb 156 25/06/12 17:12

Page 157: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tamanho da amostra e randomização 157

micamente selecionada, para que ele possa testar se a diferença encontrada é estatisticamente significante, considerando α = 0,05 e o poder do teste = 0,90.

Dados do problema

PA = 0,18 (proporção do projeto piloto).PO = 0,12 (proporção da literatura).α = 0,05. Logo z0,05 = 1,96.Poder do teste = 0,90. Logo zβ = 1,28.

n =

+

1 96 1 28

0

2

, ,

(

0,12 0,88 0,18 0,82

0,18

x x

,, )

( , , )

( , ),

12

0 637 0 492

0 06354 08 355

2

2

2n n= + = ∴ =

No caso em questão, o pesquisador precisará de uma amostra de 355 ani-mais. Caso considere a amostra demasiadamente grande, ele pode, a critérios bem definidos, recalculá-la utilizando um poder do teste menor, como o usual 80%, o que aumentará o erro beta para 20%. Então, zβ = 0,84. Neste caso o novo valor amostral será igual a 256 animais.

4.3.3 Cálculo do n para populações limitadas(finitas)

Cálculo do n para uma amostra aleatória simples

O cálculo do tamanho de uma amostra aleatória simples impõe ao pesqui-sador que ele especifique um valor predefinido para o erro amostral (margem

de erro), o qual deve ser pensado em termos de probabilidade, pois, mesmo que uma amostra seja suficientemente grande, ela não garante que suas carac-terísticas sejam exatamente iguais a da população de onde foi retirada, uma vez que sempre existe a probabilidade da randomização gerar uma amostra bem diferente da população. Ou seja, a margem de erro exprime o valor de quanto o pesquisador admite errar na avaliação dos parâmetros estudados. Assim, temos:

BIOESTATISTICA_Vol_01.indb 157 25/06/12 17:12

Page 158: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental158

nN n

N nn

E=

+=

.0

0

0 2

1

0

, onde:

Sendo: N = Tamanho da população estudada. n0 = Primeiro valor aproximado do tamanho da amostra. E0 = Erro amostral (margem de erro).

Exemplo: Um gerente de uma pequena fábrica de medicamentos deseja realizar uma pesquisa por amostragem para conhecer uma determinada carac-terística de seus funcionários. Supondo que a fábrica emprega 50 pessoas, qual deve ser o tamanho mínimo da amostra aleatória simples para que ele possa realizar a pesquisa, admitindo um erro amostral de 5%?

(Primeira estimativa para o tamanho da amostra)

nE

0 = = =1 1

0 05400

0

2 2( , )funcionários

n n=+

= = ∴ =×50 400

50 400

20 000

45044 45 45 fu

., ncioonários

Com base no exemplo dado, e supondo-se que a fábrica tivesse 300 funcio-nários. Qual seria o tamanho da amostra?

n n=+

= = ∴ =×300 400

300 400

120 000

700171 42 172

., ffuncionários

Ainda. Supondo-se que a população de funcionários fosse: N = 80.000. Qual seria o tamanho da amostra?

n =+

= =×80 000

80 000 400

32 000 000

80 400398

.

.

. .

.

400fuuncionários

O Quadro 4.4 mostra, para os três exemplos acima, a relação entre o tama-nho da população e o respectivo tamanho da amostra, calculado conforme a fórmula apresentada. Note que, ao contrário do que parece o senso comum,

BIOESTATISTICA_Vol_01.indb 158 25/06/12 17:12

Page 159: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tamanho da amostra e randomização 159

para que uma amostra seja representativa, ela não necessita manter uma porcentagem fixa em relação ao tamanho da população, pois, se assim fosse, populações extremamente grandes exigiriam grandes amostras, o que inviabi-lizaria algumas pesquisas.

Quadro 4.4 – Relação entre o tamanho da população e o tamanho da amostra

Tamanho da população

(N)

Tamanho da amostra

(n)

Relação n/N(%)

50 45 90300 172 58

80.000 398 0.5

Cálculo do n para uma proporção populacional conhecida

nn

n

N

nz

EP P=

+=

−0

0

0

2

2

0 0

1

1, onde:α/

. ( )

Sendo: N = Tamanho da população estudada. n0 = Valor aproximado do tamanho amostral. P0 = Proporção amostral. E0 = Erro amostral (margem de erro).

Exemplo: Em uma comunidade rural, cuja população é estimada em 20.000 habitantes, um pesquisador deseja conhecer a taxa de prevalência de uma determinada doença endêmica. Um levantamento preliminar (estudo pilo-to) mostrou uma taxa de 12%. Qual deve ser o tamanho da amostra para que o referido pesquisador possa estimar a verdadeira taxa na população, admitindo um nível de confiança de 95% e um erro de amostragem de 5%?

Dados do problema

P0 = 0,08 (proporção do estudo piloto).α = 0,05. Logo z0,05 = 1,96E = 0,05N = 20.000 habitantes.

BIOESTATISTICA_Vol_01.indb 159 25/06/12 17:12

Page 160: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental160

n n0

2

0

1 96

0 050 12 0 88 168 96 169=

= ∴ =,

,. , ( , ) ,

nn

n

=+

= =

∴ =

169

1169

20 000

169

1 0085167 57

168

.

,,

indivvíduos.

Assim, o pesquisador necessitará de 168 indivíduos para estimar a verda-deira taxa de prevalência da doença em questão.

4.4 MÉTODOS DE RANDOMIZAÇÃO

4.4.1 Objetivos da randomizaçãoO processo de randomização constitui um importante instrumento de amos-

tragem e deve ser utilizado em projetos de pesquisa experimental cuja amostra é do tipo probabilística, especialmente em ensaios clínicos controlados e rando-mizados nos quais os sujeitos da pesquisa são alocados em um ou mais grupos experimentais e um grupo controle. Este processo, que representa a única maneira de garantir uma distribuição não-viciada dos indivíduos do estudo, não garante que os grupos selecionados sejam idênticos quanto ao tamanho ou característi-cas dos seus indivíduos. O que de fato a randomização garante, se bem realizada, é que os diferentes grupos do estudo sejam livres do viés de seleção.

4.4.2. Tipos de randomizaçãoExistem dois procedimentos básicos para seleção randômica para uma amos-

tra aleatória simples: amostragem com reposição e amostragem sem reposição.

Amostragem com reposição

Neste método, após um elemento (pessoas, objetos etc.) ser selecio-nado para compor um grupo, ele retorna à população, onde tem a mesma

BIOESTATISTICA_Vol_01.indb 160 25/06/12 17:12

Page 161: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tamanho da amostra e randomização 161

probabilidade de ser novamente selecionado. Assim, tome como exemplo um baralho com 52 cartas. Na primeira seleção, suponhamos que o ás de copas foi retirado. Em seguida, a carta é recolocada de volta ao baralho, o qual é novamente embaralhado e uma segunda carta é selecionada. Nessa segunda seleção, o ás de copas tem a mesma probabilidade de ser novamente retirado (1/N = 1/52). O processo é repetido até que seja obtido o tamanho desejado para a amostra.

Assim, considerando N o tamanho da população e n o tamanho da amostra, qual o número de amostras possíveis para uma população P = {1, 2, 3, 4, 5, 6} e uma amostra constituída por três elementos (n = 3).

Número de amostras = 6 = 216 amostras. = N n 3

Amostragem sem reposição

Neste caso, uma vez que um elemento é selecionado, ele não retorna à popu-lação e, portanto, não pode ser escolhido novamente. Como na amostragem com reposição, a chance de qualquer elemento em particular ser selecionado na primeira retirada é 1/N. Porém, a chance para o próximo elemento a ser selecionado será 1/N-1, e assim, sucessivamente. O processo continua até que o tamanho desejado para a amostra seja obtido. Portanto, considerando o exemplo anterior, o número de amostras possíveis será:

Número de amostras6 5=

−( ) =−( ) = ×N

n N n n

!

! !

!

! !

6

3 6

×× × × ×× × × ×

=4 3 2 1

3 2 1 (3 2 1)amostr20 aas

Note que, se a população a ser estudada for ilimitada (infinita ou muito grande), as retiradas com e sem reposição serão equivalentes. Isto é, se a popu-lação for infinita, o fato de se recolocar, de volta na população, o elemento que foi retirado, não afetará em nada a probabilidade de seleção do elemento seguinte. Porém, se a população for limitada (finita, pequena) será necessário fazer uma distinção entre os dois métodos, pois, na amostragem com reposição, as diversas retiradas serão independentes, mas, na amostragem sem reposição haverá dependência entre as retiradas, isto é, o fato de não recolocar o ele-

BIOESTATISTICA_Vol_01.indb 161 25/06/12 17:12

Page 162: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental162

mento retirado, afeta a probabilidade de o elemento seguinte ser selecionado, sendo este método mais eficiente que a amostragem com reposição, pois reduz a variabilidade, uma vez que não é possível retirar elementos extremos mais do que uma vez.

De qualquer forma, existem vários procedimentos de amostragem pro-babilística ou aleatória de uma população, sendo a amostragem aleatória simples o procedimento mais elementar e mais fácil de ser aplicado, servindo de base para os outros métodos de randomização, uma vez que, neste tipo de amostragem, cada elemento da população possui a mesma probabilidade de pertencer à amostra, assim como, amostras de um mesmo tamanho possuem probabilidades iguais de ser selecionadas.

Randomização para amostra aleatória simples

A maneira mais elementar de selecionar uma amostra aleatória simples, a partir de uma pequena população, é escrever cada elemento desta população em um pedaço de papel, os quais deverão ser todos de mesma cor e tamanho. O conjunto, após ser colocado em uma caixa apropriada é, então, cuidadosamente misturado para que o pesquisador possa sortear n elementos. Os elementos sorteados passarão a compor a amostra.

Outro procedimento, mais complexo, utiliza a tabela de números alea-

tórios, que consiste de uma série de números randomicamente escolhidos e listados na sequência na qual foram gerados. Como esta tabela utiliza o sis-tema decimal, a chance para a geração de cada um de seus números é de 1:10; e como a sequência é randômica, ela pode ser lida tanto na horizontal quanto na vertical, sendo estes números dispostos em linhas e colunas, organizados em grupos de cinco números para tornar a leitura mais fácil. Para usá-la, ini-cialmente é necessário atribuir um código numérico para cada elemento da população. Então a amostra é obtida pela leitura da tabela, selecionando-se os elementos cujos códigos numéricos coincidem com os dígitos encontrados na tabela.

Exemplo: Uma companhia gerenciadora de um plano de saúde quer selecionar uma amostra de 20 pacientes para avaliar o grau de satisfação em relação ao atendimento em uma determinada clínica. Considerando uma população de 400 pacientes atendidos, e assumindo que somente cerca de

BIOESTATISTICA_Vol_01.indb 162 25/06/12 17:12

Page 163: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tamanho da amostra e randomização 163

80% deles responderão ao questionário, a companhia necessita selecionar 25 pacientes para atender aos critérios calculados. Como a companhia deverá proceder para selecionar a amostra desejada, utilizando uma tabela de núme-ros aleatórios?

•1o passo – Todos os pacientes da população devem ser numerados de 1 a 400. Isto implica que serão considerados apenas os três primeiros dígitos dos números da tabela, selecionando-se apenas os números com valores menores ou iguais a 400. Note que a tabela apresenta, em cada coluna, número de cinco dígitos.

•2o passo – Arbitrariamente, uma regra é elaborada para que se possa escolher o ponto de partida e a direção a ser seguida na tabela, se se-guir vertical ou horizontalmente. Uma boa maneira é fechar os olhos e colocar um lápis em algum número da tabela. Daí em diante é só seguir a regra predeterminada. No caso em questão, escolheu-se o primeiro número da primeira coluna, e seguiu-se a direção horizontal. O número selecionado (sombreado) para compor o primeiro elemento da amostra é 148.

•3o passo – Procedendo-se, horizontalmente, para direita, através das colu-nas, o próximo número (073) corresponde ao segundo elemento da amos-tra. Assim, o processo de seleção continua desta maneira até que todos os elementos tenham sido selecionados. Se durante o processo de seleção, qualquer dos números se repete, esse número é descartado caso a amos-tragem seja sem reposição ou é novamente incluído na amostra se o pro-cesso de amostragem é com reposição.

É interessante notar que, para qualquer pesquisa, uma tabela de números aleatórios pode ser automaticamente gerada pela aplicação de softwares específicos, entre os quais destacamos o Microsoft Excel. Outros programas estatísticos, tal como o BioEstat, selecionam, randomicamente, os elementos da amostra (n) para uma determinada população de tama-nho N. A Tabela 4.1 mostra a tabela de números aleatórios utilizada para o exemplo em questão. Os números selecionados são: 148, 073, 267, 200, 243, 175, 223, 087, 064 etc.

BIOESTATISTICA_Vol_01.indb 163 25/06/12 17:12

Page 164: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental164

Tabela 4.5 – Números aleatórios

Linhas Colunas

1 2 3 4 5 6 7 8 9 10

1 14835 07362 26733 66337 20020 46848 24360 67813 17531 96160

2 84156 22328 08704 06439 64789 19606 74597 42899 36235 91089

3 07439 84935 67799 78493 03976 72783 31131 60452 23680 88212

4 60562 06499 56274 89528 77248 82823 29149 02415 46849 34372

5 92554 02182 58212 23811 74399 01856 50828 05868 60178 36120

6 57154 33430 44547 19479 28029 98735 02523 07352 26115 05784

7 33592 35545 09878 39291 05498 20618 13325 88848 05151 10298

8 63113 59196 90890 52945 95027 82655 76150 00102 23247 38135

9 53456 15261 00582 37612 11971 92844 44112 48161 15426 26704

10 89202 77388 51468 91049 19894 02188 13318 22280 34959 55245

11 88891 23578 84958 96820 99600 94748 42738 57576 79063 07765

12 84885 80345 96016 01251 09348 28560 11147 01657 00755 43642

13 38697 69389 98345 73048 29507 18526 67736 56657 49748 02160

14 39871 02677 13729 60302 49365 36310 29226 52028 93731 58365

15 33006 74668 41831 49768 95000 21495 32144 09647 64404 36257

Fonte: parcialmente extraída de Bioestatística - Princípios e Aplicações (Callegari-Jacques, SM). Números apresentados na Tabela 13, pág. 246.

Alocação sistemática

Este tipo randomização geralmente é utilizado para seleção de dois, três ou mais grupos, concomitantemente, a partir de uma única população. O pro-cedimento ocorre da seguinte maneira: o primeiro elemento randomicamente selecionado é designado para um grupo, como o grupo controle, por exem-plo; o elemento seguinte é automaticamente designado para o outro grupo da pesquisa, como o grupo experimental. Os elementos subsequentes seguiram o mesmo processo, ou seja, de maneira alternada serão designados para os diferentes grupos até que toda a amostra tenha sido selecionada. Se existir um terceiro ou um quarto grupo, o procedimento será o mesmo.

Além da facilidade na aplicação, existem outras vantagens na escolha desse método, sendo a principal, a garantia de que os grupos terão o mesmo número de elementos, ou seja, que terão o mesmo tamanho. Da mesma forma, neste tipo de randomização, a variação dos dados nas amostras selecionadas tende

BIOESTATISTICA_Vol_01.indb 164 25/06/12 17:12

Page 165: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tamanho da amostra e randomização 165

a ser menor, o que aumenta o poder do teste estatístico aplicado para verifica-ção de hipóteses. Por outro lado, uma possível desvantagem é a periodicidade na entrada dos pacientes no estudo, a qual pode ser evitada invertendo-se a sequência de alocação dos elementos selecionados.

Alocação estratificada

Na pesquisa do tipo ensaio clínico randomizado, é preferível que os grupos estudados sejam similares, sendo necessário considerar certas características rele-vantes dos indivíduos participantes, tal como a idade, o estágio da doença. Por exemplo, num determinado ensaio clínico, seria muito desagradável se a proporção de indivíduos com uma característica importante fosse muito desigual nos diferen-tes grupos de estudo. Isto causaria incerteza acerca de como a randomização foi efetuada, e afetaria a credibilidade das comparações entre os tratamentos. Porém, se o estudo envolver um grande número de participantes, cerca de 100 pacientes, por exemplo, menor será a probabilidade de ocorrerem os inconvenientes citados, logo, a estratificação é desnecessária. Por outro lado, existem estudos que não são muito grandes, nos quais existem fatores conhecidos que podem influenciar na resposta. Nestes casos, a estratificação é importante, pois ela funciona como uma medida de segurança, cujo objetivo principal é assegurar a homogeneidade na formação dos grupos. Assim, o primeiro passo consiste em decidir quais as características de inte-resse que permitem dividir a população em estratos, e, dentro desses estratos, são escolhidos, aleatoriamente, os indivíduos para compor a amostra.

4.4.3 Outras consideraçõesPara o cálculo do tamanho amostral, alguns pontos devem ser considera-

dos pelo pesquisador. Dentre eles, destacamos:

• Lembre-se. A randomização não garante que dois ou mais grupos sejam idênticos. Porém, o fato de ocorrerem diferenças estatisticamente signifi-cantes entre eles não significa que a randomização tenha sido viciada, pois algumas diferenças são esperadas somente em razão do acaso.

• O cálculo do tamanho amostral deve ser realizado no momento do deline-amento da pesquisa ou, se necessário, no início do estudo, quando mudan-

BIOESTATISTICA_Vol_01.indb 165 25/06/12 17:12

Page 166: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental166

ças ainda podem ser feitas. Um erro bastante comum é estimar o tamanho da amostra tarde demais.

• Mesmo que a randomização tenha sido perfeita, isso não garante o suces-so no procedimento do teste de hipótese da pesquisa. Outras precauções devem ser consideradas, tal como a acurácia e a precisão no processo da coleta de dados.

• Utilize-se de estratégias para minimizar o tamanho da amostra e maximi-zar o poder do teste estatístico. Se a amostra calculada for muito grande, repense os valores para os erros alfa e beta. Modifique sua hipótese, desde que a nova hipótese responda à questão da pesquisa. Use variáveis contí-nuas, pois elas exigem um tamanho amostral menor quando comparadas às variáveis dicotômicas. Um estudo pareado requer uma amostra cerca de 50% menor em relação a um estudo com um grupo experimental e um grupo controle, pois cada sujeito é o seu próprio controle.

• Técnicas para aumentar a precisão na medida das variáveis reduzem o ta-manho amostral, pois diminuem a variabilidade da amostra. Para variáveis contínuas, técnicas como medidas em duplicata ou triplicata podem au-mentar a precisão.

• O cálculo do tamanho da amostra estima o número mínimo de sujeitos que deverão ser incluídos no estudo para que este tenha um resultado confiá-vel. Para estudos de acompanhamento, especialmente aqueles por longos períodos, é necessário que o pesquisador estime uma taxa de abandono e de perda de acompanhamento dos sujeitos da pesquisa. Se, por exem-plo, a taxa de perda de acompanhamento é prevista em 15%, o pesquisa-dor deverá aumentar o tamanho da amostra segundo o fator de correção (1 ÷ [1 – 0,15] = 1,18. Ou seja, a amostra deverá ser aumentada em 18%.

BIOESTATISTICA_Vol_01.indb 166 25/06/12 17:12

Page 167: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

5Coleta, Organização

e Análise de Dados

5.1 OBJETIVO DA COLETA E ORGANIZAÇÃO DE DADOS

O objetivo mais importante de qualquer projeto de pesquisa é fazer infe-rências, para uma determinada população, a partir do estudo de uma amostra, da qual, geralmente, se extraem grandes quantidades de dados que, posterior-mente, deverão ser analisados em busca de informações que servirão de base para os testes de hipóteses, sendo este um importante passo no processo da pesquisa científica.

De uma maneira mais elaborada, podemos dizer que a coleta de dados se refere à obtenção, registro e tabulação sistemática de informações estatísticas, com o propósito de se extrair informações. Assim, com base neste objetivo, extrair informações de grandes quantidades de dados requer técnicas estatísti-cas especiais, tanto no que tange à coleta e à organização, quanto à análise, uma vez que, dados apresentados em sua forma original, bruta, não permitem que qualquer tipo de informação possa ser facilmente extraída. Portanto, sem que haja um tratamento prévio, a fim de torná-los mais expressivos, torna-se bas-tante difícil qualquer tipo de análise, especialmente quando o delineamento da pesquisa prevê vários grupos de comparação, com análise de muitas variáveis, concomitantemente.

BIOESTATISTICA_Vol_01.indb 167 25/06/12 17:12

Page 168: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental168

Consequentemente, com objetivo de facilitar sua interpretação, os dados coletados a partir de um projeto de pesquisa podem ser organizados em tabe-las, gráficos ou quadros sinópticos, ou ainda resumidos mediante o uso de medidas estatísticas, tais como a média, mediana, variância ou desvio padrão, entre outras. Logo, do ponto de vista da estatística, não importa se as observa-ções são relativos a seres humanos, animais, objetos ou eventos. Na verdade, o que de fato importa é o tipo de dado coletado e as unidades em que são men-surados, tal como a estatura em metro ou centímetro, a massa em grama ou quilograma e o volume em litro ou mililitro etc. Deste modo, tais características utilizadas para resumir um conjunto de dados é que determinam a chamada estatística descritiva, a qual pode ser apresentada, basicamente, sob a forma tabular ou gráfica, descritas a seguir:

Apresentação tabular

Neste tipo de apresentação, os dados são mostrados sob a forma de números ordenados e dispostos em tabelas constituídas por linhas e colunas, segundo normas tabulares específicas1. As tabelas, quando bem elaboradas, facilitam a compreensão do fenômeno estudado, uma vez que os dados são apresentados de maneira resumida, o que permite uma visão geral de como este fenômeno se comporta.

Apresentação gráfica

Neste tipo de apresentação, os dados são dispostos sob a forma de desenhos geométricos, tais como colunas, barras, círculos e linhas, os quais mantêm proporcionalidades entre si, de acordo com o valor que cada dese-nho representa. Quando comparados a uma tabela, os gráficos permitem ao observador obter uma visão mais fácil e mais clara do fenômeno estudado, assim como de sua variação.

5.1.1 Tipos de dados quanto à origemQuanto à origem, um conjunto de dados pode ser classificado como:

1. Ver normas tabulares do Instituto Brasileiro de Geografia e Estatística (IBGE) e do Conselho Federal de Estatística.

BIOESTATISTICA_Vol_01.indb 168 25/06/12 17:12

Page 169: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Coleta, organização e análise de dados 169

Dados primários

Correspondem às informações numéricas ou tabulares publicadas pela própria pessoa ou pela instituição que os produziu. São os dados coletados com o propósito de atender às necessidades específicas de uma determinada pesquisa. Estes dados, quando publicados, costumam ser acompanhados por informações que esclareçam os procedimentos empregados para sua obtenção, tais como o método e o material da pesquisa, o tipo e o tamanho da amostra, entre outros, o que os torna mais detalhados e confiáveis.

Dados secundários

São aqueles publicados por pessoas ou instituições diferentes daquelas que os produziu. Por exemplo: quando um determinado veículo de comunica-ção, tal como um jornal, publica os resultados de uma ou de várias pesquisas, os dados são secundários para quem deseja utilizar-se deles para qualquer outra finalidade. Portanto, o conceito de dados primários ou secundários é sempre tomado em relação a quem os coleta e publica.

5.1.2 Análise e interpretação dos dadosUma vez que os dados são coletados, eles devem ser criteriosamente con-

feridos à procura de possíveis inconsistências, uma vez que falhas no processo de obtenção e de tabulação podem ter ocorrido, o que, de certa forma, pode comprometer o resultado da pesquisa. Esta análise e posterior interpretação correspondem à última e a mais importante etapa do processo estatístico de tratamento dos dados, pois, a partir dela, conclusões serão extraídas no sentido de responder à questão da pesquisa, inicialmente proposta.

Por sua vez, é importante notar que esta análise passa, essencialmente, por cálculos de medidas estatísticas, e dentre elas citamos a média aritmética e a variância, por exemplo, cuja finalidade é descrever de maneira mais coerente o fenômeno estudado. Assim, a partir do conjunto dessas medidas, pode-se, então, aplicar os testes estatísticos para a verificação da hipótese inicialmente proposta para a questão da pesquisa. Deste modo, o significado exato de cada um dos testes de hipótese deve ser bem interpretado, sendo agora possível arriscar, mesmo com algum grau de incerteza, algumas previsões e generaliza-ções para a população de onde foram retiradas as amostras que deram origem

BIOESTATISTICA_Vol_01.indb 169 25/06/12 17:12

Page 170: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental170

aos dados ora analisados, uma vez que, não se pode garantir que aquilo cons-tatado para a amostra seja, necessariamente, igual ao verificado na população.

5.1.3 Acurácia e precisãoA identificação de fontes apropriadas de dados representa o ponto de

partida para o sucesso de qualquer tipo de pesquisa, pois dados bem coleta-dos definem testes estatísticos mais precisos e confiáveis. Porém, se durante a coleta ocorrerem vieses, ambiguidades ou qualquer outro tipo de erro, até o mais sofisticado método estatístico será incapaz de salvá-los, tendo como con-sequência informações imprecisas e pouco acuradas. Assim, mesmo sabendo-se que nenhuma pesquisa é livre de erros e que as inferências estatísticas nunca são perfeitamente válidas, é importante que o pesquisador planeje estratégias de como coletar e analisar os dados do estudo, de modo a reduzir possíveis erros que possam comprometer sua validade. Com base neste princípio, pode-mos identificar dois tipos de atributos que podem reduzir os erros na coleta de dados. São elas: a acurácia e a precisão, ambas com a mesma importância, devendo estar sempre presentes em qualquer tipo de pesquisa.

Acurácia

Refere-se à propriedade da medida de uma variável ser correta em relação ao seu real valor. Por exemplo: se com a utilização de uma balança antropomé-trica, tomarmos a medida da massa corporal de um indivíduo que tenha, de fato, 70 kg, para que a balança seja considerada acurada, ela terá de registrar a massa correta, ou seja, 70 kg, ou um valor muito próximo. Caso registre um valor diferente, a balança não pode ser considerada acurada, uma vez que não registrou o verdadeiro valor da variável estudada. Assim, se uma medida não é acurada, ela é viciada, pois, quanto maior o erro, menor a acurácia da medida, de modo que a única maneira de melhorar a acurácia de uma medida é delinear o estudo de forma a reduzir os vieses que induzam os erros de medição. A falta de acurácia é decorrente do erro sistemático, que será discutido adiante.

Em um estudo de pesquisa, a acurácia pode ser avaliada pela comparação das medidas coletadas com uma técnica de referência considerada como acurada (padrão-ouro). Assim, para variáveis categóricas, a acurácia deve ser descrita em termos de sensibilidade e especificidade, quando os dados são compara-

BIOESTATISTICA_Vol_01.indb 170 25/06/12 17:12

Page 171: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Coleta, organização e análise de dados 171

dos a um padrão-ouro. Para variáveis contínuas, pode-se comparar a diferença média entre os dados coletados e o padrão-ouro para os sujeitos do estudo.

Precisão

Refere-se à capacidade de uma medida fornecer o mesmo resultado ou resultados muito semelhantes, para um mesmo fenômeno, quando repetida várias vezes, em idênticas condições. Por exemplo: se repetirmos, por três vezes, a tomada da pressão arterial sistólica de um paciente, cujo real valor é igual a 140 mmHg, e os valores encontrados forem 140 mmHg, 139 mmHg e 141 mmHg, respectivamente, podemos admitir que o aparelho utilizado para a medição é bastante preciso. Como os valores encontrados coincidem ou estão muito próximos ao valor verdadeiro da pressão arterial sistólica do paciente examinado, ou seja, 140 mmHg, podemos também afirmar que o equipamento é bastante acurado.

Também denominada de reprodutibilidade ou confiabilidade, a precisão tem importância bastante significativa no poder de um estudo, pois, para um mesmo tamanho amostral, quanto mais preciso for o método utilizado para medir uma determinada variável, maior será o poder estatístico do teste utilizado para a verificação da hipótese do estudo. A falta de precisão ocorre em consequência do erro aleatório, que será discutido adiante. Para avaliar a reprodutibilidade de uma variável categórica, quando a mesma é repetida em idênticas condições, a melhor abordagem é a utilização de um dos dois estimadores de confiabilidade: o percentual de concordância e estatística de Kappa, os quais serão discutidos em outro capítulo. Para variáveis contínuas, utiliza-se o desvio padrão intra-

-sujeito. Porém, se relação entre o desvio padrão intra-sujeito versus a média do sujeito mostra uma correlação linear no gráfico de Bland-Altman2, a melhor avaliação é feita pelo emprego do coeficiente de variação, o qual é dado pelo desvio padrão intra-sujeito dividido pela média amostral.

Tradicionalmente, os livros de estatística ilustram os conceitos de acurá-cia e precisão mediante a apresentação de figuras, sendo as mais tradicionais,

2. O gráfico de Bland-Altman é utilizado para verificar a presença de qualquer erro sistemático e possíveis valores outliers. É um método estatístico que compara duas técnicas de medição. Neste gráfico, as diferenças (ou ratios) entre as duas técnicas são plotadas em comparação com as médias das duas técnicas.

BIOESTATISTICA_Vol_01.indb 171 25/06/12 17:12

Page 172: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental172

a figura de um gráfico de linhas e a figura de um alvo, de tiro, as quais são demonstradas a seguir, nas Figuras 5.1 e 5.2.

Observando-se o gráfico de linhas, verifica-se que, na Figura A, as medidas foram acuradas, pois a média dos valores encontrados reflete o valor verdadeiro da média da amostra; e também precisos, uma vez que os valores encontrados foram muito próximos, o que leva a uma pequena variação entre os dados cole-tados. Na Figura B, as medidas foram acuradas, mas com pouca precisão, pois, embora reflita o verdadeiro valor da média amostral, ocorreu uma grande varia-ção entre os valores encontrados, fato este que pode mascarar uma diferença estatisticamente significativa quando, em uma pesquisa, dois ou mais grupos são comparados. A Figura C mostra que as medidas foram precisas, porém não acu-radas, pois a média dos valores encontrados não reflete o valor verdadeiro da amostra, sendo, portanto, viciadas. Na Figura D, os dados são totalmente desti-tuídos de qualquer valor científico, pois não são acurados nem precisos.

A. Acurados e Precisos

Valor verdadeiro

B. Somente acurados

Valor verdadeiro

C. Somente precisos

Valor verdadeiro

D. Nem acurados nem precisos

Valor verdadeiro

Fig. 5.1 – Possíveis combinações entre a acurácia e a precisão no processo da coleta de dados. Fonte: extraído de Bioestatística, Epidemiologia e Medicina Preventiva

(Jekel JF, Elmore JG, Ketz DL)

BIOESTATISTICA_Vol_01.indb 172 25/06/12 17:12

Page 173: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Coleta, organização e análise de dados 173

A. Acurados e Precisos B. Somente acurados

C. Somente precisos D. Nem acurados nem precisos

Fig. 5.2 – Possíveis combinações entre a acurácia e a precisão no processo da coleta de dados. Fonte: extraído de Bioestatística, Epidemiologia e Medicina Preventiva

(Jekel JF, Elmore JG, Ketz DL)

5.2 ERROS NA COLETA DE DADOSComo discutido anteriormente, nenhuma pesquisa é isenta de erros,

os quais são, geralmente, difíceis de ser identificados e corrigidos. Portanto, quando utilizamos métodos estatísticos para medir e explicar a variação total de uma amostra, devemos sempre lembrar que parte desta variação é causada por algum tipo de erro na coleta dos dados, o qual deve ser eliminado, ou, ao menos, minimizado, sob pena de comprometer a interpretação dos dados. Com base neste princípio, podemos identificar dois tipos de erros na coleta de dados. São eles: erro sistemático e erro aleatório.

5.2.1 Erro sistemático (Bias)Do inglês bias, é também chamado de viés, vício ou tendenciosidades. Este

tipo de erro diferencial, que induz à falta de acurácia nas medidas, provoca dis-

BIOESTATISTICA_Vol_01.indb 173 25/06/12 17:12

Page 174: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental174

torções que, de qualquer forma, desvia a média em uma direção, o que leva ao enfraquecimento de uma associação entre duas variáveis ou, pior ainda, pode causar uma falsa associação entre elas, provocando aquilo que, em estatística, é denominado como associação espúria. Os erros sistemáticos podem ser:

Viés de seleção

Este tipo de erro ocorre em razão de falhas no processo de formação da amostra, especialmente no processo de randomização, o que leva a uma distor-ção na medida de associação entre um fator de risco e o desfecho de interesse, por exemplo. É, portanto, uma tendência sistemática no processo de amostra-gem, de incluir ou excluir certos sujeitos da população, em razão de alguma característica em especial. Um bom exemplo deste tipo de viés é a auto-seleção, que ocorre quando o pesquisador permite que os sujeitos participantes da pes-quisa escolham em que grupo devem ficar alocados, se no grupo experimental ou no grupo controle.

De qualquer maneira, o viés de seleção deve sempre ser considerado em estudos observacionais do tipo caso-controle ou de coorte, quando, no momento da seleção da amostra, a exposição ao fator de risco ou a doença já ocorreram. Ou seja, se o processo de formação da amostra induz a uma asso-ciação entre um fator de risco e uma determinada doença, quando, na verdade, essa associação não existe, então este achado decorre de um viés de seleção. Portanto, em um estudo caso-controle, os indivíduos do grupo controle devem formar uma amostra representativa da mesma população que deu origem ao grupo caso. Se isto não ocorrer, o pesquisador introduziu um viés de seleção no estudo. Raciocínio semelhante é aplicado para os estudos de coorte.

Além da auto-seleção, o viés de seleção pode ser classificado como: viés de detecção, viés de diagnóstico, viés de sobrevivência seletiva, efeito do trabalha-dor saudável, Viés de prevalência-incidência (de Neyman) e viés de admissão (de Berkson), entre outros. Para melhores esclarecimentos, remetemos o leitor para Medronho RA, et al. Epidemiologia. São Paulo: Ed. Atheneu, 2005.

Viés de aferição (de medição)

Refere-se a distorções que decorrem de erros no processo de aferição das medidas da amostra. Este tipo de viés pode resultar de um erro do obser-

BIOESTATISTICA_Vol_01.indb 174 25/06/12 17:12

Page 175: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Coleta, organização e análise de dados 175

vador ou de um defeito no instrumento utilizado para medição. No primeiro caso, ocorre uma distorção, consciente ou inconscientemente introduzida na anotação de uma determinada medida, que pode ter sido provocada por erro no manuseio de instrumentos ou por erro na leitura de um dado valor. Como exemplo, podemos citar um pesquisador que faça a aferição da pressão san-guínea de pacientes em situações adversas, como após subir uma escada, ou que meça a estatura de pacientes que estejam utilizando calçados com saltos de diferentes alturas, ou, ainda, que avalie a massa corporal de pacientes que estejam utilizando diferentes tipos de vestes. Em relação à distorção produ-zida por defeito no instrumento de medição, a aferição da medida da pressão arterial com a utilização de aparelhos descalibrados é um bom exemplo. Em ambos os casos, todas as medidas carecem de acurácia e podem distorcer possíveis associações.

Viés de recordação (de memória)

Refere-se a distorções produzidas por erros na coleta de informações, em razão da falha na evocação da memória. Isto ocorre quando o sujeito da pesquisa não consegue lembrar de fatos do passado. É um erro comum em estudos observacionais do tipo caso-controle, no qual os grupos necessitam relembrar sobre suas exposições passadas aos fatores de risco estudados, pois, de modo geral, os sujeitos do grupo caso apresentam maior probabilidade de recordar sobre suas exposições aos fatores de risco, quando compara-dos aos indivíduos do grupo controle. Isto é explicado pela tendência que as pessoas apresentam de relembrar, com mais detalhes, a ocorrência de eventos adversos.

5.2.2 Erro aleatórioTambém chamado de erro não-diferencial, ele resulta de uma estima-

tiva distorcida em razão do acaso, com o desvio da média amostral ocorrendo com igual probabilidade para ambas as direções. Embora menos compro-metedor que o viés, pois causa menos distorção nos dados coletados, o erro aleatório diminui o poder estatístico de um teste de hipótese e reduz a probabilidade de um estudo detectar uma associação real entre as vari-áveis estudadas. Portanto, quanto menor for o erro aleatório, mais precisa

BIOESTATISTICA_Vol_01.indb 175 25/06/12 17:12

Page 176: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental176

é a medida e maior será o poder do teste em detectar possíveis diferenças entre os grupos, havendo, portanto, três possíveis fontes de variabilidade da amostra: a variabilidade do observador, a variabilidade do sujeito e a varia-bilidade do instrumento de medição. No primeiro caso, o erro ocorre em razão da variabilidade inerente ao próprio observador. Pessoas diferentes possuem habilidades diferentes na aplicação de questionários ou no manu-seio de instrumentos, por exemplo. No segundo caso, o erro pode ocorrer em razão das variabilidades biológicas inerentes aos sujeitos da pesquisa, como certas tendências genéticas, por exemplo; e, no terceiro caso, a variabilidade do instrumento se refere à variabilidade das medidas causada por fatores ambientais que podem interferir no funcionamento do instrumento, como a temperatura e a umidade ou por desgaste do instrumento.

Como a ocorrência do erro aleatório depende de pessoa para pessoa e de medição para medição, ele tende a anular-se num elevado número de medições, sendo o aumento do tamanho da amostra uma estratégia para minimizá-lo.

5.2.3 Confundimento (ou confusão)É uma situação de erro de interpretação (ou de associação), na qual ocorre

o confundimento entre duas variáveis supostamente causais, de maneira que o efeito (desfecho) atribuído a uma delas é, na verdade, decorrente da ação da outra variável. Ou seja, é quando há um fator extrínseco (variável con-

fundidora) envolvido na associação causa-efeito entre duas variáveis, uma preditora e a outra de desfecho, sendo este fator extrínseco, na realidade, a verdadeira causa do desfecho, e não a outra variável, a qual o pesquisador é levado a pensar como sendo causa do efeito estudado.

Originado do latim confusione, o termo significa misturar, pôr junto. Porém, na estatística, o termo tem um significado mais técnico, e, em estudos observacionais, o investigador deve ficar atento para controlar a influência de potenciais variáveis confundidoras sobre o desfecho estudado. Com esta finali-dade, o primeiro passo é identificar os possíveis fatores extrínsecos que podem estar associadas à variável preditora de interesse e que também podem ser causadores do desfecho em estudo. Dentre esses fatores, os mais comuns são as variáveis idade e sexo.

BIOESTATISTICA_Vol_01.indb 176 25/06/12 17:12

Page 177: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Coleta, organização e análise de dados 177

Um exemplo clássico para ilustrar a atuação de uma variável confundidora é mostrado por Hulley et al, no livro Delineando a Pesquisa Clínica. Num estudo em que o pesquisador deseja mostrar a associação entre o consumo de café e infarto do miocárdio, o hábito de fumar pode atuar como um provável confun-didor, uma vez que o fumo está associado a um maior consumo de café e é causa já bem definida para o infarto. Como essa explicação é verdadeira, a associação entre café e infarto não representa uma relação de causa e efeito, sendo o café uma variável inerte na associação. Assim, com o objetivo de dirimir qualquer tipo de dúvida (confusão), uma boa maneira para evitar a atuação do fumo como uma variável confundidora, seria incluir no delineamento da pesquisa apenas indivíduos não-fumantes. Com este procedimento, se uma associação entre o consumo de café e infarto for observada, esta associação, com toda cer-teza, não é decorrente do hábito de fumar.

Ainda na fase de delineamento, outra maneira de evitar uma variável confundidora é parear (emparelhar) a amostra, ou seja, escolher os sujeitos casos e os controles com valores emparelhados para as variáveis confundido-ras, pois, neste caso, tanto os casos como os controles passam a compartilhar níveis semelhantes do confundidor. Assim, para o exemplo em questão, para cada paciente do grupo caso (com infarto), seria pareado um ou mais indiví-duos para o grupo controle (sem infarto) com um consumo de cigarros/dia semelhante. Desta maneira, o consumo de café de cada caso seria comparado com o consumo de café do controle a ele pareado.

Na fase de análise dos dados, a estratificação da amostra e o ajuste esta-

tístico são duas outras estratégias que podem auxiliar o pesquisador a evitar inferências equivocadas em razão de confundidores. Para maior aprofunda-mento sobre o assunto, remetemos o leitor para Hulley SB, et al. Delineando a

pesquisa clínica. Porto Alegre: Ed. Artmed, 2003.

5.2.4 Interação e sinergismoSão dois outros fatores que podem influenciar na associação entre duas ou

mais variáveis.A interação, também chamado de efeito modificador, ocorre quando

uma terceira variável modifica a direção ou a força de associação entre duas outras variáveis que atuam, concomitantemente, para um mesmo desfecho.

BIOESTATISTICA_Vol_01.indb 177 25/06/12 17:12

Page 178: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental178

Por exemplo, Velásquez-Meléndez et al (2004), em um estudo transversal de base populacional, estudaram a epidemiologia do sobrepeso e da obesidade, com objetivo de determinar as suas prevalências e investigar os fatores de risco associados, na população maior de 18 anos, residente na região metro-politana de Belo Horizonte. Os potenciais fatores associados foram estudados a partir de análises bivariadas e da técnica de regressão logística multiva-riada. Dentre os resultados encontrados, os autores constataram que a idade e o estado marital apresentaram-se como fatores de risco independentes para o sobrepeso, enquanto a idade, o sexo e a escolaridade como fatores independentes para a obesidade. A interação entre o sexo feminino e a alta escolaridade constituiu-se em fator protetor para o sobrepeso, mas não para a obesidade. A baixa escolaridade foi um fator modificador para as mulhe-res, que apresentaram alto risco de desenvolver obesidade em comparação aos homens.

O sinergismo corresponde à interação entre duas ou mais variáveis cau-sais, de modo que o efeito combinado das duas é consideravelmente maior que a soma de seus efeitos individuais. No exemplo anterior, os autores cons-tataram uma interação entre a variável sexo (sexo feminino) e a variável escolaridade (alta escolaridade), as quais, atuando em conjunto, constituí-ram-se em fator protetor para a ocorrência do sobrepeso, mas não para a ocorrência da obesidade.

5.2.5 Estratégias para melhorar a coleta de dadosComo descrito anteriormente, a acurácia e a precisão são dois atributos

necessários para uma boa coleta de dados. Desta forma, visando a reforçar esta idéia, listamos, a seguir, algumas estratégias que podem ser implementadas pelo pesquisador, de maneira que seus dados constituam uma fonte segura de inferências estatísticas.

Treinamento dos pesquisadores

Constitui um ponto fundamental em estudos conduzidos por uma equipe, onde cada membro deve receber treinamento para que possa adquirir exper-tise no desempenho de tarefas relacionadas ao manuseio de equipamentos de medição ou em procedimentos previstos no delineamento da pesquisa, tal

BIOESTATISTICA_Vol_01.indb 178 25/06/12 17:12

Page 179: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Coleta, organização e análise de dados 179

como aplicação de questionários, preenchimento de fichas de protocolo, técni-cas cirúrgicas, análises químicas, físicas e biológicas, entre outros. Lembre-se, só a prática leva à perfeição, e, nesse sentido, destacamos a importância do pro-jeto piloto, ao qual, dentre outras funções, atribuímos, também, o treinamento da equipe executora do projeto.

Padronização dos procedimentos

Este item refere-se ao protocolo da pesquisa, que deve conter o manual refe-rente a todas as operações previstas no delineamento. Aqui, cada procedimento deverá seguir instruções previamente escritas de como realizá-lo. Dentre essas instruções, destacamos: procedimentos para calibragem e para a utilização de instrumentos de medição, a preparação do ambiente da pesquisa (laboratórios, salas etc.), técnicas de como conduzir e registrar os dados de um teste clínico ou de uma entrevista, e assim por diante. Lembre-se, nos procedimentos cuja avaliação do resultado depende da subjetividade do observador (observador-dependente), tal como nos exames de imagem, por exemplo, a leitura do resultado deverá ser realizada, preferencialmente, pelo mesmo pesquisador (ou técnico).

Otimização e padronização dos instrumentos

Instrumentos mecânicos e eletrônicos novos e modernos são sempre os mais adequados, pois a validade dos resultados depende da qualidade do ins-trumento empregado na aferição das medidas. Da mesma forma, questionários utilizados para entrevistas devem ser redigidos com clareza, de modo a evitar ambiguidades. Lembre-se: por mais modernos e precisos que possam parecer os instrumentos, eles sempre apresentarão variabilidades quando operados em diferentes condições ambientais. Portanto, deve-se, preferencialmente, utilizar sempre os mesmos instrumentos durante todo o desenvolvimento da pesquisa. Neste item, a calibração periódica do instrumento aumenta a acurá-cia das medidas.

Repetição das medidas

Trabalhar com a média de duas ou mais medições para cada elemento da amostra é uma boa estratégia, pois diminui o erro aleatório e aumenta a precisão da medida. Porém, medidas em duplicata, triplicata, ou mesmo, quin-

BIOESTATISTICA_Vol_01.indb 179 25/06/12 17:12

Page 180: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental180

tuplicadas, de modo geral aumentam demasiadamente os custos da pesquisa, sendo, portanto, pouco factíveis.

Cegamento (mascaramento)

Esta estratégia foi bem discutida no item 3.3.1 (estudo com cegamento), para onde, em caso de dúvidas, remetemos o leitor.

5.3 FONTES DE VARIAÇÃO

No item anterior deste capítulo, descrevemos sobre os tipos de erros mais comuns que um pesquisador pode cometer durante a coleta de dados. Conhecê-los é fundamental para que se possa evitá-los, pois, como já foram anteriormente mencionadas, as técnicas estatísticas constituem uma poderosa ferramenta que auxilia os investigadores a interpretarem os dados de suas pes-quisas, apesar das possíveis variações entre eles, mas a estatística não pode corrigir erros decorrentes de observações ou de coleta de dados mal conduzi-das. Assim, conhecer as fontes de variação também se faz necessário, pois isso ajuda o pesquisador a reconhecer e a evitar possíveis fontes de erros. Dentre as principais, temos:

Variações biológicas

Correspondem às diferenças inerentes ao próprio sujeito da pesquisa, tais como aquelas decorrentes de fatores genéticos e/ou provocados por influên-cias ambientais. O padrão genético é responsável por grande parte da variação encontrada em uma amostra de pessoas ou animais. Em uma pesquisa, dife-renças encontradas em medidas antropométricas, tais como a estatura e massa corporal, podem ser explicadas pela variabilidade genética e, também, pela influência do meio ambiente, como o fator nutricional, entre outros. As medidas das variáveis hemodinâmicas e metabólicas podem ser influenciadas pela inte-ração de múltiplos fatores, genéticos e ambientais, assim como pela presença de doenças associadas, que podem modificar uma resposta a um determinado tratamento a ser testado. Portanto, o investigador deve estar atento, para essas possíveis variações, pois elas podem mascarar uma diferença estatisticamente significativa ou induzir a uma associação espúria.

BIOESTATISTICA_Vol_01.indb 180 25/06/12 17:12

Page 181: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Coleta, organização e análise de dados 181

Condições diferentes de aferição

As diferenças produzidas por medições em diferentes condições ambien-tais também são fontes comuns de variação, que podem ser corrigidas pela padronização do método de medição. Por exemplo: ao aferir a pressão arterial de um grupo de atletas, o pesquisador deverá cuidar para que todos os atletas estejam na mesma condição basal de repouso, assim como as medidas deve-rão ser tomadas na mesma hora do dia, na mesma temperatura ambiente, no mesmo estado de humor e, sempre com o mesmo aparelho. O mesmo é válido para a utilização de equipamentos eletrônicos, sensíveis às variações ambien-tais de temperatura, umidade e pressão. Lembre-se: o ambiente é parte inerente de sua pesquisa, e, como tal, a sua padronização deve ser prevista no delinea-mento, pois diferenças entre os grupos estudados podem ter sido provocadas apenas pela variação ambiental e não pelos diferentes tipos de procedimento (tratamentos) testados na pesquisa.

Métodos diferentes de aferição

É outro fator que contribui para a variabilidade dos dados, pois equipamen-tos diferentes podem fornecer leituras diferentes para uma mesma variável, tal como a pressão arterial ou a massa corporal, por exemplo, assim como, instru-mentos ou métodos laboratoriais distintos podem produzir leituras diferentes para uma mesma amostra. Do mesmo modo, observadores diferentes podem relatar diferentes resultados para um mesmo exame, cujo diagnóstico depende do caráter subjetivo do observador. Portanto, é importante notar que o avanço da tecnologia tem-nos proporcionado uma pluralidade de métodos de medição para uma mesma medida e a sensibilidade e a especificidade desses diferen-tes métodos variam segundo as especificações de cada fabricante. Assim, seja por instrumentos ou por técnicas subjetivas de análise, diferentes métodos de medição produzem resultados diferentes. Desta forma, cada técnica de medi-ção deve ser cuidadosamente determinada ainda na fase de delineamento, de modo a evitar qualquer tipo de viés ou erro que possam comprometer o resul-tado da pesquisa.

Por exemplo: Beghetto et alii (2006), com objetivo de verificar a precisão e acurácia na aferição do peso corporal em pacientes hospitalizados, realizaram um estudo transversal que avaliou 360 adultos, em oito unidades de interna-

BIOESTATISTICA_Vol_01.indb 181 25/06/12 17:12

Page 182: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental182

ção (UI) de especialidades clínicas e cirúrgicas, com a utilização de três tipos de balanças: portátil doméstica, fixa de plataforma e portátil digital, sendo a última previamente calibrada e adotada como padrão de referência. O peso informado pelos pacientes também foi comparado à balança de referência. Os valores foram comparados através de teste t para amostras pareadas. Com base nos resultados encontrados, os autores concluíram que as balanças testa-das não foram acuradas e precisas em estimar o peso corporal dos pacientes avaliados, dado o percentual de erro nas avaliações para cada sujeito e a varia-bilidade observada.

Lembre-se sempre - Existem duas condições importantes que podem indu-zir grande variabilidade nos dados: a variação inerente ao procedimento, que depende de fatores como a estabilidade e qualidade do equipamento e dos rea-gentes ou substâncias utilizadas para o diagnóstico. E variação do observador, que depende da experiência pessoal de ler ou interpretar a informação. Essa experiência pode variar entre diferentes examinadores (variação inter-obser-vador) e no mesmo examinador, quando a leitura/interpretação é feita em duas ocasiões diferentes (variação intra-observador).

BIOESTATISTICA_Vol_01.indb 182 25/06/12 17:12

Page 183: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

parte 2

INTRODUÇÃO À ESTATÍSTICA DESCRITIVA

Benício Neto, Ieda Scarminio e Roy BrunsDo livro “Como Fazer Experimentos” (2002).

“A essência de um bom planejamento consiste

em projetar um experimento de forma que ele seja capaz

de fornecer exatamente o tipo de informação que procuramos.

Para isso, precisamos saber, em primeiro lugar,

o que é mesmo que estamos procurando”.

BIOESTATISTICA_Vol_01.indb 183 25/06/12 17:12

Page 184: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

BIOESTATISTICA_Vol_01.indb 184 25/06/12 17:12

Page 185: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

6Estudo das Variáveis Estatísticas

6.1 CONCEITOS ESTATÍSTICOS

A estatística é vista como a ciência que tem por objetivo estudar os processos que orientam a coleta, a organização (resumo), a apresentação (des-crição), a análise e a interpretação de dados numéricos, os quais são extraídos a partir de estudos realizados em amostras ou em populações constituídas de pessoas, animais, vegetais ou objetos inanimados. Constitui, pois, em termos gerais, um conjunto de ferramentas para trabalhar com dados, tornando suas análises mais precisas, eficientes e seguras, sendo, portanto, dividida, por ques-tões didáticas, em duas grandes áreas:

Estatística descritiva

Corresponde ao conjunto de técnicas envolvidas com o processo da coleta, organização, resumo e classificação dos dados, além de orientar a descrição e a apresentação dos mesmos, na forma de tabelas e gráficos ou em outros tipos de recursos visuais. Importa, também, à estatística descritiva, o cálculo da estima-tiva de parâmetros representativos desses dados, tais como a média, a moda, a mediana e o desvio padrão, entre outros.

BIOESTATISTICA_Vol_01.indb 185 25/06/12 17:12

Page 186: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental186

Estatística inferencial

Abrange um conjunto de técnicas aplicadas no processo de inferências que auxiliam o pesquisador a extrair conclusões sobre uma determinada população, quando somente pequenas partes (amostras) dela foram estudadas. Importa saber que a estatística inferencial é subdividida em: estimação de parâme-

tros e testes de significância.A estimação de parâmetros compreende a inferência sobre os descritores

matemáticos (média, moda, mediana, desvio padrão, razões de risco e de chance etc) de uma população, com base nos dados obtidos a partir de uma amostra selecionada entre os seus elementos. Os testes de significância correspondem aos cálculos de probabilidades estatísticas utilizados para a verificação de hipóteses previamente formuladas, as quais dizem respeito às possíveis asso-ciações causa-efeito estudas na pesquisa.

De qualquer maneira, seja a estatística descritiva ou inferencial, os dados coletados sempre se referem às informações relativas a determinadas carac-terísticas de uma amostra ou população, características essas chamadas de variáveis, as quais servem de base para toda a análise estatística. Assim, des-crever uma amostra ou população, tomando-se como base a análise de suas variáveis, requer o conhecimento prévio de alguns conceitos estatísticos, den-tre os quais, o próprio conceito de variável, que resumiremos a seguir:

• Unidade experimental (elemento) – Genericamente, corresponde a cada um dos elementos constituintes da amostra (população), os quais estão sendo estudados na pesquisa, seja ela observacional ou experi-mental. As unidades experimentais podem ser pessoas, animais, objetos, plantas etc.

• Variável – É qualquer característica de interesse que, observada em um elemento (unidade experimental) da amostra (população), pode variar de um indivíduo para o outro. O nome variável advém do fato de que esta característica pode apresentar diferentes valores ou qualidades para cada um dos elementos estudados. Ou seja, os valores e qualidades variam de elemento para elemento e podem ser medidos. Por exemplo: em um estudo que correlacione os valores da pressão arterial sistólica de pacientes hiper-tensos, com os valores da idade, estatura, massa corporal, raça e sexo, cada

BIOESTATISTICA_Vol_01.indb 186 25/06/12 17:12

Page 187: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Estudo das variávEis Estatísticas 187

uma dessas características pode variar na amostra, sendo, portanto, consi-deradas, no estudo, como variáveis.

• Observação – Compreende a informação, numérica ou não, obtida a partir de uma variável em um elemento específico da amostra.

• Dados – Correspondem ao conjunto de informações, numéricas ou não, obtidas de cada uma das variáveis consideradas para o estudo de todos os elementos da amostra. Tomando o exemplo anterior, podemos dizer que, para cada elemento da amostra, serão coletadas informações numéricas referentes aos valores da pressão arterial sistólica, da idade, da estatura e da massa corporal, assim como informações qualitativas sobre a raça e o sexo dos indivíduos da amostra. É, portanto, o conjunto de todas as observações do estudo.

• Caso – É o conjunto de observações obtidas de um determinado elemento da amostra. Representa, pois, os dados de um elemento.

• Parâmetro – É uma característica (informação) estatística utilizada para descrever uma determinada variável. Ainda no exemplo anterior, os valo-res da variável pressão arterial sistólica podem ser descritos sob a forma de média aritmética, mediana, desvio padrão etc, sendo cada uma dessas informações considerada como um parâmetro.

• Estimativa – É o valor calculado para um determinado parâmetro, a partir dos dados coletados de uma amostra, cujo objetivo é fazer inferências para um conjunto maior de dados, ou seja, para a população. Se no exemplo anterior, a média aritmética dos valores da pressão arterial sistólica foi cal-culada em 180 mmHg, o parâmetro média aritmética foi estimado em 180 mmHg, valor este que representa uma boa estimativa dos valores médios da pressão arterial sistólica dos indivíduos da população de onde a amos-tra foi retirada. É, portanto, o valor numérico do estimador obtido a partir de uma determinada amostra.

• Atributo – Corresponde à característica, qualitativa ou quantitativa, que iden-tifica um elemento de uma amostra. Por exemplo: valores da pressão arterial sistólica, idade, estatura e massa corporal geralmente são descritas como variáveis quantitativas, ao passo que raça e sexo são descritas como variáveis qualitativas, sendo estas as características que formam a base para a classifi-cação das variáveis em um estudo de pesquisa, que discutiremos a seguir.

BIOESTATISTICA_Vol_01.indb 187 25/06/12 17:12

Page 188: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental188

6.2 CLASSIFICAÇÃO DAS VARIÁVEISAs variáveis são características que podem ser medidas, controladas ou até

manipuladas e diferem, entre si, em muitos aspectos, principalmente no papel que cada uma delas desempenha em uma pesquisa e na forma como podem ser medidas. Assim, é muito importante que o pesquisador identifique que tipo de variável está estudando, uma vez que, para cada tipo de variável, são recomen-dados procedimentos estatísticos diferentes, tais como, cálculos matemáticos e testes de hipótese. Desse modo, o primeiro passo para entender uma variável é saber classificá-la e descrevê-la, livre de erros e tendenciosidades. O Quadro 6.1 mostra as diferentes classificações das variáveis, tal como elas podem ser apresentadas em uma pesquisa.

Quadro 6.1 – Tipos de variáveis conforme a maneira como são apresentadas na pesquisaClassificação Tipos

Quanto à escala de medição

Quantitativas (numéricas)• Contínuas (dimensionais)

• Discretas

Qualitativas (categóricas)• Nominais

• Dicotômicas (binárias)• Ordinais

Quanto à dependência• Independentes (variáveis preditoras)

• Dependentes (variáveis-resposta)

Assim, tradicionalmente, as variáveis são classificadas, segundo a maneira como são estudadas, em:

6.2.1 Variáveis quantitativas Também ditas numéricas, são aquelas cujos dados são descritos em valores

numéricos que expressam quantidades, tal como a pressão arterial, a estatura de pessoas, a temperatura, a concentração de proteína em um alimento, o número de colônias contadas em uma amostra etc. Podem ser subdivididas em contínuas e discretas.

Variáveis contínuas

São aquelas cujos dados podem apresentar qualquer valor pertencente ao con-junto de números reais, dentro de um intervalo possível para a variação estudada,

BIOESTATISTICA_Vol_01.indb 188 25/06/12 17:12

Page 189: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Estudo das variávEis Estatísticas 189

inclusive com valores fracionários. São também chamadas de variáveis dimen-sionais, pois adotam escalas de medição para sua descrição, tal como escalas de comprimento, área, volume etc. São exemplos, a estatura, o peso, temperatura, valo-res da pressão arterial, valores de concentração de soluções, dosagens bioquímicas etc. Sua denominação como contínua decorre do fato de que, em uma série numé-rica de valores de uma dada variável, entre dois desses valores, sempre é possível que se encontre uma infinidade de outros resultados numéricos. Por exemplo, se formos mediar a estatura de uma população, entre duas pessoas com estatura 176 cm e 177 cm, é possível encontrar valores como: 176,1, 176,12, 176,23, 176,37, 176,9, e assim sucessivamente. Essas variáveis geralmente são medidas através de algum instrumento, tal com uma balança (peso), uma régua (estatura), um relógio (tempo).

Variáveis discretas

São aquelas cuja mensuração resulta em quantidades cujos valores são expressos por números inteiros, finitos ou infinitos, não admitindo frações. Geralmente, são o resultado de contagens. Temos como exemplo, a contagem do número de crianças nascidas vivas em uma maternidade, pois neste caso não se admite o nascimento de 1,5 crianças. Ou seja, somente fazem sentido os valores inteiros. Outros exemplos são: número de indivíduos acometidos por uma doença, na população; número de indivíduos fumantes, número de pro-dutos contaminados em uma amostra, número de defeitos em uma linha de produção etc.

6.2.2 Variáveis qualitativasTambém chamadas de variáveis categóricas, são aquelas cujos resultados

fornecem dados de natureza não-numérica, ou seja, são representadas segundo uma característica própria da variável, uma qualidade, um atributo, uma cate-goria. Como exemplo, temos: a raça do indivíduo, o sexo, a cor dos olhos, o grupo sanguíneo, a qualidade de um produto, a posição assumida em uma tabela ou lista.

Muitas vezes, por questões operacionais dos programas de computa-dores, as variáveis qualitativas têm que ser representadas por números, tal como: masculino = 1 e feminino = 2. Nestes casos, os números não represen-tam quantidades, sendo, apenas, códigos numéricos, destituídos de qualquer

BIOESTATISTICA_Vol_01.indb 189 25/06/12 17:12

Page 190: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental190

valor quantitativo. Por outro lado, mesmo sendo qualitativas, para questão do cômputo dos dados coletados, essas variáveis precisam ser contadas quanti-tativamente, pois somente assim pode-se distribuí-las em gráficos ou tabelas e submetê-las a testes estatísticos para verificação de hipóteses. Por exemplo: se a variável a ser estudada é o gênero de crianças nascidas vivas, ao final do estudo o pesquisador precisará saber qual a quantidade de crianças vivas, do gênero masculino e feminino. Essas variáveis podem ser subdivididas em nominais, dicotômicas e ordinais.

Variáveis nominais

São, também, chamadas de variáveis nomeadoras. Corresponde à variáveis cuja identificação é feita apenas por meio da denominação de cada uma das diferentes categorias assumidas pela variável, ou seja, pelo nome atribuído a cada categoria, sem que exista qualquer tipo de ordenação entre elas. Por exem-plo: a variável “grupo sanguíneo” pode ser expressa em A, B, AB, O, Rh+, Rh-; a cor da pele em branca, rosada, pálida, ictérica etc; o gênero de um animal em masculino e feminino; o resultado de uma enquete em fumante e não-fumante.

Variáveis dicotômicas

Ou variáveis binárias, representam um caso particular de variável nominal, pois somente aceitam duas categorias como resposta. Como exemplo, temos: o gênero somente pode ser descrito como masculino ou feminino; o resultado de um desfecho, sim ou não, curado ou não curado; o fator Rh sanguíneo, como positivo ou negativo; e, também, a cor da pele, quando descrita como normal e anormal etc.

Variáveis ordinais

Correspondem às variáveis cujas categorias podem ser ordenadas segundo um critério de graduação de sua intensidade, sem que isto signifique que a magnitude das diferenças seja medida numericamente e se apresente igualmente distribuída entre os valores categorizados. Da mesma maneira, tal como para as variáveis nominais, suas categorias podem ser descritas como nomes, símbolos ou números, sem que isto represente valores quan-titativos, pois são meramente representativos. Um bom exemplo de variável

BIOESTATISTICA_Vol_01.indb 190 25/06/12 17:12

Page 191: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Estudo das variávEis Estatísticas 191

ordinal é o resultado de um exame clínico no qual se descreve a intensidade de um sintoma, como a dor, em 1+, 2+, 3+ e 4+ (lê-se uma cruz etc.). Os valores da intensidade da dor possuem uma ordenação, porém não se pode afirmar que a intensidade 4+ é quatro vezes maior que a intensidade 1+. Como outro exemplo, temos o grau de satisfação do consumidor em relação a um deter-minado produto, que pode ser mensurado como insatisfeito, pouco satisfeito, satisfeito e muito satisfeito.

Embora as variáveis ordinais não sejam mensuradas em uma escala exata, elas contêm mais informações que as variáveis nominais, uma vez que mostram uma relação crescente entre as categorias, o que permite melhor comparação quando dois ou mais grupos são estudados. Por este motivo, elas devem ser preferidas em relação às nominais, pois permitem conclusões mais seguras, mesmo requerendo técnicas especiais de análise.

Por sua vez, as variáveis contínuas devem ser preferidas em relação às variáveis ordinais ou nominais, pois contêm mais informações sobre os sujei-tos da amostra, uma vez que, não somente mostram a posição que cada um dos elementos ocupa na amostra, assim como mostram o grau em que cada observação difere das demais. Assim, as variáveis contínuas permitem que o pesquisador aplique testes estatísticos mais robustos e faça inferências mais confiáveis.

Portanto, com base neste princípio, é importante que o pesquisador pla-neje com antecedência, ainda no delineamento da pesquisa, quais os tipos de variáveis com que ele irá trabalhar, pois somente assim ele poderá saber que tipo de teste estatístico poderá aplicar. Para isso, é necessário que ele conheça algumas particularidades sobre as variáveis. Dentre elas, destacamos:

• Quando uma variável é descrita com números, isto não significa, neces-sariamente, que ela seja do tipo quantitativa, ela pode ser, também, qualitativa. Por exemplo: o número do documento de identidade, o número do telefone ou o número de um registro (matrícula) são variáveis qualitativas, mesmo sendo representada por números. Como descrito acima, em alguns casos uma variável qualitativa pode ser representada por um número de código.

• Uma variável que, originalmente, é coletada de forma quantitativa, pode, a qualquer tempo, ser transformada em qualitativa, basta apenas que o

BIOESTATISTICA_Vol_01.indb 191 25/06/12 17:12

Page 192: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental192

pesquisador categorize os dados. Por exemplo, a variável idade, quando coletada em anos, a partir de uma amostra de 100 indivíduos, é quantita-tiva (contínua); mas, se os valores forem distribuídos por faixa etária (0 a 10 anos, 11 a 20 anos etc.) é qualitativa ordinal. Como outro exemplo, pode-se citar o peso de pacientes; se for medido em kg, é uma variável quantitativa, porém, se o resultado for categorizado em “abaixo do peso”, “peso normal” e “acima do peso”, é uma variável qualitativa ordinal.

• Quando uma variável originalmente quantitativa é transformada em qua-litativa, não somente o método estatístico tem que ser modificado, como, também, o resultado do teste de hipótese pode ter um resultado dife-rente, no que tange à significância estatística, daquele que se obteria com a variável sendo considerada como quantitativa, pois muitas informações são perdidas com a transformação. Perceba como isso pode acontecer: considerando o primeiro exemplo do item anterior, quando a idade é medida em anos (contínua), um indivíduo que tenha 11 anos é diferente de um que tenha 12 anos, mesmo que a diferença entre eles seja de ape-nas um ano de idade; porém, quando a idade do grupo é categorizada em faixas etárias, o mesmo indivíduo de 11 anos é considerado pertencente à mesma categoria daquele que tem 20 anos, sendo ambos considerados estatisticamente iguais, mesmo que a diferença entre eles seja de nove anos. Isto parece estranho, porque, neste mesmo exemplo, o indivíduo de 11 anos ocupa uma categoria diferente do indivíduo de 10 anos de idade, sendo, portanto, ambos estatisticamente diferentes entre si, mesmo que a diferença entre eles seja apenas de um ano.

• Exceto nos casos estritamente necessários, não se deve transformar vari-áveis quantitativas (contínuas) em variáveis qualitativas, sob pena de se perder informações importantes, o que pode levar a falsas associações entre as variáveis estudadas (associação espúria) ou a erros nos resul-tados dos testes aplicados para a verificação de hipóteses, tal como o erro falso negativo.

• Tradicionalmente, as variáveis podem ser medidas em quatro escalas bási-cas: nominal, ordinal, intervalar e de razão. As variáveis categóricas são medidas em escalas nominal e ordinal, ao passo que as variáveis quantita-tivas são medidas em escalas intervalar e de razão.

BIOESTATISTICA_Vol_01.indb 192 25/06/12 17:12

Page 193: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Estudo das variávEis Estatísticas 193

• Quanto à maneira de medir uma variável, a escala nominal é aquela que descreve os dados com base nas qualidades (atributos) de suas catego-rias, podendo utilizar nomes, números (códigos numéricos) ou símbolos. Na escala ordinal, as categorias podem igualmente ser descritas tal como na escala nominal, porém há ordenação de uma categoria em relação às demais. Quanto à escala intervalar, na qual os valores dos dados são descritos considerando-se intervalos iguais entre eles, o valor nulo não representa ausência da característica medida, pois esta escala possui um zero como medida, tal como na escala de temperatura, onde 0oC não repre-senta ausência de temperatura, mas o 0o da escala Celsius, por exemplo. Na escala de razão, os intervalos entre os valores das medidas também são iguais, porém o valor zero indica a ausência da característica medida, tal como nas variáveis idade, massa corporal, tempo e pressão arterial, pois 0 kg de massa corporal representa ausência total de peso.

6.2.3 Variáveis independentes e dependentesUma outra maneira de estudar as variáveis é classificá-las quanto ao tipo

de dependência existente entre elas, ou seja, como essas variáveis se correla-cionam dentro do estudo. Assim como foi explicado para o tipo de variável, a interdependência entre as variáveis também deve ser definida, pelo pesquisa-dor, ainda na fase de delineamento da pesquisa, de tal modo que, em estudos do tipo analítico, ele possa analisar a força de associação entre duas ou mais variáveis na predição do desfecho e, assim, fazer inferências sobre causa e efeito. Portanto, com base nesta interdependência, as variáveis podem ser ditas independentes e dependentes, conceitos esses que passaremos a defi-nir, a seguir.

Variáveis independentes (preditoras)

São aquelas que, em uma pesquisa, são estudadas no sentido de expli-car o comportamento de uma ou mais variáveis dependentes, cujos efeitos se querem medir. Ou seja, são aquelas que precedem ou, supostamente, que predizem um determinado desfecho, daí serem chamadas, também, de vari-áveis preditoras. São, portanto, os fatores causais de um desfecho. O termo independente, embora relativamente confuso, deve-se ao fato dos valores

BIOESTATISTICA_Vol_01.indb 193 25/06/12 17:12

Page 194: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental194

coletados para essas variáveis não apresentarem nenhuma dependência com o pesquisador, uma vez que eles são próprios da amostra, isto é, são inde-pendentes. Por exemplo, se um investigador deseja estudar a correlação das variáveis idade, estatura e massa corporal, com os valores da pressão arte-rial de uma amostra de indivíduos, a idade, a estatura e a massa corporal são as variáveis independentes (preditoras), pois elas irão atuar em con-junto para influenciar no desfecho pressão arterial. Como cada indivíduo da amostra tem seus próprios valores para idade, estatura e massa corporal, valo-res esses que não podem ser alterados pelo pesquisador, essas variáveis são ditas independentes.

Variáveis dependentes (variáveis-resposta)

Também ditas variáveis de desfecho, são aquelas que caracterizam o efeito que se estuda e se quer explicar, de acordo com a atuação das variáveis independentes. Em uma pesquisa, essas variáveis se situam, habitualmente, no final do processo de verificação causa-efeito e são sempre definidas na hipótese ou na questão da pesquisa, daí o termo dependente, uma vez que o seu comportamento depende da maneira como as variáveis independentes atuam sobre ela. No exemplo anterior, a pressão arterial é a variável depen-dente, pois a variação dos seus valores está sendo estudada para se verificar se depende ou não da interação das variáveis independentes, idade, estatura e massa corporal.

Note que o conceito de variável independente e dependente é relativo, pois uma dada variável, como a pressão arterial, por exemplo, pode ser independente em um estudo e dependente em outro. No exemplo anterior, a pressão arterial é considerada como variável dependente, porém, se esti-vesse sendo estudada como fator de risco para o infarto agudo do miocárdio, ela seria considerada como independente, e a ocorrência ou não de infarto, como a variável dependente (desfecho). A Figura 6.1 mostra a pressão arte-rial como variável preditora e variável-resposta em dois diferentes estudos.

A relação de dependência entre duas variáveis nem sempre se mantém constante ao longo de todo o experimento. Em um estudo que correlacione a variável idade (independente) com a variável estatura (dependente), a inter-dependência entre elas somente é válida enquanto os indivíduos estudados

BIOESTATISTICA_Vol_01.indb 194 25/06/12 17:12

Page 195: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Estudo das variávEis Estatísticas 195

estiverem na fase de crescimento, porque uma vez que cada indivíduo atinja a estatura máxima, a idade continuará aumentando, independentemente, ao longo do tempo. Por outro lado, mesmo que se encontre alguma relação estatística entre as variáveis independentes e a dependente, isto, não necessa-riamente, significa relação causal.

Em um estudo de pesquisa, é importante que o investigador planeje com quantas e com quais tipos de variáveis ele vai trabalhar, assim como irá analisar os dados coletados. Desta forma, dependendo do tipo de estudo, o pesquisa-dor poderá selecionar uma, duas ou mais variáveis independentes (preditoras), as quais serão correlacionadas com a variável dependente (desfecho), que, habitualmente, é única. Aqui cabe, portanto, uma pergunta: é permitido ao pes-quisador trabalhar com mais de uma variável-resposta, em um mesmo estudo? A resposta é sim; porém, esse procedimento aumenta, consideravelmente, a complexidade da análise estatística dos dados, porque, na prática, o pesqui-sador estará realizando vários estudos, simultaneamente. Ou seja, estará realizando tantos estudos quantas forem as variáveis-resposta. Quando isso acontece, a melhor maneira de conduzir o projeto é desmembrá-lo em vários estudos mais simples e fazer cada um deles separadamente.

Variáveis preditoras

Estudo 1

Estudo 2

Variável-resposta

Idade

Estatura

Massa corporal

Pressão arterial

Tabagismo

Hipercolesterolemia

Pressão arterial

Infarto agudo do miocárdio

Fig. 6.1 – Dois diferentes estudos que mostram a pressão arterial como variável- resposta e

variável preditora

BIOESTATISTICA_Vol_01.indb 195 25/06/12 17:12

Page 196: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

BIOESTATISTICA_Vol_01.indb 196 25/06/12 17:12

Page 197: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

7Distribuição de Frequências

7.1 ORGANIZAÇÃO DE DADOS ESTATÍSTICOS

Quando ao final de uma pesquisa todos os dados tiverem sido coletados, é provável que o pesquisador se depare com um grande número de planilhas numéricas ou de itens que, geralmente, tornam-se verdadeiros problemas a fim de que ele possa obter informações claras sobre o fenômeno estudado. Na maioria das vezes, esse conjunto de dados é extenso e desorganizado, não sendo conveniente analisá-los sob a forma em que se encontram, uma vez que requerem técnicas especiais de organização e análise, para que não se perca a visão global desse fenômeno. Assim, com esse objetivo, a estatística tem proporcionado uma valorosa contribuição no manejo de grandes quantida-des de informações, disponibilizando procedimentos e técnicas que auxiliam na organização e no resumo de grandes quantidades de dados, o que permite que valores possam ser apresentados sob sua forma representativa mais sim-ples e compacta, facilitando a interpretação e as inferências sobre eles.

Portanto, o primeiro passo em uma análise de dados é a organização e o resumo dos mesmos, para que eles possam ser rearranjados sob uma forma mais compreensível, o que, tradicionalmente, envolve o uso de uma série esta-

tística, da distribuição de frequência e de sua representação gráfica.

BIOESTATISTICA_Vol_01.indb 197 25/06/12 17:12

Page 198: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental198

7.1.1 Série estatísticaA organização de uma série estatística é, usualmente, a primeira tarefa em

qualquer tipo de análise de dados estatísticos, sendo esta definida como uma coleção de dados quantitativos, sucessivamente dispostos de acordo com uma organização característica da variável em estudo, considerando-se, também, a disposição temporal ou espacial dos dados. Desta forma, para que se possa dife-renciar uma série estatística da outra, é necessário que se considere o fenômeno descrito, o local onde o fenômeno aconteceu e a época a que se refere o fenô-meno estudado. Portanto, com base nestas características, as séries estatísticas podem ser subdivididas em quatro tipos, conforme mostrado no Quadro 7.1.

Quadro 7.1 – Tipos de série estatística conforme a característica estudada

Tipo de sérieElementovariável

Elementosfixos

Definição

Cronológica (histórica) Época LocalFenômeno

• Formada por dados coletados ao longo do tempo (dia, mês, ano, hora, minuto etc.).

Geográfica (espacial) Local ÉpocaFenômeno

• Constituída por dados provenientes de diferentes regiões geográficas (continente,

país, cidade, localidade etc.).

Específica (categórica) Fenômeno ÉpocaLocal

• Compreende um conjunto de dados coletados a partir de diferentes categorias de uma mesma variável (cores, produtos,

forma etc.).

Distribuição de frequência LocalÉpoca

Fenômeno

Magnitude dos dados

• Constituída por dados referentes ao fenômeno estudado, variando a gradação

entre eles.

Para representar uma série estatística, a Tabela 7.1 mostra os valores do consumo de suco de frutas, coletados a partir de uma amostra de 60 alunos de uma escola pública, em uma determinada cidade.

Dados brutos

São aqueles dispostos sob a forma tal qual foram coletados, sem qualquer tratamento quanto à ordenação dos mesmos.

BIOESTATISTICA_Vol_01.indb 198 25/06/12 17:12

Page 199: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Distribuição De frequências 199

Exemplo:

Tabela 7.1 – Valores do consumo diário de suco de frutas, por 60 estudantes

de uma escola pública (mL/dia)

192 196 173 193 195 204 235 190 194 184

194 218 204 210 214 198 196 215 202 201

203 197 195 229 207 203 208 198 194 193

195 198 189 204 202 215 199 217 195 209

181 205 183 195 183 190 182 219 170 197

207 211 206 166 194 186 227 185 201 186

Quando observamos os valores dispostos desordenadamente, notamos que a reunião de todas as informações não parece ser uma tarefa muito fácil, o que torna claro que algum tratamento deve ser instituído para que os dados se apre-sentem de maneira mais compreensiva. Assim, na maneira como se encontram, somente poucas informações podem ser obtidas a partir dos dados coletados, e, mesmo informações mais simples, tal como os valores dos consumos máximo e mínimo, requer um exame mais cuidadoso e demorado da tabela.

Mas o que pode ser feito para tornar as informações, contidas nos dados, mais compreensíveis? A primeira tarefa é ordená-los de forma crescente ou decrescente para transformá-los em uma série estatística conhecida como rol (dados ordenados). A ordenação manual parece ser bem simples quando se trata de uma amostra pequena, com poucos dados. Porém, ordenar, manualmente, um grande conjunto de dados pode representar uma tarefa surpreendentemente difícil, podendo ser simplificada com a utilização de programas de computador. A Tabela 7.2 mostra os dados da Tabela 7.1, ordenados de maneira crescente.

Essa ordenação propicia algumas vantagens, em termos de inferências, em relação à sua forma bruta, original, tal como:

• Alguns estudantes apresentam consumos iguais;• Os valores do consumo de suco de frutas variam de estudante para

estudante;• É possível observar de forma mais ampla a variação dos dados;

BIOESTATISTICA_Vol_01.indb 199 25/06/12 17:12

Page 200: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental200

• Os valores dos consumos mínimo e máximo são facilmente percebidos;• É possível observar uma tendência para a concentração dos valores na

faixa de 193 mL a 199 mL.

ROL

Tabela 7.2 – Valores do consumo diário de suco de frutas, por 60 estudantes

de uma escola pública (mL/dia)

166 170 173 181 182 183 183 184 185 186

186 189 190 190 192 193 193 194 194 194

194 195 195 195 195 195 196 196 197 197

198 198 198 199 201 201 202 202 203 203

204 204 204 205 206 207 207 208 209 210

211 214 215 215 217 218 219 227 229 235

Portanto, é interessante notar que, embora o rol possa fornecer mais infor-

mações e com menor esforço de busca, em relação aos dados brutos, ainda assim persiste a questão da análise de 60 observações, fato este agravado quando a quantidade de dados for extremamente grande. Por outro lado, se os dados for-mam um conjunto relativamente constituído por poucos valores, muitos dos quais são repetidos, pode-se, simplesmente, contar quantas vezes cada valor ocorre e, então, apresentar o resultado sob a forma de uma tabela de frequência.

Esta organização em tabelas de frequência, onde são indicados os valo-res obtidos na coleta dos dados e a frequência com que ocorrem, propicia que estas e outras informações possam ser obtidas mais rapidamente e com menor probabilidade de erro, conforme estudaremos no item seguinte, referente à distribuição de frequência.

7.2 DISTRIBUIÇÃO DE FREQUÊNCIA

Quando trabalhamos com um grande número de dados, e até quando eles não são tão numerosos assim, podemos encontrar dificuldades em obter uma

BIOESTATISTICA_Vol_01.indb 200 25/06/12 17:12

Page 201: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Distribuição De frequências 201

apresentação clara desses dados, de tal forma que eles possam nos transmitir todas as informações que eles contêm. Assim, como referido anteriormente no item 7.1, a organização dos dados requer, inicialmente, que eles sejam rearranjados e dispostos, em sua forma bruta, em algum formulário especial. Posteriormente, esses dados devem ser organizados em intervalos bem defi-nidos chamados de categorias ou classes, as quais são dispostas em tabelas conforme a frequência de cada classe, formando uma organização estatística conhecida como distribuição de frequência.

Distribuição de frequência

É representada por uma tabela que mostra os intervalos de classe refe-rentes à organização dos valores dos dados coletados, com as suas respectivas frequências (f) com que esses valores ocorrem em cada uma das classes.

Quando os dados são agrupados de acordo com um tamanho numérico, ou seja, quando são provenientes de uma variável quantitativa, a tabela é cha-mada de distribuição quantitativa ou numérica. Porém, quando eles são agrupados em categorias não-numéricas, ou seja, provenientes de uma variável qualitativa, a tabela é dita distribuição qualitativa ou categórica. As tabelas 7.3 e 7.4 mostram exemplos de distribuição quantitativa e qualitativa. Ambas mostram a apuração das notas e respectivas frequências, obtidas por 40 alunos de uma turma do curso de bioestatística. Na Tabela 7.3, as classes estão organi-zadas por nota e, na Tabela 7.4, pelos respectivos conceitos.

Tabela 7.3 – Exemplo de

distribuição quantitativa

Tabela 7.4 – Exemplo de

distribuição qualitativa

Classe Frequência Classe Frequência

0,0 - 0,9 2 Sem conceito 2

1,0 - 3,9 8 Insuficiente 8

4,0 - 6,9 16 Regular 16

7,0 - 8,9 10 Bom 10

9,0 - 10,0 4 Excelente 4

Total 40 Total 40

BIOESTATISTICA_Vol_01.indb 201 25/06/12 17:12

Page 202: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental202

De qualquer maneira, quando a variável estudada for contínua, é conve-niente agrupar os valores coletados em classes. Do mesmo modo, se a variável em estudo for discreta, e o número de valores coletados for muito grande, é recomendado o agrupamento dos dados em categorias (classes), o que reduz o tamanho da tabela e evita o aparecimento de valores com frequência nula, melhorando consideravelmente a compreensão do fenômeno em estudo. Assim, para que se possa entender a organização de uma distribuição de fre-quência, é necessário o conhecimento prévio de algumas definições, as quais são listadas a seguir:

Amplitude total (At)

Em um conjunto de dados, corresponde à diferença entre o maior e o menor valor observado para a variável em estudo.

Exemplo: O conjunto de dados representa o consumo diário de suco de frutas, de uma amostra de 60 estudantes matriculados em uma escola pública.

166 170 173 181 182 183 183 184 185 186

186 189 190 190 192 193 193 194 194 194

194 195 195 195 195 195 196 196 197 197

198 198 198 199 201 201 202 202 203 203

204 204 204 205 206 207 207 208 209 210

211 214 215 215 217 218 219 227 229 235

At = 235 - 166 = 69 Classe

Corresponde, em uma série ou num conjunto de dados, a um grupo ou divi-são que apresenta características semelhantes, da mesma categoria. Ou seja, é um dos grupos em que se divide a amplitude total do conjunto de valores observados para a variável em estudo. O número de classes em uma distribui-ção de frequência é representado pela letra K. A Tabela 7.5 mostra exemplos de classe.

BIOESTATISTICA_Vol_01.indb 202 25/06/12 17:12

Page 203: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Distribuição De frequências 203

• Primeira classe: 166 |—| 174• Oitava classe: 229 |—| 235

Tabela 7.5 – Valores do consumo diário de suco de frutas (mL/dia),

de 60 estudantes de uma escola pública

Classes Frequência

166 |—| 174 3

175 |—| 183 4

184 |—| 192 8

193 |—| 201 21

202 |—| 210 14

211 |—| 219 7

220 |—| 228 1

229 |—| 235 2

Σf = 60

Número de mL

Número de alunos

Frequências de classeClasses de

frequência

Limites de classe

Soma das frequências é igual ao número de

indivíduos da amostra.

Limites de classe

Correspondem aos valores extremos de uma determinada classe. A pri-meira classe do exemplo mostrado na Tabela 7.5 tem como limites os valores 166 e 174. O valor 166 é denominado limite inferior, enquanto o valor 174 é denominado limite superior. Em uma distribuição de frequência para dados contínuos, é desejável que os limites de classe sejam números que separem as classes sem haver lacunas entre elas.

Intervalo de classe

Corresponde ao conjunto de observações contidas entre os dois valores limites de uma classe. Em uma distribuição de frequência, os intervalos de classe devem ser mutuamente exclusivos, ou seja, um indivíduo não pode ser alocado em dois intervalos ao mesmo tempo e, tampouco podem existir indiví-duos sem alocação. O Quadro 7.2 mostra a notação para os intervalos de classe.

BIOESTATISTICA_Vol_01.indb 203 25/06/12 17:12

Page 204: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental204

Quadro 7.2 – Notação para os intervalos de classe

Notação Significado Características

166 – 174Intervalo aberto nos limites inferior e superior.

Não contém os valores 166 e 174.

166 |— 174Intervalo fechado no limite inferior e aberto no limite superior.

Contém o valor 166, mas não contém o valor 174.

166 —| 174Intervalo aberto no limite inferior e fechado no limite superior.

Não contém o valor 166, mas contém o valor 174.

166 |—| 174-Intervalo fechado nos limites inferior e superior.

Contém os valores 166 e 174.

Amplitude do intervalo de classe (h)

Corresponde ao comprimento da classe, sendo definida como a diferença entre os limites superior e inferior. Pode ser calculada, com aproximação, pela fórmula: h = At / K.

Frequência simples absoluta (f)

Para uma classe ou um valor individual, a frequência simples corresponde ao número de observações encontradas para essa classe ou esse valor. Por exemplo: a frequência da quarta classe (193 – 201) da Tabela 7.5 é igual a 21. Note que a soma das frequências é igual ao número de valores observados (n).

f ni

i

k

==∑1

7.2.1 Construindo uma distribuição de frequênciaUma distribuição de frequência caracteriza-se por apresentar os dados

em uma forma relativamente compacta, fornecendo uma boa visão geral do fenômeno estudado, além de conter informações adequadas para muitos pro-pósitos, mesmo que alguma dessas informações possa ser perdida. Por exemplo, alguma informação que pode ser determinada a partir da análise dos dados brutos, pode não ser obtida da distribuição, tal como ocorre na Tabela 7.3, onde a menor e a maior nota da turma não podem ser observadas, assim como não se pode saber quantos alunos obtiveram a nota 7,0. De qualquer forma, é inte-

BIOESTATISTICA_Vol_01.indb 204 25/06/12 17:12

Page 205: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Distribuição De frequências 205

ressante notar que a distribuição de frequência mostra as informações de uma maneira mais fácil de manusear, e qualquer possível perda de informação é um preço justo a pagar.

Assim sendo, a construção de uma tabela de distribuição de frequência numé-rica, ou seja, para dados contínuos, consiste, essencialmente, de quatro passos:

a. Determinação do número de classes (K) – É extremamente impor-tante que a tabela da distribuição seja apresentada com um número adequado de classes, sendo o ideal de cinco a 15, porque, de outra maneira, pode ser difícil detectar algum padrão de tendência para os dados apresentados, pois se esse número for reduzido, os dados ficarão muito condensados, de tal modo que pouca informação poderá ser extraída da tabela. Por outro lado, se forem utilizadas muitas classes, poderá ocorrer que algumas delas apresentem frequ-ências nulas ou muito pequenas, resultando em uma distribuição irregular, que pode comprometer a interpretação do fenômeno estudado.

Para a determinação do número de classe, existem vários métodos, porém os mais tradicionalmente utilizados são:

Método tradicional:

K n K= =, onde: Número de classes.

Número de observações.n =

Fórmula de Sturges:

K n= +1 3 310

, .log

b. Determinação do intervalo de classe (Ic) – A determinação do intervalo de classe é calculada dividindo-se a amplitude (At) dos dados pelo número de clas-ses. Se necessário, arredonde o valor encontrado para o próximo número inteiro. Em uma distribuição de frequência, é conveniente que cada classe tenha o mesmo tamanho de intervalo, porém se pode utilizar o menor valor encontrado nos dados como o limite inferior da primeira classe, assim como o maior valor para o limite superior da última classe. Algumas vezes é mais conveniente escolher um valor um pouco menor que o valor mínimo da distribuição. O bom senso é a melhor solução.

c. Determinação dos limites de classe – Cada classe tem um limite inferior e um superior, os quais deverão ser determinados. Como dito anterior-mente, o limite inferior da primeira classe pode ser determinado pelo menor

BIOESTATISTICA_Vol_01.indb 205 25/06/12 17:12

Page 206: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental206

valor encontrado nos dados. Para determinar os demais limites inferiores, adi-cione a amplitude do intervalo de classe ao limite inferior da classe precedente. Então encontre o limite superior da primeira classe e, de igual maneira, deter-mine os limites superiores das demais classes.

Lembre-se: as classes não devem se sobrepor. Portanto, tenha certeza de que cada valor encontra-se dentro de uma única classe, assim como o menor e o maior valores estão dentro da distribuição, e que nenhum dos valores situa-se dentro de uma “fenda” entre duas classes consecutivas.

d. Contagem da frequência (f) – Inicialmente, identifica-se a classe de cada um dos valores da série e, a seguir, contam-se quantos valores pertencem a cada classe, ou seja, determina-se a frequência de cada classe. Uma maneira prática é fazer marcas na linha da classe apropriada e, então, contá-las, como será mostrado tomando-se como base o exemplo anterior.

• Número de classes: K n K= = = ∴ =60 7 74 8, (método tradicional)

K K= + = + = ∴1 3 3 60 1 3 3 1 778 6 867

10, .log ( ) , ( , ) , = 7 (fórmula de

Sturges)

• O menor valor é igual a 166, e o maior é igual a 235, então a amplitude é igual a 69. Dividindo-se a amplitude pelo número de classes (8), e arre-dondando-se o valor, encontramos um intervalo de classe igual a 9.

IcAmplitude

Número de classesIc= = ≈ ∴ =69

88 62 9,

• O menor valor encontrado, no caso, 166, corresponde ao limite inferior da primeira classe. Para encontrar o limite inferior das 7 classes subse-quentes, adiciona-se o intervalo de classe calculado, ou seja, o valor 9, ao limite inferior da classe anterior. O limite superior da primeira classe é 174, que corresponde a 1 menos o limite inferior da segunda classe. Os limites superiores das demais classes são 174 + 9 = 183, 183 + 9 = 192, e assim, sucessivamente. Os limites inferior e superior para todas as oito classes estão mostrados na coluna da esquerda da Tabela 7.6.

BIOESTATISTICA_Vol_01.indb 206 25/06/12 17:12

Page 207: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Distribuição De frequências 207

• As contagens dos valores de cada classe estão marcadas na coluna central da Tabela 7.6.

• O número de marcas para uma classe corresponde à frequência daquela classe.

Tabela 7.6 – Valores do consumo diário de suco de frutas (mL/dia),

Classe Contagem Frequência

166 |—| 174 ||| 3

175 |—| 183 |||| 4

184 |—| 192 |||| ||| 8

193 |—| 201 |||| |||| |||| |||| | 21

202 |—| 210 |||| |||| |||| 14

211 |—| 219 |||| || 7

220 |—| 228 | 1

229 |—| 235 || 2

Σf = 60

Número de mL

Número de alunos

Frequências de classe

Classes defrequência

Limites de classe Soma das frequências

é igual ao número de indivíduos da amostra.

Note que:• A primeira classe tem três marcas; então a frequência para essa classe é 3.

A soma das frequências é igual a 60, que corresponde ao número de valo-res coletados na amostra. A soma é representada por Σf, onde Σ é a letra grega, maiúscula, sigma.

• A escolha do número de classes segue uma regra puramente arbitrária, e com base no bom senso, podemos, na maioria das vezes, organizá-lo de

BIOESTATISTICA_Vol_01.indb 207 25/06/12 17:12

Page 208: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental208

modo que a distribuição pareça mais lógica. Por exemplo: os intervalos de classe podem ser determinados como múltiplos de números mais fáceis de serem trabalhados, tais como 10 e 100. Esse procedimento facilita a construção e a interpretação da distribuição. A Tabela 7.7 mostra os mes-mos dados da Tabela 7.5, dispostos em intervalos de classe calculados em múltiplo de 10. Note que os limites superiores apresentam interva-los abertos, portanto eles não são computados no cálculo dos intervalos de classe.

Tabela 7.7 – Valores do consumo diário de suco de frutas (ml/dia),

de 60 estudantes de uma escola pública

Classe Contagem Frequência

160 |— 170 | 1

170 |— 180 || 2

180 |— 190 |||| |||| 9

190 |— 200 |||| |||| |||| |||| || 22

200 |— 210 |||| |||| |||| 15

210 |— 220 |||| ||| 8

220 |— 230 || 2

230 |— 240 | 1

Σf = 60

• Um outro fator que deve ser considerado nos limites de classe é o uso de casas decimais, de tal modo que não ocorram “fendas” entre duas clas-ses consecutivas, para que todos os valores possam ser distribuídos. Para tanto, é necessário verificar se os valores estão expressos como números inteiros ou com casas decimais. O exemplo abaixo ilustra três diferentes intervalos de classe para a medida de volume, em litros.

BIOESTATISTICA_Vol_01.indb 208 25/06/12 17:12

Page 209: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Distribuição De frequências 209

Volume(litros)

Volume(litros)

Volume(litros)

1 – 10 1,0 – 10,9 1,00 – 10,99

11 – 20 11,0 – 20,9 11,00 – 20,99

21 – 30 21,0 – 30,9 21,00 – 30,99

31 – 40 31,0 – 40,9 31,00 – 40,99

41 – 50 41,0 – 50,9 41,00 – 50,99

etc. etc. etc.

• Variedades de classe como “menor que”, “menor”, “maior” e “maior

que” são referidas como classes abertas, podendo ser usadas para reduzir o número de classes em uma distribuição de frequência. Elas são necessárias quando alguns dos valores encontrados são muito menores ou muito maiores que os demais. Porém, essas classes não permitem o cálculo de certos valores de interesse, tais como médias ou amplitudes de classe.

• Para tabelas de frequência qualitativas, que agrupam dados categóricos, como mostrado na Tabela 7.4, os passos são basicamente os mesmos. Neste tipo de distribuição, o número de classes é determinado pelo número de categorias estudadas para a variável em questão, não sendo necessário, portanto, calcular o número de classes, os intervalos de classe e seus menores e maiores valores. Assim, uma vez decidido o número de classes (categoria), e que tipo de item cada categoria contém, devemos ter certeza de que todos os itens coletados estão distribuídos nas suas respectivas classes, sem que ocorram ambiguidades entre as diversas classes. Aqui, é conveniente incluir uma classe denominada como “outros” ou “miscelâ-

nea”, a fim de agrupar categorias não previstas para coleta de dados.

7.2.2 Elementos da distribuição de frequênciaDepois de construída uma distribuição de frequência padrão, tal como a

exemplificada na Tabela 7.7, existem várias outras informações, além da frequ-

ência simples absoluta, que podem ser incluídas na tabela, as quais auxiliarão na interpretação dos dados. Dentre essas informações, temos: o ponto médio

BIOESTATISTICA_Vol_01.indb 209 25/06/12 17:12

Page 210: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental210

da classe, a frequência simples relativa, a frequência acumulada absoluta

e frequência acumulada relativa.

Ponto médio (xi)

Ou valor médio da classe, corresponde ao ponto equidistante dos limites da classe. Para obter o ponto médio de uma classe, basta somar o limite inferior ao limite superior, e dividir o resultado por dois. Após encontrar o ponto médio da primeira classe, acrescente a amplitude do intervalo de classe para encon-trar o ponto médio das classes subsequentes. Por exemplo: o ponto médio da primeira classe da Tabela 7.7 é 165 e a amplitude do intervalo de classe é igual a 10, então os pontos médios das classes subsequentes são:

xl L

ii i= = + =+2

160 170

2165, onde: li = Limite inferior e

Li = Limite superior da classe.

Então: 165 + 10 = 175 175 + 10 = 185 185 + 10 = 195 195 + 10 = 205 ... e assim, sucessivamente, para todas as classes.

Frequência relativa simples (fr)

Refere-se à razão entre a frequência absoluta (f) e o tamanho da amostra (n). Corresponde ao valor que expressa a proporção (ou probabilidade) da ocor-rência dos dados de uma classe, de um valor individual ou de uma categoria, em uma tabela de distribuição de frequência. Note que a soma das frequências simples relativas é sempre igual a 1 (Σfr = 1).

frf

f

f

ni

i

i

i

k

i= =

=∑1

BIOESTATISTICA_Vol_01.indb 210 25/06/12 17:12

Page 211: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Distribuição De frequências 211

O resultado também pode ser mostrado em porcentagem (fr%).

Então:

frf

ni

i%= ×100

Frequência acumulada absoluta (F)

De uma classe ou de um valor individual, corresponde à soma da frequên-cia simples absoluta, dessa classe ou desse valor, com as frequências simples absolutas das classes ou dos valores anteriores. É importante saber que a fre-quência acumulada da última classe é igual ao tamanho da amostra (n).

Frequência acumulada relativa (Fr)

De uma classe ou de um valor individual, corresponde à frequência acumulada dividida por Σf ou n. Também pode ser calculada acumulando as frequências relativas simples de acordo com a definição de frequência acumulada. O resultado também pode ser mostrado em porcentagem (Fr%).

Utilizando o exemplo apresentado na Tabela 7.7, demonstraremos como calcular os elementos de uma distribuição de frequência.

CálCuloS

Classe f Ponto médio fr Fr (%) F Fr Fr (%)

160 |— 170 1160 170

2165

+ = 1

600 017= , 0 017 100 1 70, ,× = 1

1

600 017= , 1,70

170 |— 180 2170 180

2175

+ = 2

600 033= , 0 033 100 3 30, ,× = 1 + 2 = 3

3

600 050= , 1,70 + 3,30 = 5,00

180 |— 190 9180 190

2185

+ = 9

600 150= , 0 150 100 15 00, ,× = 3 + 9 = 12

12

600 200= , 4,90 + 15,00 = 19,90

Todos os valores calculados são mostrados na tabela de distribuição de frequência expandida. Analisando-a, podemos extrair várias informações importantes. Por exemplo, a maioria dos alunos apresentou um consumo de suco de frutas entre 180 mL a 220 mL.

BIOESTATISTICA_Vol_01.indb 211 25/06/12 17:12

Page 212: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental212

Tabela 7.8 – Valores do consumo diário de suco de frutas,

por 60 estudantes de uma escola pública

Consumo(ml/dia)

fPonto médio

fr fr (%) F Fr Fr (%)

160 |— 170 1 165 0,017 1,70 1 0,017 1,70

170 |— 180 2 175 0,033 3,30 3 0,050 5,00

180 |— 190 9 185 0,150 15,00 12 0,200 20,00

190 |— 200 22 195 0,367 36,70 34 0,567 56,70

200 |— 210 15 205 0,250 25,00 49 0,817 81,70

210 |— 220 8 215 0,133 13,30 57 0,950 95,00

220 |— 230 2 225 0,033 3,30 59 0,983 98,30

230 |— 240 1 235 0,017 1,70 60 1,00 100,00

Σf = 60 –f

n=∑ 1 – – – –

7.2.3 Tipos de tabela de distribuição de frequênciaEmbora uma tabela de distribuição de frequência seja, tradicionalmente,

mais adequada para representar variáveis quantitativas, do tipo contínua, ela também pode ser utilizada para organizar variáveis discretas e categóricas. Exceto pelo ponto médio, o qual só pode ser calculado em tabelas que agrupam os dados por intervalo de classe, todos os outros elementos da distribuição de frequência podem ser mostrados para todos os outros tipos de tabelas. A seguir, mostraremos as indicações e as particularidades para as tabelas de grupamento simples e tabelas de grupamento para variáveis categóricas, uma vez que as tabe-las para grupamento por intervalo de classe foram discutidas no item 7.2.1.

Tabela de grupamento por intervalo de classe

Discutida no item 7.2.1

Tabela de grupamento simples

Também chamada de distribuição de frequência simples, este tipo de tabela deve ser utilizado na apresentação de dados coletados a partir de uma variável quantitativa, contínua ou discreta, que apresente uma variação relativamente

BIOESTATISTICA_Vol_01.indb 212 25/06/12 17:12

Page 213: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Distribuição De frequências 213

pequena e com um número reduzido de categorias. Nela, cada valor da amostra deve ser incluído isoladamente, sem que haja agrupamento dos dados em interva-los de classe. A Tabela 7.9 mostra um exemplo de tabela de grupamento simples.

Tabela 7.9 – Distribuição de frequência da idade de 60 alunos matriculados

em uma escola pública

Idade (anos) f fr F Fr

10 4 0,067 4 0,067

11 9 0,150 13 0,217

12 18 0,300 31 0,517

13 16 0,267 47 0,784

14 8 0,133 55 0,917

15 5 0,083 60 1,000

Σ 60 1,00 – – Fonte: dados fictícios

Tabela de grupamento para variáveis categóricas

Utilizadas para variáveis qualitativas, do tipo categórica, essas tabelas são semelhantes às tabelas de frequência simples para variáveis quantitativas, exceto que, na primeira coluna (coluna indicadora), os valores são subs-tituídos por variáveis nominais, as quais devem ser descritas em ordem de frequência decrescente ou crescente, conforme a preferência para exposição dos dados. A Tabela 7.10 mostra um exemplo de tabela de grupamento para variáveis categóricas.

Tabela 7.10 – Distribuição de frequência das espécies de peixe coletadas em um lago

Espécie de peixe f %

Tucunaré 436 36,33

Bagre 354 29,50

Pintado 228 19,00

Mapará 124 10,33

Pirarucu 58 4.84

Total 1.200 100,00 Fonte: dados fictícios.

BIOESTATISTICA_Vol_01.indb 213 25/06/12 17:12

Page 214: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental214

7.2.4 Normas para apresentação tabular de dados Para que uma tabela seja considerada bem elaborada, é condição funda-

mental que a mesma seja auto-explicativa. Isto é, que tenha significado próprio, de modo que, quando vista isoladamente, o leitor não precise consultar o texto para entender seu significado e suas informações. Para tanto, é necessário que algumas regras práticas sejam seguidas, as quais são adotadas por órgãos oficiais de estatística. No Brasil, adotam-se as regras previstas pelo Conselho Nacional de Estatística (CNE), pela Associação Brasileira de Normas Técnicas (ABNT), pelas Normas de Apresentação Tabular do Instituto Brasileiro de Geografia e Estatística (IBGE) e pela Resolução do Conselho Nacional de Metrologia (CONMETRO). A seguir, mostraremos as principais orientações para a elaboração de uma tabela. Para melhores esclarecimentos, o leitor deve consultar as normas acima citadas.

A. Partes da tabela

Título

FonteNota

Topo

Cabeçalho

Corpo

Linha

Rodapé

Coluna Indicadora

Moldura Coluna de dados

Célula

Classe

A – B

C – D

E – F

Unidade

6

8

10

• Número – Deve ser inscrito no topo, sempre que o texto apresentar duas ou mais tabelas, de modo a identificá-la, permitido sua localização. Deve ser escrito em algarismo arábico, de maneira crescente, precedido da pala-vra Tabela, podendo ou não ser subordinado a capítulos ou secções, com base na Norma da Associação Brasileira de Normas Técnicas ABNT/NB69 – Numeração Progressiva das Secções de um Documento.Exemplos: Tabela 7 – Indica a sétima tabela de um documento.Tabela 7.10 – Indica a décima tabela do sétimo capítulo de um documento.

BIOESTATISTICA_Vol_01.indb 214 25/06/12 17:12

Page 215: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Distribuição De frequências 215

• Título – Deve ser inscrito no topo, após o número, de modo a indicar a natureza e as abrangências geográfica e temporal dos dados numéricos. (Responder o que?, quando? e onde?). A natureza e a abrangência geográ-fica dos dados numéricos devem ser escritas sem abreviações, por extenso e de forma clara e concisa.Exemplo:Tabela 7.10 - Distribuição de frequência das espécies de peixes de uma amostra de 1.200 animais coletados no lago da Hidroelétrica de Tucuruí – Brasil – 2008.

• Moldura – Deve ser inscrita no centro da tabela, de modo a estruturar os dados numéricos e termos necessários à sua compreensão. Deve ter, no mínimo, três traços horizontais paralelos: o primeiro para separar o topo, o segundo para separar o espaço do cabeçalho e o terceiro para separar o rodapé. Quando houver necessidade de destacar parte do cabeçalho ou dos dados numéricos, pode-se utilizar um ou mais traços verticais paralelos adicionais. Obs.: a moldura não deve conter traços verticais que delimitem a tabela à direita e à esquerda.

• Cabeçalho – Deve ser inscrito no espaço correspondente, de modo a com-plementar o título e indicar o conteúdo das colunas. Deve ser escrito por extenso, sem abreviações e de maneira clara e concisa. Pode conter, quando necessário, unidades de medida que indiquem expressões quantitativas e metrológicas dos dados numéricos.

• Coluna indicadora – Corresponde à primeira coluna à esquerda e contém os indicadores de linha que complementam o título e mostram o conteúdo das linhas. Os indicadores de linha devem ser escritos com palavras ou com notações, por extenso, sem abreviações e de forma clara e concisa.

• Dados numéricos – Inscritos nas células, eles informam a quantificação de um fato específico observado. Devem ser escritos em algarismos ará-bicos e obedecem ao item sobre grafia dos dados numéricos constante na Resolução CONMETRO – Quadro Geral de Unidades de Medida.

• Sinal convencional – Deve ser inscrito em uma célula quando houver necessidade de substituição de um dado numérico. Quando presente em uma tabela, estes sinais deverão ser apresentados em nota geral com os seus respectivos significados. São eles:

BIOESTATISTICA_Vol_01.indb 215 25/06/12 17:12

Page 216: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental216

a) – Dado numérico igual a zero não resultante de arredondamento;b) .. Não se aplica dado numérico;c) ... Dado numérico não disponível;d) x Dado numérico omitido a fim de evitar a individualização da

informação.• Chamada – Deve ser inscrita em qualquer uma das partes da tabela, sem-

pre que houver necessidade de se remeter o leitor a uma nota específica. É feita com algarismos arábicos em destaque, tal como entre parêntese, entre colchetes e exponencial. Quando uma tabela apresenta mais de uma chamada, estas devem ser dispostas de maneira sucessiva, em ordem cres-cente de numeração, de cima para baixo e da esquerda para a direita.

• Fonte – Tem a finalidade de identificar o responsável (pessoa física ou jurí-dica) ou responsáveis pelos dados numéricos e deve ser inscrita a partir da primeira linha do rodapé da tabela. A identificação, que é feita por extenso, deve ser precedida da palavra Fonte ou Fontes. Em tabelas cujos dados numéricos foram extraídos de um documento, recomenda-se que a fonte indique a referência bibliográfica do documento.

• Obs.: Em publicações, cujas tabelas apresentem dados numéricos resul-tantes de uma única fonte, já identificada na própria publicação, como o próprio autor do documento, por exemplo, é dispensável a apresentação da fonte em cada uma das tabelas.

• Nota geral – Deve ser inscrita no rodapé, logo após a fonte, sempre que houver necessidade de esclarecimento do conteúdo geral de uma tabela. É precedida da palavra Nota ou Notas e deve ser escrita de forma clara e concisa.

• Nota específica – Deve ser inscrita no rodapé, logo após a fonte (se esta existir), sempre que houver necessidade de esclarecimento de um conte-údo específico de uma tabela. Também deve ser escrita de forma clara e concisa, e sempre que existir mais de uma nota específica, estas devem ser dispostas obedecendo à ordem de numeração das chamadas, separando-se umas das outras por um ponto.

• Arredondamento de dado numérico – Em uma tabela, os dados numé-ricos devem ser arredondados sempre que houver necessidade de apresentá-los com um número menor de algarismos. Devem-se seguir as seguintes regras:

BIOESTATISTICA_Vol_01.indb 216 25/06/12 17:12

Page 217: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Distribuição De frequências 217

a) Quando o primeiro algarismo a ser eliminado for 0, 1, 2, 3 ou 4, deve ficar inalterado o último algarismo do número a ser arredondado.Exemplos: • 10,3216 = 10 (arredondamento para o número inteiro).• 10,3216 = 10,3 (arredondamento com uma casa decimal).• 10,3216 = 10,32 (arredondamento com duas casas decimais).

b) Quando o primeiro algarismo a ser eliminado for 5, 6, 7, 8 e 9, deve--se aumentar em uma unidade o último algarismo do número a ser arredondado.Exemplos:• 259,788 = 260 (arredondamento para o número inteiro).• 259,788 = 259,8 (arredondamento com uma casa decimal).• 259,788 = 259,79 (arredondamento com duas casas decimais).

c) Se, depois de feito o arredondamento dos dados numéricos, ocorre-rem divergências entre a soma das parcelas arredondadas e o total arredondado, deve-se incluir, na tabela, uma nota geral esclarecendo a divergência. Ou, deve-se fazer uma correção na parcela (ou parcelas) em que for menor o valor absoluto da razão entre a diferença de arredon-damento (dado numérico original menos dado numérico corrigido) e o dado numérico original.

Cálculo da razãoDado numérico original Dado= − nnumérico corrigido

Dado numérico original

B. Outras orientações

• Recomenda-se que uma tabela seja elaborada para que possa ser apresen-tada em uma única página. Quando a tabela ultrapassar, em número de linhas e/ou de colunas, as dimensões de uma página, esta deve ser apre-sentada em duas ou mais partes.

• Recomenda-se que nenhuma célula seja deixada em branco, e que o número de células com dado numérico seja superior ao número de células com sinal convencional.

• Recomenda-se que as tabelas de uma publicação sejam graficamente uni-formes no que tange ao formato do corpo, tipo de letras e números, no uso

BIOESTATISTICA_Vol_01.indb 217 25/06/12 17:12

Page 218: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental218

de maiúsculas e minúsculas, e nos sinais gráficos utilizados, assim como não deve estar disposta de maneira que a sua leitura exija a mudança de posição do papel.

7.3 REPRESENTAÇÃO GRÁFICA

Em estatística, a representação gráfica constitui uma importante ferra-menta de apresentação dos dados, pois causa melhor impressão visual e, em conjunto com as tabelas, facilita sua análise e interpretação. Embora pos-sam apresentar algumas desvantagens, tal como a demora na confecção e um pequeno número de elementos, na maioria das vezes, é mais fácil identificar o padrão de uma distribuição de frequência através da visualização gráfica de sua série numérica. Assim, existem vários modelos de gráficos que podem ser utilizados em uma publicação, sendo a escolha de um ou de outro tipo, uma prerrogativa do pesquisador, o qual deve tomar como base o tipo de dado a ser apresentado, se quantitativo ou qualitativo. O Quadro 7.3 mostra a classificação dos gráficos quanto à forma.

Quadro 7.3 – Tipos de gráfico quanto à forma

Tipos Características

• Diagrama

- São gráficos de forma geométrica, dispostos em duas dimensões.

Correspondem aos tipos mais utilizados na representação de séries

estatísticas.

• Cartograma- São as ilustrações relativas a cartas geográficas, utilizadas para

representar dados geográficos, históricos e demográficos.

• Estereograma- São os gráficos apresentados em três dimensões para a

representação de volumes.

Nas publicações, os gráficos devem ser chamados de figuras, com seus

títulos, que seguem o mesmo padrão de numeração das tabelas, colocados na parte inferior dos desenhos, ao contrário das tabelas, que têm o título na parte superior. A seguir, mostraremos os tipos de diagrama mais utilizados na repre-sentação gráfica para dados quantitativos e qualitativos.

BIOESTATISTICA_Vol_01.indb 218 25/06/12 17:12

Page 219: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Distribuição De frequências 219

7.3.1 Gráficos para dados quantitativosHistograma de frequências

É o gráfico de colunas mais utilizado para representar as variáveis con-tínuas. Consiste em um conjunto de retângulos justapostos, cujas bases, localizadas sobre o eixo horizontal, representam as amplitudes dos intervalos de classe, numa escala contínua, e as alturas representam, proporcionalmente, as frequências, absolutas ou relativas das classes. Ao final, o histograma de fre-quência mostrará uma figura geométrica com área total proporcional à soma de todas as frequências.

Pontos importantes:• Para melhor comparação entre duas distribuições, deve-se utilizar o histo-

grama de frequências relativas ou percentuais.• Ao empregar as frequências relativas, obtém-se um histograma com

área unitária.• Nas distribuições com classes de intervalos diferentes, é necessário que

se faça o ajuste das frequências, para que o gráfico apresente uma figura geométrica proporcional à frequência da ocorrência da variável. Para cal-cular a altura de cada retângulo, divide-se a sua frequência relativa pela amplitude do intervalo de sua classe (h). Se todas as classes apresentarem amplitudes iguais, não é necessário realizar a divisão.A Tabela 7.11 mostra a distribuição de frequência, do peso ao nascer, de

250 crianças, e a Figura 7.1 mostra o histograma de frequência da respectiva tabela (dados hipotéticos).

Tabela 7.11 – Peso ao nascer de 250 crianças nascidas vivas na maternidade A, em 2008

Peso (kg) Frequência

1,5 |— 2,0 8

2,0 |— 2,5 32

2,5 |— 3,0 62

3,0 |— 3,5 70

3,5 |— 4,0 44

4,0 |— 4,5 24

4,5 |— 5,0 10

Total 250

BIOESTATISTICA_Vol_01.indb 219 25/06/12 17:12

Page 220: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental220

 

Fig. 7.1 – Histograma de frequência do peso ao nascer de 250 crianças

nascidas vivas na maternidade A, em 2008

Como os retângulos são justapostos, os marcadores da escala horizontal de um histograma podem ser os intervalos de classe, os pontos médios das classes, os limites de classe e, até mesmo, valores arbitrários. Mas, por razões práti-cas, é geralmente preferível utilizar os intervalos de classe, mesmo que cada retângulo vá de um limite de classe até o próximo retângulo, assim, cada limite mostrará quais valores estão dentro de cada classe. Note que um histograma não pode ser desenhado para uma distribuição de frequência que apresente limites de classe com intervalos abertos, e que uma especial atenção deve ser dispensada quando os intervalos de classe não são todos iguais.

Polígono de frequência

Menos utilizado que o gráfico de colunas, o polígono de frequência é um gráfico de linha originado a partir de uma distribuição de frequência. Essa linha poligonal fechada, quase sempre traçada acompanhando um histograma, une as ordenadas marcadas pelos pontos médios das classes do respectivo histograma.

Para construir um polígono de frequência, utilizam-se as mesmas escalas horizontal e vertical que foram empregadas para o histograma, só que marcadas com o ponto médio das classes. Então, marcam-se os pontos que correspondem

BIOESTATISTICA_Vol_01.indb 220 25/06/12 17:12

Page 221: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Distribuição De frequências 221

ao ponto médio e à frequência de cada classe, os quais são conectados por uma linha traçada da esquerda para a direita. Uma vez que o gráfico deve mostrar um polígono fechado, a linha deve começar no eixo horizontal, a qual deve ser estendida, para a esquerda, em uma amplitude de classe, antes do ponto médio da primeira classe, e, estendida, de igual modo, para a direita, depois da última classe.

A Tabela 7.12 mostra a distribuição de frequência, do peso ao nascer, de 250 crianças, e a Figura 7.2 mostra o polígono de frequência da respectiva tabela (dados hipotéticos).

Tabela 7.12 – Peso ao nascer de 250 crianças nascidas vivas na maternidade A, em 2008

Peso (kg) Ponto médio Frequência

1,5 |— 2,0 1,75 8

2,0 |— 2,5 2,25 32

2,5 |— 3,0 2,75 62

3,0 |— 3,5 3,25 70

3,5 |— 4,0 3,75 44

4,0 |— 4,5 4,25 24

4,5 |— 5,0 4,75 10

Total 250

 

Fig. 7.2 – Polígono de frequência do peso ao nascer de 250 crianças nascidas vivas

na maternidade A, em 2008

BIOESTATISTICA_Vol_01.indb 221 25/06/12 17:12

Page 222: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental222

Polígono de frequência acumulada (ogiva)

Ou ogiva de Galton1, é um gráfico de linha que mostra a frequência acumulada de cada classe, em seu limite superior. Os limites superiores são marcados no eixo horizontal e as respectivas frequências acumuladas são marcadas no eixo vertical. Após marcar os pontos, traça-se a linha conec-tando-os da esquerda para a direita. O gráfico poderá iniciar no limite inferior da primeira classe, onde a frequência acumulada é zero, e terminar no limite superior da última classe, onde a frequência acumulada é igual ao tamanho da amostra.

A Tabela 7.13 mostra a distribuição de frequência, do peso ao nascer, de 250 crianças, e a Figura 7.3 mostra o polígono de frequência acumulada (ogiva) da respectiva tabela (dados hipotéticos).

Tabela 7.13 – Peso ao nascer de 250 crianças nascidas vivas

na maternidade A, em 2008

Peso (kg) FrequênciaFrequênciaacumulada

1,5 |— 2,0 8 8

2,0 |— 2,5 32 40

2,5 |— 3,0 62 102

3,0 |— 3,5 70 172

3,5 |— 4,0 44 216

4,0 |— 4,5 24 240

4,5 |— 5,0 10 250

Total 250

1. Sir Francis Galton (1822-1911) - Cientista e estatístico inglês, que publicou mais de 340 obras e criou o conceito de correlação e regressão em direção à média.

BIOESTATISTICA_Vol_01.indb 222 25/06/12 17:12

Page 223: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Distribuição De frequências 223

 

Fig. 7.3 – Polígono de frequência acumulada do peso ao nascer de 250 crianças nascidas

vivas na maternidade A, em 2008

Gráfico de caule e folha (steam-and-leaf)

Desenvolvido por John Tukey2 em 1977, o diagrama de caule e folha é um método atual de apresentação de dados quantitativos, especialmente quando esses dados contêm muitos valores ou diferentes categorias, o que os torna difí-ceis de serem agrupados em tabelas e representados graficamente. Este tipo de gráfico, que mostra os valores dispostos em forma de uma curva, facilitando a visualização da sua simetria e curtose, apresenta a vantagem de mostrar os dados em sua forma original, sem que nenhuma informação seja perdida, exceto pela ordem com que foram coletados, além de facilitar o seu ordenamento.

Para construir o gráfico, cada número da distribuição é separado em um caule, que corresponde a todos os seus dígitos, menos o dígito mais à direita, o qual corresponde à folha. Para efeito de ilustração, a relação abaixo mostra os valores da pressão arterial sistólica de 40 pacientes aleatoriamente seleciona-dos (dados hipotéticos).

147 126 129 155 168 168 142 159 145 116

130 122 112 126 118 122 109 140 126 117

118 89 109 119 139 122 133 145 134 132

133 148 126 129 138 140 139 108 118 98

2. John Wilder Tukey (1915-2000) – Estatístico americano premiado, em 1982, com a medalha de honra do Institute of Electrical and Electronics Engineers (EUA) pela sua contribuição para a análise espectral dos processos randômicos.

BIOESTATISTICA_Vol_01.indb 223 25/06/12 17:12

Page 224: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental224

Como os dados estão distribuídos entre os valores 89 e 168, os caules serão formados por valores de 8 a 16. Para construir o gráfico, liste os caules em uma linha vertical, situada à esquerda, e para cada caule, liste as suas folhas, à direita. Por exemplo: o valor 168 tem um caule igual a 16 e a folha igual a 8. O gráfico resultante pode ser mostrado com os valores não ordenados, mas, é mais interes-sante ordená-los, o que é feito automaticamente pelos programas de estatística para computadores. A Figura 7.4 mostra o gráfico de caule e folhas dos valores da pressão arterial sistólica de 40 pacientes aleatoriamente selecionados.

Escores Caule Folhas

1 8 9

1 9 8

3 10 8 9 9

7 11 2 6 7 8 8 8 9

9 12 2 2 2 6 6 6 6 9 9

8 13 0 2 3 3 4 8 9 9

7 14 0 0 2 5 5 7 8

2 15 5 9

2 16 8 8

Fig. 7.4 – Gráfico de caule e folhas dos valores da pressão arterial sistólica de 40 pacientes

aleatoriamente selecionados

Existem outras variantes para a apresentação de um gráfico de caules e folhas. Por exemplo, para os números 341, 365, 378 e 385, uma outra repre-sentação no gráfico seria:

3 | 41 65 78 85

Gráfico de distribuição conjunta

Também chamado de diagrama de dispersão, o gráfico de distribuição conjunta é utilizado para representar e agrupar dados que envolvam duas vari-

BIOESTATISTICA_Vol_01.indb 224 25/06/12 17:12

Page 225: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Distribuição De frequências 225

áveis quantitativas, simultaneamente, de tal maneira que os dois conjuntos de dados formem pares ordenados, com cada um desse pares pertencente ao mesmo sujeito da pesquisa. Portanto, o objetivo do gráfico é mostrar se existe uma associação entre as duas variáveis estudadas, assim como identificar o tipo de correlação entre elas, se positiva ou negativa, de tal modo que se possa predizer o comportamento de uma em função da variação da outra. É o tipo de gráfico utilizado nos testes de correlação de Pearson e regressão linear.

O gráfico é construído marcando-se os valores de uma das variáveis, prefe-rencialmente a preditora, sobre o eixo horizontal (eixo x), e os valores da outra variável, a variável-resposta, sobre o eixo vertical (eixo y). Ao final, obtém-se um gráfico cartesiano com múltiplos pontos, cada um deles representando um par ordenado (x e y).

A Tabela 7.14 mostra os valores das pressões arteriais sistólica e diastólica de uma amostra de 15 indivíduos. A Figura 7.5 mostra o gráfico de distribui-

ção conjunta, relativo à respectiva tabela (dados hipotéticos).

Tabela 7.14 – Valores das pressões arteriais sistólica e diastólica

de uma amostra de 15 indivíduos

IndivíduoPressão arterial (mmHg)

Sistólica Diastólica

01 108 62

02 134 74

03 100 64

04 108 68

05 112 72

06 112 64

07 112 68

08 122 70

09 116 70

10 116 70

11 120 72

12 108 70

13 108 70

14 114 74

15 108 68

BIOESTATISTICA_Vol_01.indb 225 25/06/12 17:12

Page 226: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental226

 

Fig. 7.5 – Gráfico de distribuição conjunta dos valores das pressões arteriais

sistólica e diastólica de 15 indivíduos

7.3.2 Gráficos para dados qualitativosGráfico de colunas

É um gráfico utilizado para comparar grandezas de diferentes categorias de uma mesma variável. É formado por retângulos separados, verticalmente dispostos, cujas bases, de mesma largura, situam-se no eixo horizontal, e cujas alturas são proporcionais às grandezas que representam. Os dados podem ser apresentados em forma de números absolutos ou em proporções.

A Tabela 7.15 mostra a distribuição de frequências dos conceitos de 40 alunos da turma de bioestatística, e a Figura 7.6 mostra o gráfico de colunas da respectiva tabela (dados hipotéticos).

Tabela 7.15 – Exemplo de distribuição qualitativa

Conceitos Frequência

Sem conceito 2

Insuficiente 8

Regular 16

Bom 10

Excelente 4

Total 40

BIOESTATISTICA_Vol_01.indb 226 25/06/12 17:12

Page 227: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Distribuição De frequências 227

 

Fig. 7.6 – Gráfico de colunas dos conceitos de 40 alunos da turma de bioestatística

O gráfico de colunas pode ou não ser fechado com uma moldura deno-minada cercadura, além do que, o título e a fonte podem estar colocados em qualquer posição. Da mesma forma, existem variações do gráfico, as quais serão apresentadas a seguir.

Gráfico de colunas com barra de erros

As barras de erros são traços em forma de “T,” situados no topo dos retângulos do gráfico de colunas. Devem ser utilizadas quando a altura dos retângulos representa a média aritmética dos valores das categorias da variá-vel mostrada no estudo. A critério do autor, as barras de erro podem significar o desvio padrão ou o erro padrão da média da variável apresentada e têm o propósito de fornecer uma informação visual para que o leitor possa comparar os retângulos e verificar qual ou quais deles são estatisticamente diferentes. Sempre que possível, estas barras devem estar presentes nos gráficos de colu-nas, de barras ou de linhas, as quais têm os seus comprimentos calculados pelo software empregado para a confecção do gráfico.

A Tabela 7.16 mostra a média ± desvio padrão dos pesos de seis espécies de peixes da região amazônica, coletados a partir de uma amostra de 20 peixes para cada espécie. A Figura 7.7 mostra o gráfico de colunas com barras de

erros, da respectiva tabela (dados hipotéticos).

Núm

ero

s d

e a

luno

s

Conceitos

BIOESTATISTICA_Vol_01.indb 227 25/06/12 17:12

Page 228: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental228

Tabela 7.16 – Média ± desvio padrão dos pesos de cinco espécies de peixes da região amazônica

Espécie de peixe Peso ± DP (g)

Tucunaré 2.630 ± 316

Bagre 6.140 ± 436

Pintado 8.850 ± 528

Pescada 7.640 ± 620

Mapará 5.620 ± 432

Pirarucu 18.580 ± 858

Fig. 7.7 – Gráfico de colunas com barras de erro dos pesos de seis espécies de peixes

da região amazônica

Para testar, visualmente, se existe diferença estatística entre duas colunas, projeta-se, para baixo, a barra de erro da coluna mais alta e, então se verifica se as barra das duas colunas se “tocam.” Se isto ocorrer, representa que não há diferença estatisticamente significativa entre as colunas comparadas, tal como ocorre para o pintado e a pescada, cujas médias de peso não são estatisticamente diferentes. Caso as barras não se “toquem,” é necessária a aplicação de um teste estatístico para verificar se há ou não diferença estatística entre as colunas comparadas.

Diagrama de pareto

É uma variante do gráfico de colunas que ordena as frequências das ocorrên-cias, da maior para a menor, permitindo melhor visualização e interpretação dos dados apresentados. Mostra ainda a curva de percentagens acumuladas. Tem como

 

BIOESTATISTICA_Vol_01.indb 228 25/06/12 17:12

Page 229: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Distribuição De frequências 229

base o princípio de Pareto3, que diz: alguns elementos são vitais; muitos, apenas triviais. Há muitos problemas sem importância diante de outros mais graves. Este princípio também ficou conhecido como “Lei 20/80”.

A Tabela 7.17 mostra os gastos, em milhões de reais, de um hospital público, conforme a especialidade médica. A Figura 7.8 mostra o diagrama de Pareto

da respectiva tabela (dados hipotéticos).

Tabela 7.17 – Valores gastos, em milhões de reais, conforme a especialidade médica, no

hospital A - 2008

Especialidade médica

Gastos(R$)

Gastos(%)

Acumulada(%)

Cirurgia 58,32 32,40 32,40

Ortopedia 50.94 28,30 60,70

Ginecologia 28,98 16, 10 76,80

Pneumologia 21,42 11,90 88,70

Clínica médica 13,32 7,40 96,10

Pediatria 7,02 3,90 100,00

Total 180 -- --

Fig. 7.8 – Diagrama de Pareto dos gastos de um hospital público, conforme a especialidade médica

3. Vilfredo Pareto (1848-1923) – Político, sociólogo e economista italiano que, em 1897, publicou um estudo sobre a distribuição de renda, através do qual se percebeu que a distribuição de riqueza não se dava de maneira uniforme, havendo grande concentração de riqueza (80%) nas mãos de uma pequena parcela da população (20%).

 

Cirurgia Ortopedia Ginecol. Pneumol. Clínica Pediatria

BIOESTATISTICA_Vol_01.indb 229 25/06/12 17:12

Page 230: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental230

Gráfico de colunas justapostas

Também chamado de gráfico comparativo, o gráfico de colunas justapostas deve ser utilizado quando o objetivo é descrever, simultaneamente, duas ou mais categorias, para uma única variável, em diferentes amostras. Neste grá-fico, as colunas que representam as categorias, são colocadas lado a lado, de modo que se possa compará-las quanto à grandeza que elas representam.

A Tabela 7.18 mostra o resultado do teste de avaliação de conhecimento aplicado em duas escolas públicas do segundo grau. A Figura 7.9 mostra o grá-

fico de colunas justapostas da respectiva tabela (dados hipotéticos).

Tabela 7.18 – Resultado do teste de avaliação de conhecimento, aplicado em duas escolas

públicas do segundo grau

DisciplinaEscola

Estadual Municipal

Matemática 67 ± 9 64 ± 5

Física 62 ± 7 59 ± 6

Química 73 ± 5 78 ± 6

Biologia 87 ± 8 81 ± 5

Fig. 7.9 – Gráfico de colunas justapostas do resultado do teste de avaliação de conhecimento,

aplicado em duas escolas públicas do segundo grau

 

BIOESTATISTICA_Vol_01.indb 230 25/06/12 17:12

Page 231: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Distribuição De frequências 231

Gráfico de colunas superpostas

Também chamado de gráfico de colunas compostas, igualmente ao gráfico de colunas justapostas, serve para comparar, simultaneamente, duas ou mais categorias, para uma única variável, em diferentes amostras. Neste gráfico, as colunas que representam as categorias são colocadas uma sobre a outra, de modo que se possa compará-las quanto à grandeza que elas representam.

A Tabela 7.19 mostra a relação entre as diferentes partes do corpo e o peso corporal total, de seis espécies de peixe da região amazônica. A Figura 7.10 mos-tra o gráfico de colunas superpostas da respectiva tabela (dados hipotéticos).

Tabela 7.19 – Relação entre as diferentes partes do corpo e o peso corporal total, de seis

espécies de peixe da região amazônica

Espécie de peixe

Partes do corpo (%)

Cefálica CorpoNadadeira

caudalTucunaré 14,0 82,0 4,0

Bagre 29,0 66,0 5,0

Pintado 23,0 73,0 4,0

Pescada 17,0 77,0 6,0

Mapará 25,0 70,0 5,0

Pirarucu 18,0 78,0 4,0

Fig. 7.10 – Gráfico de colunas superpostas da relação entre as diferentes partes do corpo e o

peso corporal total, de seis espécies de peixe da região amazônica

 

BIOESTATISTICA_Vol_01.indb 231 25/06/12 17:12

Page 232: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental232

Gráfico de setores

Também chamado de gráfico de pizza ou torta, em razão da sua aparên-cia circular, este tipo de gráfico deve ser utilizado quando se deseja apresentar dados nominais ou ordinais, cujo principal objetivo é mostrar a relação entre as partes e o todo. A representação é feita tomando-se como base a figura de um círculo de raio qualquer, o qual tem o seu ângulo central proporcionalmente dividido em setores. Para construí-lo, devem ser calculadas as frequências rela-tivas, ou porcentagens, de cada categoria. Então, calcula-se o ângulo central de cada setor multiplicando-se 360o pela frequência relativa da categoria.

A Tabela 7.20 mostra os dados relativos ao número de cirurgias realizadas em um hospital público, conforme a especialidade cirúrgica. A Figura 7.11 mos-tra o gráfico de setores da respectiva tabela (dados hipotéticos).

Tabela 7.20 – Tipos de cirurgias realizadas no hospital A, em 2008

Tipo de cirurgia f fr%

Abdominal 1.008 42,0

Ortopédica 552 23,0

Ginecológica 432 18,0

Torácica 240 10,0

Pediátrica 96 4,0

Plástica 72 3,0

Total 2.400 --

Fig. 7.11 – Gráfico de setores dos tipos de cirurgias realizadas no hospital A, em 2008

 

BIOESTATISTICA_Vol_01.indb 232 25/06/12 17:12

Page 233: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Distribuição De frequências 233

Gráfico de linha (curva)

Este tipo de gráfico geralmente é utilizado para a apresentação de séries temporais, onde o conjunto de dados é composto por valores tomados em inter-valos regulares. O eixo horizontal representa o intervalo de tempo, ao passo que o eixo vertical marca a evolução dos valores para a variável em estudo. Após marcar todos os pontos, os pares ordenados são, então, unidos por seg-mentos de linha. É possível, em um mesmo gráfico, representar duas ou mais variáveis, simultaneamente.

A Tabela 7.21 mostra os valores relativos aos gastos com projetos de pes-quisa, em três universidades públicas. A Figura 7.12 mostra o gráfico de linha que representa a respectiva tabela (dados hipotéticos).

Tabela 7.21 – Valores relativos aos gastos com projetos de pesquisa, em três

universidades públicas

Ano Gastos por universidade (em milhões)

A B C

2000 1,2 4,8 7,9

2001 3,5 6,8 9,8

2002 4,7 8,7 15,1

2003 7,6 13,8 19,8

2004 11,4 17,7 25,8

2005 14,8 22,9 32,9

2006 18,5 29,9 58,8

2007 26,8 47,9 67,9

2008 42,1 58,8 74,2

BIOESTATISTICA_Vol_01.indb 233 25/06/12 17:12

Page 234: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental234

Fig. 7.12 – Gráfico de linha dos valores relativos aos gastos com projetos de pesquisa,

em três universidades públicas

 

BIOESTATISTICA_Vol_01.indb 234 25/06/12 17:12

Page 235: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

8Parâmetros da Distribuição de

Frequências

Como foi demonstrado no capítulo anterior, as observações para variáveis contínuas podem ser visualmente descritas pela representação de seus valores em um gráfico, onde colocamos, sobre o eixo horizontal (x), os valores men-surados para a variável, e sobre o eixo vertical (y), a frequência com que esses valores ocorrem na distribuição. Do mesmo modo, a mesma distribuição tam-bém pode ser descrita, mesmo que de maneira imperfeita, utilizando-se apenas valores numéricos, tal como seus valores máximo e mínimo, ou mesmo a fre-quência com que eles aparecem na amostra, como numa tabela, por exemplo. Deste modo, tanto o gráfico quanto a tabela são insuficientes para representar de maneira perfeita uma distribuição, especialmente quando o objetivo é com-parar duas ou mais populações ou amostras.

Como geralmente ocorre em uma pesquisa experimental, cujo objetivo é comparar duas ou mais amostras, as quais foram retiradas de diferentes popu-lações ou tomadas em diferentes condições de medição, o investigador deve sempre se utilizar de métodos confiáveis de comparação, de tal modo que suas inferências possam ser mensuradas de maneira fidedigna. Observe, então, a Figura 8.1, abaixo. Ela representa os gráficos da distribuição de frequência de três amostras de mesmo tamanho. Em que aspecto elas diferem entre si?

BIOESTATISTICA_Vol_01.indb 235 25/06/12 17:12

Page 236: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental236

 

0 2 4 6 8 100

2

4

6

8

10

Valores

Frequência

0 2 4 6 8 100

2

4

6

8

10

ValoresFrequência

0 2 4 6 8 100

2

4

6

8

10

Valores

Frequência

A B C

Fig. 8.1 – Gráficos da distribuição de frequência de três amostras de mesmo tamanho

Observando-se os gráficos, podemos confirmar que várias são as dife-renças entre eles, embora os três representem amostras do mesmo tamanho. Por exemplo: podemos constatar diferenças quanto às frequências (alturas) e quanto às aberturas (amplitudes) de suas curvas; e até quanto aos valores encontrados em cada uma das distribuições. Note que, pelo fato de duas dis-tribuições apresentarem amplitudes idênticas, não significa, necessariamente, que os valores extremos sejam iguais para ambas, pois eles podem ser bastante diferentes, assim como os valores situados entre eles podem variar em quanti-dade e na grandeza que eles representam.

Com base neste raciocínio, verificamos que várias são as características que podem ser utilizadas para comparar duas ou mais distribuições, sendo as mais importantes as medidas que representam o centro da distribuição, e aque-las que mostram o tamanho da abertura (amplitude) da curva, as quais deverão ser calculadas mediante a aplicação de métodos matemáticos. A Figura 8.2 mostra as características utilizadas para comparação entre duas distribuições.

As medidas que mostram o centro da distribuição são chamadas medi-

das de tendência central, ao passo que, aquelas que mostram a amplitude da curva são chamadas de medidas de dispersão ou de variabilidade, sendo o conjunto de todas elas conhecido como parâmetros da distribuição de fre-quência. Na prática, utilizam-se, sempre, uma medida de tendência central e uma de dispersão para gerar estimativas de uma amostra ou população, de tal modo que se possa compará-la a outra. O Quadro 8.1 mostra os diferentes parâmetros de uma distribuição de frequência.

BIOESTATISTICA_Vol_01.indb 236 25/06/12 17:12

Page 237: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Parâmetros da distribuição de frequências 237

 

0 2 4 6 8 100

2

4

6

8

10

Frequência

0 2 4 6 8 100

2

4

6

8

10Frequência

CentroAmplitude

Fig. 8.2 – Gráficos da distribuição de frequência mostrando o valor central e a amplitude da curva

Quadro 8.1 – Parâmetros da distribuição de frequênciaMedidas de tendência central Medidas de dispersão Medidas de posição

• Moda

• Mediana

• Média aritmética

• Média ponderada

• Média geométrica

• Amplitude de variação

• Desvio da média

• Variância

• Desvio padrão

• Coeficiente de variação

• Decil

• Quartil

• Percentil

• Amplitude interquartílica

8.1 MEDIDAS DE TENDÊNCIA CENTRAL

Quando se deseja representar os dados de uma distribuição de uma forma mais simples, por meio de um valor único, a melhor opção é a escolha de uma medida de tendência central. Essas medidas, que representam os parâmetros em torno dos quais ocorre a maior concentração dos valores observados no estudo, têm por objetivo mostrar o ponto central de equilíbrio de uma distribuição de dados. A seguir, mostraremos as mais utilizadas em estatística descritiva.

8.1.1 Moda (Mo)O termo moda foi utilizado pela primeira vez por Karl Pearson, em 1895,

e corresponde ao valor que ocorre com maior frequência em um conjunto de dados, ou seja, é o valor em torno do qual se verifica a maior concentração das observações. Quando um conjunto de dados apresenta apenas uma moda, ele é dito unimodal, porém quando tem mais de uma moda, dizemos que ele é pluri-

BIOESTATISTICA_Vol_01.indb 237 25/06/12 17:12

Page 238: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental238

modal, sendo chamado de bimodal, trimodal ou multimodal, segundo tenha duas, três ou mais modas. Por outro lado, quando a variável apresentar todos os seus valores com a mesma frequência, a distribuição será amodal, sendo, portanto, inútil para efeito de comparação, o que a torna menos utilizada que a média e a mediana. De outro modo, a moda é uma medida de tendência central especialmente útil para descrever dados nominais e ordinais e tem a vantagem de não ser afetada por valores extremamente altos ou extremamente baixos.

Exemplos: X1 = {2, 4, 6, 8, 10, 12, 14, 16} Distribuição amodal.X2 = {2, 4, 4, 4, 6, 8, 10, 12, 14, 16} Distribuição unimodal: Mo = 4X3 = {2, 4, 4, 4, 6, 8, 10, 10, 10, 12, 14} Distribuição bimodal: Mo1 = 4 e Mo2 = 10A seguir, mostraremos como se determina a moda nos diferentes conjuntos

de dados.

Moda Para Dados Agrupados em Tabelas de Frequência

Por não ser facilmente identificada quando os dados se apresentam agru-pados em tabelas de frequência, para a obtenção da moda é necessário que se utilize vários outros processos. Para tal, primeiro identifica-se a classe que contém a maior frequência (classe modal).

•Moda Bruta (MoB) – Consiste no ponto médio da classe de maior frequên-cia. A Tabela 8.1 é tomada como exemplo para o cálculo da moda.

Tabela 8.1 – Peso ao nascer de 250 crianças nascidas vivas na maternidade A, em 2008

Peso (kg) Frequência

1,5 |— 2,0 8

2,0 |— 2,5 32

2,5 |— 3,0 62

3,0 |— 3,5 70

3,5 |— 4,0 44

4,0 |— 4,5 24

4,5 |— 5,0 10

Total 250

Classe modal = 3,0 |— 3,5Ponto médio = (3,0 + 3,5) / 2 = 3,25MoB = 3,25 kg

BIOESTATISTICA_Vol_01.indb 238 25/06/12 17:12

Page 239: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Parâmetros da distribuição de frequências 239

•Moda de Czuber (MoC) – É o método mais preciso e consiste no valor do ponto que divide a classe modal em duas partes proporcionais às dife-renças entre a frequência da classe modal e a frequência das respectivas classes adjacentes.

ΔMo l h

a

a pC i= +

+

Δ Δ

onde: li = Limite inferior da classe modal. h = Amplitude da classe modal. Δa = Diferença entre a fi da classe modal e a fi da classe anterior (que

precede à classe modal). Δp = Diferença entre a fi da classe modal e a fi da classe posterior

(que vem logo após a classe modal).

Exemplo: Determinar, pelo método de Czuber, o valor da moda para a distribuição de frequência da Tabela 8.1.

Passo 1 – Identificar a classe modal e determinar Da e Dp.

2,5 |— 3,0 62 c Classe Anterior: Δa = 70 - 62 = 8

3,0 |— 3,5 70 c Classe Modal

3,5 |— 4,0 44 c Classe Posterior: Δp = 70 - 44 = 26

Passo 2 – Substituir os valores na fórmula de Czuber.

Mo l ha

a pC i= +

+

= +

+

∴3 0 5

8

8 26, =3,11 =3,11 kgMo

C

DD D

•Modade King (Mok) - O cálculo da moda leva em conta a influência das classes adjacentes à classe modal, de modo que o valor é deslocado em direção a elas. A fórmula para cálculo da moda de King é:

Mo l hfpost

fpost fantK i= +

+

. , onde:

BIOESTATISTICA_Vol_01.indb 239 25/06/12 17:12

Page 240: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental240

onde: li = Limite inferior da classe modal. h = Amplitude da classe modal. fant = fi da classe anterior à classe modal. fpost = fi da classe posterior à classe modal.

Exemplo: Determinar, pelo método de King, o valor da moda para a dis-tribuição de frequência da Tabela 8.1.

Passo 1 – Identificar a classe modal e determinar fant e fpost.

2,5 |— 3,0 62 c Classe anterior: fant = 62

3,0 |— 3,5 70 c Classe Modal

3,5 |— 4,0 44 c Classe posterior: fpost = 44

Passo 2 – Substituir os valores na fórmula de King.

Mo L hfpost

fpost fantK i= +

+

= +

+

. ,3 0 5

44

44 62 = ∴ =3 20 3 20, , kgMo

k

•Modade Pearson (MoP) – Karl Pearson observou que existe uma relação empírica que permite que a moda possa ser calculada quando são conhecidas a média (Me) e a mediana (Md) de uma distribuição de frequência moderada-mente assimétrica, unimodal, com grande número de observações e de pequena amplitude. Assim, temos a seguinte fórmula:

Mo Md MeP= −3 2. .

8.1.2 Mediana (Md)A mediana de um conjunto de dados corresponde ao valor que, no

conjunto, separa-o em dois subconjuntos de mesmo número de elementos, quando estes estão ordenados segundo uma ordem de grandeza. É, portanto, o valor que ocupa a posição central quando todos os valores observados estão dispostos em ordem crescente ou decrescente de magnitude. A seguir, mostraremos as diferentes maneiras de calcular a mediana em um conjunto de dados.

BIOESTATISTICA_Vol_01.indb 240 25/06/12 17:12

Page 241: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Parâmetros da distribuição de frequências 241

Mediana para dados não agrupados

Para a determinação da mediana, o primeiro passo é ordenar os valores, de forma crescente ou decrescente.

• Para um conjunto de dados que tem um número ímpar de observações, a mediana é dada pela expressão:

Md x pn

p= = +

, onde:1

2

Exemplo: Dados brutos xi = {35, 38, 40, 24, 32, 40, 28, 24, 40}Dados ordenados xi = {24, 24, 28, 32, 35, 38, 40, 40, 40}Mediana Md = 35

• Para um conjunto de dados que tem um número par de observações, a mediana é dada pela expressão:

Mdx x

pnp p=

+=+1

2 2, onde:

Exemplo: Dados brutos xi = {22, 18, 40, 28, 32, 38, 25, 38}Dados ordenados xi = {18, 22, 25, 28, 32, 38, 38, 40}Mediana Md = (28 + 32) / 2 = 30

Mediana para dados agrupados em tabelas de frequência

Quando o conjunto de dados está distribuído em classes, em uma tabela de frequência, a mediana é dada pela expressão abaixo:

Md l hp F

fiac

i

= +−

−. 1

Onde: i = Classe mediana, onde estará presente o valor de p = n/2 li = Limite inferior da classe mediana. h = Amplitude da classe mediana. p = Elemento mediano.

BIOESTATISTICA_Vol_01.indb 241 25/06/12 17:12

Page 242: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental242

Fac-1 = Frequência absoluta acumulada da classe anterior. fi = Frequência absoluta simples da classe mediana.

Exemplo: Determinar o valor da mediana para a distribuição de frequên-cia da Tabela 8.2.

Tabela 8.2 – Peso ao nascer de 250 crianças nascidas vivas na maternidade A, em 2008

Peso (Kg) xi f fr F Fr

1,5 |— 2,0 1,75 8 0,032 8 0,032

2,0 |— 2,5 2,25 32 0,128 40 0,160

2,5 |— 3,0 2,75 62 0,248 102 0,408

3,0 |— 3,5 3,25 70 0,280 172 0,688

3,5 |— 4,0 3,75 44 0,176 216 0,864

4,0 |— 4,5 4,25 24 0,096 240 0,960

4,5 |— 5,0 4,75 10 0,040 250 1,000

Total – 250 – –

n = 250 i = 4 (p = n/2 = 125 está na quarta linha) h = 0,5 fi = 70 Fac-1 = 102 li = 3,0

Md = + − =3 00 5 125 102

703 16,

, ( ), kg

Método gráfico alternativo

Um valor aproximado para a mediana também pode ser obtido pela utiliza-ção do polígono de frequência acumulada (Ogiva de Galton). Após a construção do polígono, localiza-se, no eixo vertical (das frequências), o valor de p = (n +1)/2. A seguir, a partir desse ponto, traça-se uma linha horizontal até que esta intercepte a linha do diagrama, e, então, deste ponto de interseção, projeta-se uma perpendicular ao eixo horizontal. O ponto em que esta linha perpendicu-

BIOESTATISTICA_Vol_01.indb 242 25/06/12 17:12

Page 243: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Parâmetros da distribuição de frequências 243

lar intercepta este eixo corresponde ao valor da mediana. A Figura 8.3 mostra a determinação da mediana pelo método gráfico.

pn= +( )1

2

 

Mediana

Fig. 8.3 – Determinação da mediana pelo método gráfico

Considerações para o uso da mediana – A mediana é uma medida de ten-dência central não muito utilizada para representar o centro de uma distribuição, sendo a média aritmética, que será discutida a seguir, o parâmetro preferencial. Porém, como medida de localização, ela é mais robusta que a média, pois não é tão sensível à variação dos dados, não sendo, também, afetada pelos valores extremos da série, o que a torna bastante útil em algumas situações, especialmente quando a distribuição é assimétrica. Ou seja, quanto mais assimétrica for a distribuição, mais recomendada é a utilização da mediana como representante do conjunto de dados.

Por outro lado, a média aritmética, ao contrário da mediana, é uma medida muito influenciada por valores “muito maiores” ou “muito menores” (valores outliers) em relação aos demais, mesmo que estes valores apareçam em pequeno número na amostra. Estes valores outliers podem ser os responsáveis pela má uti-lização da média em situações nas quais teria mais significado utilizar a mediana.

8.1.3 Média Aritmética (Me)

A média aritmética, ou simplesmente média, é a medida de tendência central mais utilizada em cálculos que envolvam análises descritivas para com-parações e inferências estatísticas entre amostras e populações. De cálculo simples e fácil, a média corresponde a um valor único que representa o ponto

BIOESTATISTICA_Vol_01.indb 243 25/06/12 17:12

Page 244: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental244

de equilíbrio entre todos os valores de uma série de dados numéricos coletados a partir de uma variável contínua, além de apresentar propriedades matemáti-cas que permitem o desenvolvimento de cálculos estatísticos avançados.

Notação – Em estatística, a média aritmética de um conjunto de dados é repre-sentada pela letra que identifica a variável, geralmente a letra x , com um traço na parte superior, para a qual se lê “x barra”. Para uma população, a média aritmética é representada pela letra grega, minúscula, µ, para a qual se pronuncia “mi”.

Média simples para dados não agrupados

Para dados brutos, não agrupados em uma distribuição de frequência, a média calculada pela razão entre a soma (S) de todos os valores observados (x) e o número total de observações (n). As fórmulas são as seguintes:

•Para dados amostrais: x

x

nx

x x x x

n

i

i

n

n= ∴ =+ + + +=

∑1 1 2 3

...

•Para dados populacionais: µ µ= ∴ =+ + + +=

∑x

N

x x x x

N

i

i

N

N1 1 2 3...

Onde: x = Média da amostra. µ = Média da população. N = Número de observações da população. n = Número de observações da amostra. xi = Representa um valor em particular. Σx = Somatório dos valores de x.

Exemplo: Determinar o valor da média aritmética para o seguinte con-junto de dados.

xi = {22, 18, 40, 28, 32, 38, 25, 48}

x = + + + + + + + = =21 18 40 28 32 38 25 48

8

250

831 25,

BIOESTATISTICA_Vol_01.indb 244 25/06/12 17:12

Page 245: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Parâmetros da distribuição de frequências 245

Média ponderada para dados não agrupados

A média ponderada é um caso especial de média aritmética. Ela é caracteri-zada quando, no conjunto de dados, existem várias observações com o mesmo valor. Neste caso, cada valor deve ser multiplicado pelo número de vezes em que ele aparece (f) no conjunto de dados, para, então, obter-se a soma final de todos os produtos. A média ponderada é calculada pela fórmula abaixo, na qual xp , lê-se “x barra p”.

xpx

px

p x p x p x p x

p pp pn n= ∴ =

+ + + ++ +

∑∑( ) ...

1 1 2 2 3 3

1 2pp p

n3+ +...

Exemplo: A Tabela 8.3 mostra cada uma das notas parciais obtidas por um candidato classificado em um concurso público, com suas respectivas pondera-ções. Qual a média final do candidato?

Tabela 8.3 – Notas parciais do candidato A e suas respectivas ponderações

Avaliação Nota Peso

Escrita 8,5 5

Didática 9,1 4

Prática 8,8 3

Curricular 7.4 2

Entrevista 6,0 1

Total 39,8 Sp = 15

xpx

p

x

p

p

=

= + + + ++

∑∑( )

( , ) ( , ) ( , ) ( , ) ,5 8 5 4 9 1 3 8 8 2 7 4 6 0

5 4++ + +

= =

3 2 1

126 10

158 41x

p

,,

Resposta: média final do candidato igual a 8,41.

BIOESTATISTICA_Vol_01.indb 245 25/06/12 17:12

Page 246: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental246

Média para dados em grupamentos simples

Em tabelas de grupamentos simples, a média aritmética é calculada de modo semelhante à média ponderada para dados não agrupados. Neste caso, a ponderação é a própria frequência com que o dado aparece na distribuição.

xfx

f= =∑∑

, onde: Frequência do valor observf aado.

Exemplo: A Tabela 8.4 mostra a distribuição de frequências das notas de 40 alunos da turma de Bioestatística (dados hipotéticos). Qual a média obtida pela turma?

Tabela 8.4 – Notas da turma de Bioestatística

Notas Frequência

6 2

7 8

8 16

9 10

10 4

Total Sf = 40

x

fx

f

x

=

= + + + ++ + + +

∑∑2 6 8 7 16 8 10 9 4 10

2 8 16 10 4

( ) ( ) ( ) ( ) ( ) == =326

408 15.

Resposta: média da turma igual a 8.15.

Média para dados agrupados em tabelas de frequência

Quando os dados estão organizados em intervalos de classe, é necessário que se encontre o ponto médio que represente cada intervalo. Então, a média é calculada da mesma maneira empregada no cálculo para grupamentos sim-ples, apenas substituindo-se o valor x pelo valor do ponto médio (xi).

BIOESTATISTICA_Vol_01.indb 246 25/06/12 17:12

Page 247: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Parâmetros da distribuição de frequências 247

Exemplo: A Tabela 8.5 mostra a distribuição de frequências do peso ao nascer de 250 crianças nascidas vivas na maternidade A, em 2008. Qual a média de peso das crianças nascidas na maternidade, no período considerado?

Tabela 8.5 – Peso ao nascer de 250 crianças nascidas vivas na maternidade A, em 2008

Peso (kg) xi f

1,5 |— 2,0 1,75 8

2,0 |— 2,5 2,25 32

2,5 |— 3,0 2,75 62

3,0 |— 3,5 3,25 70

3,5 |— 4,0 3,75 44

4,0 |— 4,5 4,25 24

4,5 |— 5,0 4,75 10

Total – Sf = 250

xfx

f

i= = =∑∑

798 50

2503 20

,, kg

Resposta: média do peso ao nascer igual a 3,20 kg.

Propriedades da média aritméticaA média aritmética é uma medida de tendência central amplamente uti-

lizada em cálculos estatísticos. Daí que, conhecer suas propriedades, é de fundamental importância para o entendimento das inferências obtidas a partir da comparação de duas ou mais populações.

•1a Propriedade – A soma algébrica dos desvios, em relação à média, de cada um dos valores de um conjunto de dados é sempre nula, isto é, igual a zero. Esta propriedade, que é simbolicamente representada por Σ(x - x ) = 0, tem uma importância muito grande para a determinação das medidas de dispersão, que serão discutidas posteriormente.

BIOESTATISTICA_Vol_01.indb 247 25/06/12 17:12

Page 248: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental248

Exemplo:

Conjunto de dados. xi = {6, 8, 4, 2}

Cálculo da média. x = + + +6 8 4 2

4= 5

Somatório dos desvios em relação à média é igual a zero.

( ) ( ) ( ) ( ) ( )x xi

i

n

− = − + − + − + −=∑1

6 5 8 5 4 5 2 5

= + − −=1 3 1 3

0

•2a Propriedade – Somando-se ou subtraindo-se um valor constante a cada um dos elementos de um conjunto de dados, a média aritmética, desse conjunto de dados, fica somada ou subtraída por essa constante.

Exemplo:

Conjunto de dados. xi = {6, 8, 4, 2}

Cálculo da média. x = + + +6 8 4 2

4= 5

Somatório com a constante K = 2

x K

x K

fi

ii

n

± =±

+ + + + +

=∑∑

( )

( ) ( ) (

1

6 2 8 2 4 2=

)) ( )+ +2 2

4= 7

•3a Propriedade – Multiplicando-se ou dividindo-se, por valor cons-tante, cada um dos elementos de um conjunto de dados, a média aritmética, desse conjunto de dados, fica multiplicada ou dividida por essa constante.

BIOESTATISTICA_Vol_01.indb 248 25/06/12 17:12

Page 249: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Parâmetros da distribuição de frequências 249

Exemplo:

Conjunto de dados. xi = {6, 8, 4, 2}

Cálculo da média. x = + + +6 8 4 2

4= 5

Multiplicação pela constante K = 2 K x

K x

fi

ii

n

.

( . )( ) ( ) ( ) ( )= = + + + ==

∑∑1 2 6 2 8 2 4 2 2

410

•4a Propriedade – A soma dos quadrados dos desvios, tomados em relação à média aritmética, é o menor valor possível de se encontrar, ou seja, é menor que a soma dos quadrados dos desvios em relação a qualquer outro número. Por este motivo, a soma dos quadrados dos desvios em relação à média, também chamado de soma total dos quadrados (STQ), é tomada como base para o cálculo da variância de um conjunto de dados.

Vantagens do uso da média aritmética• É a medida de posição mais conhecida e de maior emprego em estatística

inferencial, pois, juntamente com uma medida de dispersão, serve para comparar grupos semelhantes.

• Quando calculada adequadamente, em uma amostra bem selecionada, a média aritmética representa uma estimativa não-viciada da média da população de onde a amostra foi retirada. É senso comum que, médias de amostras repeti-das, retiradas da mesma população, não apresentam grandes variações.

• Como é uma expectativa matemática, a média pode sempre ser facilmente calculada para qualquer conjunto de dados numéricos, ou seja, ela sempre existe, além do que, todo conjunto de dados numéricos tem uma e somente uma média aritmética, sendo, portanto, única.

• Depende sempre de todos os valores do conjunto de dados e, em geral, não ocupa a posição central do conjunto, mas sim, a posição do centro de equi-líbrio. Porém, não representa bem os conjuntos que apresentam grandes variações nos dados, pois é fortemente influenciada por valores discrepan-tes (outliers) da amostra.

BIOESTATISTICA_Vol_01.indb 249 25/06/12 17:12

Page 250: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental250

Posições relativas da média, mediana e modaAo estudarmos a representação gráfica de um conjunto de dados numéri-

cos, a observação da forma de sua curva pode servir como guia de orientação para a escolha do parâmetro a ser utilizado para a sua comparação. Assim, de acordo com a forma, uma distribuição pode ser classificada como simétrica e assimétrica, com os valores observados para a média aritmética, mediana e moda, assumindo posições características.

Distribuição simétrica

É aquela cuja curva assume a forma de um sino, com ambos os lados apre-sentando simetria em relação ao centro da mesma. Ou seja, se as duas metades forem separadas, elas serão idênticas na forma. Neste tipo de distribuição, a moda, a mediana e a média aritmética estão localizadas no centro da distribuição e têm valores iguais. A Figura 8.4 mostra um exemplo de distribuição simétrica.

 

Fig. 8.4 – Distribuição simétrica

Distribuição assimétrica

Ou distorcida, ou, ainda, inclinada, é aquela em que a relação entre as três medidas (média, mediana e moda) modifica de acordo com a inclinação, se para a direita (positiva) ou para a esquerda (negativa). A Figura 8.5 mostra exemplos de distribuição assimétrica.

Se a distribuição é positivamente inclinada (Fig. 8.5 A), a média é a maior (à direita) das três medidas. Isto ocorre porque a média é mais influenciada, que a mediana e a moda, por alguns valores extremamente grandes. Neste tipo

BIOESTATISTICA_Vol_01.indb 250 25/06/12 17:12

Page 251: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Parâmetros da distribuição de frequências 251

de distribuição, a mediana é, geralmente, a segunda maior das três medidas, enquanto que a moda é a menor. Se a distribuição apresenta um grau de incli-nação extremamente grande, a média não é uma boa medida a ser utilizada, sendo a mediana a medida mais representativa.

Por outro lado, se a distribuição é negativamente inclinada (Fig. 8.5 B), a média é a menor (à esquerda) das três medidas. Isto ocorre porque a média é mais influenciada, que a mediana e a moda, por alguns valores extremamente pequenos. Neste tipo de distribuição, a mediana é maior que a média, enquanto que a moda é a maior de todas as três medidas. Igualmente, se a distribuição apresenta um grau de inclinação extremamente grande, a média não é uma boa medida a ser utilizada, sendo a mediana a medida mais representativa.

Fig. 8.5 – Distribuição assimétrica. A: Inclinada positivamente; B: inclinada negativamente

BIOESTATISTICA_Vol_01.indb 251 25/06/12 17:12

Page 252: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental252

8.1.4 Média Geométrica (G)É um parâmetro muito útil para a determinação de médias de porcentagens,

razões, índices e taxas de crescimento. A média geométrica de um conjunto de números positivos é definida como o produto de todos os membros do conjunto, elevado ao inverso do número de membros. Assim temos, para o conjunto de dados:

xi = {x1, x2, ..., xn}, a média geométrica G = x x x

n

n

1 2. ...

Exemplo: Conjunto de dados - xi = {6, 8, 4, 2}

Cálculo da média geométrica - G = × × × = =6 8 4 24 4

384 4 4267,

Obs. - A média geométrica de um conjunto de números é sempre menor ou igual (nunca maior que) à média aritmética dos membros desse conjunto. As duas médias serão iguais, se e somente se, todos os membros do con-junto forem iguais.

8.1.5 Média Harmônica (H)Para um conjunto formado por n números racionais positivos: x1, x2, x3,

..., xn, a média harmônica H entre esses números é dada pela divisão de n pela soma dos inversos desses n números, isto é:

Hn

x x xn

=+ +1 1 1

1 2

...

Exemplo: Conjunto de dados - xi = {2, 6, 8}

Cálculo da média harmônica - H =+ +

=+ +

=3

1

2

1

6

1

8

3

12 4 3

24

3 7894,

Obs. - Em todas as médias, o resultado estará, sempre, entre o maior e o menor número do conjunto de dados, e, para os mesmos valores dos dados, a média aritmética terá o maior valor, seguida da média geométrica e, depois, da média harmônica.

BIOESTATISTICA_Vol_01.indb 252 25/06/12 17:12

Page 253: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Parâmetros da distribuição de frequências 253

8.2 MEDIDAS DE DISPERSÃOAs medidas de tendência central, tal como a média ou a mediana, fornecem

apenas uma descrição parcial para um conjunto de dados quantitativos, pois mostram somente o centro da distribuição, não informando sobre a amplitude e a variabilidade desses dados, o que torna a descrição bastante incompleta. Do mesmo modo, o conhecimento apenas das medidas estatísticas que mos-tram o grau de dispersão ou a variabilidade dos dados observados também não descrevem a distribuição na sua plenitude. A descrição ideal ocorre quando uma medida de dispersão, como o desvio padrão, por exemplo, é associado a uma medida de tendência central, como a média aritmética, de tal modo que se possam obter melhores informações a respeito da distribuição a ser estudada, como a sua forma gráfica e os seus valores extremos.

Com base neste raciocínio, podemos concluir que a utilização de uma única medida, seja de tendência central ou de dispersão, não é suficiente para des-crever e comparar, de modo conclusivo, um conjunto de observações, uma vez que dois conjuntos de dados podem apresentar a mesma média aritmética e, no entanto, a variação dos dados de um pode ser muito diferente da variação dos dados do outro. Observe, pois, os gráficos abaixo, mostrados na Figura 8.6. Cada um deles representa uma amostra de mesmo tamanho (n = 63). Ambos apresentam a mesma média, mediana e moda, além dos mesmos valores para a amostra (1, 2, 3, 4, 5, 6 e 7) e a mesma amplitude, mas, mesmo assim, podemos notar que são bastantes diferentes.

   

Fig. 8.6 – Gráficos comparativos que mostram a diferença de variação entre dois conjuntos

semelhantes de dados. Gráfico A: mostra pouca variação; Gráfico B: mostra muita variação

BIOESTATISTICA_Vol_01.indb 253 25/06/12 17:12

Page 254: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental254

Mas, afinal, o que faz com que esses gráficos pareçam tão diferentes um do outro? Resposta: é a grande diferença de variação dos dados existentes em cada um deles, diferença essa que pode ser mais bem observada se traçarmos uma curva ao longo do topo de cada retângulo, em cada um dos gráficos. Essa variação pode ser mensurada por parâmetros estatísticos conhecidos como medidas de dispersão ou de variabilidade, dentre as quais destacamos a variância e o desvio padrão.

Por que, então, calcular as medidas de dispersão de um conjunto de dados? Qual o objetivo destas medidas? Resposta: existem duas boas razões.

• A primeira é para avaliar a variabilidade dos dados de uma amostra ou população. Por exemplo, um pequeno valor para uma medida de dispersão, indica que os dados do conjunto estão agrupados muito próximos uns dos outros; em volta da média aritmética. Ou seja, indica que a amostra é homogênea, e a média pode ser considerada repre-sentativa dos dados, tal como ocorre no gráfico A. De outra forma, se o valor do parâmetro de dispersão é grande, a média não é uma medida confiável para representar o conjunto de dados, devendo ser substituída pela mediana.

• A segunda razão é para, após estudar a variabilidade dos dados de uma distribuição, poder compará-la a outras, para se verificar se estas são esta-tisticamente iguais ou diferentes.

A seguir, apresentaremos as principais medidas de dispersão mais utiliza-das em estatística descritiva.

8.2.1 Amplitude total (AT)A amplitude de um conjunto de dados é determinada pela diferença entre

o maior e o menor valor observados. É muito utilizada em estatística descri-tiva, porque é fácil de ser calculada e muito fácil de ser compreendida, porém entre todas as medidas de dispersão é a menos sensível em informar a varia-bilidade, uma vez que dois conjuntos de dados podem apresentar amplitudes iguais e uma grande diferença no que tange as suas variações. Essa caracterís-tica é demonstrada na Figura 8.6, na qual ambas as distribuições apresentam

BIOESTATISTICA_Vol_01.indb 254 25/06/12 17:12

Page 255: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Parâmetros da distribuição de frequências 255

a mesma amplitude, mas os valores do gráfico B tendem a se concentrar em torno do centro da distribuição.

A amplitude total é dada pela fórmula: AT = xmax – xmin. Quando calculada em uma amostra, esta medida frequentemente subestima a amplitude da popula-ção. Isto ocorre porque, em geral, a amostra não contém os valores extremos da população, os quais são relativamente raros para serem detectados por uma única amostra.

8.2.2 Desvio médio absoluto (DM)Corresponde à média aritmética dos valores absolutos dos desvios, de

cada um dos valores da distribuição, calculados em relação à média aritmética do conjunto de dados. Ao contrário da amplitude total, que considera apenas os dois valores extremos da distribuição, o desvio médio utiliza todos os valores do conjunto de dados, ou seja, ele mede a quantidade média de variação pela qual os valores em uma população, ou amostra, variam em relação à sua pró-pria média aritmética. É dado pela fórmula:

D

x x

nM

ii

n

=−

=∑| |

1 ,

onde: x = Valor de cada observação.

x = Média aritmética dos valores observados. n = Número de observações da amostra. | | = Indica valores absolutos. (ignorar os sinais matemáticos)

No cálculo do desvio médio (DM), os sinais matemáticos devem ser ignorados. Se assim não for feito, o resultado será sempre igual a zero, conforme já discutido no item 8.3, que trata das propriedades da média

aritmética.

Exemplo: o Quadro 8.2 mostra o cálculo do desvio médio dos pesos em uma amostra de animais.

BIOESTATISTICA_Vol_01.indb 255 25/06/12 17:13

Page 256: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental256

Quadro 8.2 – Cálculo do desvio médio

Pesos (g) (x - x ) Desvio absoluto

185 (185 – 198) 13

215 (215 – 198) 17

214 (214 – 198) 16

185 (185 – 198) 13

184 (184 – 198) 10

205 (205 – 198) 7

S = 76

D

x x

nM

ii

n

=−

=∑| |1 76

6= = 12,67

DM = 12,67 anos.

8.2.3 Variância (s2)É, também, uma medida de dispersão que considera os desvios em rela-

ção à média, de todos os valores observados, porém, em vez de usar os valores absolutos, a variância utiliza o quadrado dos desvios, sendo definida, portanto, como a soma dos quadrados dos desvios (SQ) em relação à média, dividida pelo número de observações menos 1 (n – 1), cuja fórmula é:

s

x x

n

ii

n

2

2

1

1=

−=∑( )

, onde: xi = Valor de cada observação.x = Média aritmética dos valores observados. n = Número de observações da amostra.

Notação – Em estatística, a variância dos dados de uma amostra é represen-tada pelo símbolo s2 (“s” minúsculo, ao quadrado). Para uma população, a variância é representada pelo símbolo σ2 (sigma minúsculo, ao quadrado). Os símbolos para as fórmulas da variância e do desvio padrão são mos-tradas no Quadro 8.3.

BIOESTATISTICA_Vol_01.indb 256 25/06/12 17:13

Page 257: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Parâmetros da distribuição de frequências 257

Quadro 8.3 – Símbolos para as fórmulas da variância e do desvio padrão

Amostra População

Variância s2 σ 2

Desvio padrão s σ

Média x µ

Número de dados n N

Desvio x x− x −µ

Soma dos quadrados ( )x x−∑ 2 ( )x −∑ µ 2

As fórmulas para a variância, segundo o tipo de dado, são mostradas no Quadro 8.4.

Quadro 8.4 – Fórmulas para o cálculo da variância

Dados brutos Dados agrupados

• Para dados amostraiss

x x

n

ii

n

2 1

1=

−=∑( )

s

x x Fi

n

ii

k

2

2

1

1=

−=∑( )

• Para dados populacionaisσ

µ2

2

1=−

=∑( )x

N

ii

N

σµ

2

2

1=−

=∑( )x Fi

N

ii

k

Tabela 8.6 – Cálculo da variância para uma amostra de dados não agrupados

Pesos (g)

Desvios

x x−( )Quadrados

x x−( )2

185 - 13 169

215 17 289

214 16 256

185 - 13 169

184 - 14 196

205 7 49

x = =1 188

6198

. S = 0 S = 1.128

BIOESTATISTICA_Vol_01.indb 257 25/06/12 17:13

Page 258: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental258

Exemplo: Calcular a variância para os dados apresentados na Tabela 8.6.

Note que para calcular a variância dos dados da tabela em questão, segui-mos alguns passos lógicos, previstos na fórmula padrão. Isto é muito fácil, uma vez que todos os valores apresentados, e também a média calculada, eram números inteiros, sem decimais. Caso contrário, a tarefa teria sido árdua e tediosa, a menos que pudéssemos obtê-los pelo emprego de uma calculadora estatística ou de um computador. Porém, na prática, podemos utilizar fórmulas alternativas mais simples, as quais não necessitam que se calcule nem a média nem os desvios em relação à média, tal como mostrado na fórmula a seguir:

s

xx

n

n

2

22

1=

∑ ∑( )

Assim, temos:

x2

34 225 46 225 45 796 34 225 33 856 42 025 2∑ = + + + + + =. . . . . . 336 352.

x

s

∑ = + + + + + =

∴ =−

185 215 214 185 184 205 1 188

236 3522

.

.(11 188

6

5

1 128

5225 6

2

2

. )

.,= = g

Passos para calcular a variância

1. Calcular a média da amostra.2. Calcular o desvio de cada um dos dados em relação à média aritmética.3. Calcular o quadrado de cada desvio.4. Obter a soma dos quadrados dos desvios (SQ)5. Dividir a SQ pelo valor de n – 1. s g2 21 128 5 225 6= =. / , (a variância deve ser expressada na mesma unidade dos dados, ao quadrado).

BIOESTATISTICA_Vol_01.indb 258 25/06/12 17:13

Page 259: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Parâmetros da distribuição de frequências 259

Entendendo a variânciaEmbora a variância não seja a medida de dispersão mais utilizada em aná-

lises estatísticas, cabendo este privilégio ao desvio padrão, compreender os princípios que regem a sua determinação é fundamental para o entendimento dos conceitos de variabilidade, assim como para a compreensão dos testes de hipóteses, os quais têm por finalidade comparar as diferenças, ou igualdades, entre dois ou mais grupos. Desta forma, o propósito da variância, além de ser-vir como um parâmetro a ser utilizado para medir a variação em um conjunto de dados, é, também, um estimador para a população de onde a amostra foi retirada. Assim, temos que observar a essência da sua fórmula.

• Intuitivamente, parece razoável que, para se medir a variação em um con-junto de dados, basta, simplesmente, calcular o quanto cada um dos valores dista da média aritmética da distribuição, e, então, usar o total destes des-vios como uma medida de variabilidade da amostra (desvios da média). Mas, infelizmente, isto não pode ser feito, porque, a não ser que todos os valores de x sejam iguais, alguns dos desvios terão valores negativos e outros, terão valores positivos. Assim, como foi demonstrado no Quadro 8.6, quando todos os desvios em relação à média são somados, Σ(x - x ), o resultado será sempre igual a zero, independentemente do tamanho e dos valores da distribuição. Portanto, diferentes distribuições terão o mesmo desvio da média, ou seja, o valor zero.

• De outra maneira, embora o interesse maior esteja na magnitude dos des-vios, e não se eles são positivos ou negativos, poderíamos, simplesmente, ignorar os sinais e definir os desvios da média em termos absolutos (sem sinais) e, então, dividir o total dos desvios pelo valor de n para obter uma medida estatística chamada desvio médio absoluto (DM). Esta medida é raramente utilizada, pois também apresenta limitações, uma vez que os valores absolutos a tornam imprecisa em relação às inferências estatísticas.

• Por sua vez, a alternativa encontrada pelos estatísticos para resolver o pro-blema da variabilidade foi trabalhar com o quadrado dos desvios da média. Isto elimina o efeito dos sinais, uma vez que o quadrado de um número real negativo é sempre positivo. Assim, a soma total dos quadrados dos des-vios (SQ), ou soma total dos quadrados (STQ), que representa o total de

variação existente em um conjunto de dados, só que elevado ao quadrado,

BIOESTATISTICA_Vol_01.indb 259 25/06/12 17:13

Page 260: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental260

tem sua soma sempre diferente de zero, a menos que todos os valores con-siderados sejam iguais.

• O próximo passo seria tornar a medida de variância da amostra um parâ-metro único, individualizado para cada conjunto de dados. A solução encontrada foi dividir o total de variação pelo número de observações n. Mas, na prática, como a utilização de amostras é a regra mais comum, cos-tuma-se usar a fórmula ligeiramente modificada, na qual o denominador n é substituído por n – 1. Esse denominador, chamado graus de liber-

dade (gl), é, talvez, uma das medidas menos compreendida em estatística descritiva. Entender o seu fundamento é crucial para que se possa compre-ender por que a variância é única (exclusiva) para um conjunto de dados.

• Afinal, por que a denominação graus de liberdade? Liberdade de que? Resposta: liberdade de variar. Cada conjunto de dados tem um número máximo de variações entre seus elementos. Por exemplo, se tomarmos uma amostra constituída por somente um elemento A, quantas seriam as possíveis variações encontradas na amostra? Resposta: Nenhuma, pois o elemento é único. Porém se esta amostra fosse constituída por dois ele-mentos, A e B, poderíamos ter apenas uma única variação, de A para B. De igual maneira, se a amostra fosse constituída por três elementos, A, B, e C, teríamos, então, duas possíveis variações, entre A e B, e entre B e C, e assim, sucessivamente, para amostras de n elementos. Portanto, como ficou fácil de compreender, o número de variações possíveis dentro de um conjunto de dados é sempre definido pelo número de observações menos 1. Deste modo, temos que, a soma total dos quadrados (STQ) indica o somatório (valor total) de todas as variações de um conjunto de dados, ao passo que os graus de liberdade (gl) determinam quantas são as possíveis variações encontradas neste mesmo conjunto de dados, de tal maneira que a fórmula da variância pode ser expressa por: s2 = STQ/gl. Esta divisão torna a vari-ância uma medida única para cada distribuição, daí a grande vantagem na sua utilização em estatística descritiva.

• Outra boa razão para a utilização de n – 1, no denominador, é a seguinte: ao se tomar um conjunto de amostras de uma população A que apresente a média µ, para a qual se calculam as médias x para essas amostras, e, posteriormente, a média de todas as médias amostrais, encontrar-se-á um

BIOESTATISTICA_Vol_01.indb 260 25/06/12 17:13

Page 261: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Parâmetros da distribuição de frequências 261

valor muito próximo ao valor de µ da população. Entretanto, se calcular-mos a variância s2 de cada uma das amostras da população A (de variância σ2), pela aplicação da fórmula tradicional que tem o valor n no numerador, e, então, calcularmos a média de todas as variâncias amostrais, provavel-mente encontraremos um valor menor que σ2. Assim, teoricamente, uma maneira de se compensar esta diferença é dividir por n – 1, na fórmula, em vez de n.

• De todo jeito, a variância é um parâmetro utilizado para medir a variação em um conjunto de dados, assim como o metro é o parâmetro utilizado para medir o comprimento de tecidos e o litro o parâmetro para medir o volume de um líquido, como o leite, por exemplo. Porém, diferentemente do metro e do litro, que são únicos, independentemente do tipo de tecido ou de leite, a variância é um valor único para cada conjunto de dados, sendo o seu valor imutável, a não ser que se modifique o número de elementos do conjunto ou o valor de um dos seus elementos.

• Quando, na média, os valores de um estimador refletem o verdadeiro valor do parâmetro para a população, dizemos que ele é um estimador não--viciado. Isto posto, quando o denominador da equação é n – 1, a variância de uma amostra aleatória é um estimador não-viciado da variância da população de onde a amostra foi retirada.

8.2.4 Desvio padrão (s)É a medida de dispersão mais utilizada em estatística descritiva, sendo

definida, para um conjunto de dados, como a raiz quadrada da variância desse conjunto, cuja fórmula é:

•Fórmulanormalpadrão:

s s

x x

n

ii

n

= =−

−=∑

2

2

1

1

( )

,

onde: xi = Valor de cada observação.

x = Média aritmética dos valores observados. n = Número de observações da amostra.

BIOESTATISTICA_Vol_01.indb 261 25/06/12 17:13

Page 262: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental262

•Fórmulasimplificada:

s

xx

n

n=

∑ ∑22

1

( )

Assim, para o exemplo anterior, temos:

x2 34 225 46 225 45 796 34 225 33 856 42 025 2∑ = + + + + + =. . . . . . 336 352

185 215 214 185 184 205 1 188

236

.

.x

s

∑ = + + + + + =

∴ =..

( . )

., ,

3521 188

6

5

1 128

5225 6 15 01

2

−= = = g

•Para tabela de grupamento simples:

s

x x f

nn f

ii

n

=−

−==

∑( )

,

2

1

1onde: número de entΣ rradas no conjunto de dados( ).

Exemplo: a Tabela 8.7 mostra a distribuição de frequências das notas de 40 alunos da turma de Bioestatística (dados hipotéticos). Qual o desvio padrão da turma?

Tabela 8.7 – Notas da turma de Bioestatística

Notas Frequência x x− ( )x x− 2 ( )x x f− 2x

6 2 - 2,15 4,62 9,24

7 8 - 1,15 1,32 10.56

8 16 - 0,15 0,02 0,32

9 10 0,85 0,72 7,20

10 4 1,85 3,42 13,68

Total Σf = 40 Σ = 41,00

BIOESTATISTICA_Vol_01.indb 262 25/06/12 17:13

Page 263: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Parâmetros da distribuição de frequências 263

• Cálculo da média:

xfx

f= = + + + +

+ + + +=∑

∑2 6 8 7 16 8 10 9 4 10

2 8 16 10 4

( ) ( ) ( ) ( ) ( ) 3326

408 15= .

• Usar a soma dos quadrados para calcular o desvio padrão:

sx x f

n=

−−

= ≈∑( ),

2

1

41

391 03

•Para dados agrupados em classes:

Exemplo: A Tabela 8.8 mostra a distribuição de frequências do peso ao nas-cer de 250 crianças nascidas vivas na maternidade A, em 2008. Qual o desvio padrão dos pesos das crianças nascidas na maternidade, no período considerado?

Tabela 8.8 – Peso ao nascer de 250 crianças nascidas vivas na maternidade A, em 2008

Peso (Kg) xi

f xf x x− ( )x x− 2 ( )x x f− 2x

1,5 |— 2,0 1,75 8 14,00 -1,45 2,10 16,82

2,0 |— 2,5 2,25 32 72,00 -0,95 0,90 28,88

2,5 |— 3,0 2,75 62 170,50 -0,45 0,20 12,56

3,0 |— 3,5 3,25 70 227,50 0,05 0,00 0,17

3,5 |— 4,0 3,75 44 165,00 0,55 0,30 13,31

4,0 |— 4,5 4,25 24 102,00 1,05 1,10 26,46

4,5 |— 5,0 4,75 10 47,50 1,55 2,40 24,03

Total – Σf = 250 Σ = 798,50 Σ = 122,23

• Cálculo da média: x

fx

fxi= ∴ = =∑

∑kg

798 50

2503 20

,,

• Usar a soma dos quadrados para calcular o desvio padrão:

sx x f

n=

−−

= ≈∑( ) ,,

2

1

122 23

2490 70 kg

BIOESTATISTICA_Vol_01.indb 263 25/06/12 17:13

Page 264: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental264

Note que, ao calcular o desvio padrão, a fórmula corrige o fato dos desvios em relação à média terem sido expressados como o quadrado dos desvios, fato este que devolve, ao parâmetro estudado, à sua medida original. Note, também, que, ao contrário da variância, o desvio padrão é expresso na unidade de ori-gem da medida. Por exemplo, se a medida original dos dados é em grama (g), a variância deve ser expressada em grama ao quadrado (g2), ao passo que o desvio em grama (g).

Interpretando o desvio padrão• No item referente à variância, foi visto que, ao compararmos a variabi-

lidade de duas amostras selecionadas a partir da mesma população, a amostra com maior variância é a de maior variabilidade nos dados, ou seja, é a mais heterogênea, ao passo que, a amostra de menor variância é aquela que apresenta maior homogeneidade. O mesmo raciocínio é aplicado para o desvio padrão. Portanto, podemos afirmar: se o desvio padrão de um conjunto de dados é pequeno, os valores estarão concentrados muito pró-ximos à média; se o desvio padrão é grande, os valores dos dados estarão largamente espalhados em relação à média. É interessante notar que, se o desvio padrão apresentar um valor maior que a média, isso é uma indica-ção que a distribuição apresenta um alto grau de assimetria.

• De todo jeito, trabalhar com o desvio padrão é sempre mais fácil. Isto porque ele é um número menor do que a variância (raiz quadrada da

variância), o que torna o seu manejo menos complicado, além de poder ser utilizado para descrever a quantidade de dispersão em uma distribui-ção de frequência.

• Assim, o entendimento de como o desvio padrão pode descrever a quan-tidade de dispersão em um conjunto de dados é fundamental para a compreensão dos fundamentos dos testes de hipótese para dados quan-titativos contínuos. Frequentemente, precisamos saber, em um conjunto de dados, o quanto, em termos de desvio padrão, cada observação dista da média, ou, quantas observações estão localizadas no intervalo entre um ou dois desvios padrão em relação à média.

• Todas estas questões a respeito da interpretação do desvio padrão calcu-lado a partir de um conjunto de dados, seja amostral ou populacional, tem

BIOESTATISTICA_Vol_01.indb 264 25/06/12 17:13

Page 265: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Parâmetros da distribuição de frequências 265

como embasamento o conhecimento prévio de um teorema matemático (Teorema de Chebyshev) e das relações do desvio padrão na distribui-

ção normal gaussiana (curva normal gaussiana). O primeiro, se aplica a qualquer conjunto de dados, enquanto que o segundo deve ser aplicada às distribuições simétricas, em forma de sino (gaussianas), ou, até mesmo, quando a distribuição é ligeiramente inclinada ou assimétrica. Ambos, e outros procedimentos para a interpretação do desvio padrão, serão des-critos a seguir.

A. Teorema de Chebyshev1

“Para qualquer conjunto de dados (amostra ou população), a proporção dos valores situados no intervalo de k desvios padrão, em ambos os lados da média, é, no mínimo,1-1/k2, onde k é qualquer constante maior que 1.

( )x ksk

± = −1 1

2

Assim, temos:• Para k = 2: em qualquer conjunto de dados, no mínimo

1

1

2

3

42− = , ou 75%

dos valores estão situados no intervalo de 2 desvios padrão em relação à média.

• Para k = 3: em qualquer conjunto de dados, no mínimo 1

1

3

8

92− = , ou 88,9%

dos valores estão situados no intervalo de 3 desvios padrão em relação à média.

• Para k = 5: em qualquer conjunto de dados, no mínimo 1

1

5

24

252− = , ou 96%

dos valores estão situados no intervalo de 5 desvios padrão em relação à média.

• Para k = 10: em qualquer conjunto de dados, no mínimo 1

1

10

99

1002− = ,

ou 99% dos valores estão situados no intervalo de 10 desvios padrão em relação à média.

• E assim, sucessivamente, para qualquer valor de k > 1.

1. Pafnuti Lvovitch Tchebychev (1821-1894) – Matemático russo conhecido por seu trabalho no domínio da Probabilidade e Estatística.

BIOESTATISTICA_Vol_01.indb 265 25/06/12 17:13

Page 266: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental266

Note que, embora o teorema de Chebyshev possa ser utilizado para qual-quer tipo de dado, sua aplicação prática tem limitações. Como ele fornece somente a menor percentagem que é matematicamente possível de ser encon-trada no intervalo pré-determinado, não se pode afirmar qual, de fato, é a verdadeira porcentagem, a qual pode ser maior que a encontrada. Porém, ele fornece alguma idéia da dispersão em um conjunto de dados, ou seja, como estão relacionados o desvio padrão e a média, deste conjunto.

Exemplo: O quadro abaixo mostra a dosagem do cálcio sérico, em mg/dL, de 25 pacientes. Pelo teorema de Chebyshev, calcule o número de pacientes cujos valores do cálcio estão dentro do intervalo x s±2 . Expresse essa conta-gem como uma porcentagem do número total de medidas.

7 9 6 10 6 7 11 7 8 7 9 7 11

9 9 12 10 10 8 10 7 8 7 6 5

• Calculo da média: x

x

n

ii

n

= = ==∑1 206

258 24, mg/dL

• Cálculo do desvio padrão:

s

xx

n

n=

−=

−=

∑ ∑22 2

1

1 778206

25

241 83

( ).

( )

, mg/dL

• Cálculo do intervalo x s±2 : x s

x s

− =+ =2 4 58

2 11 90

.

.

(limite inferior)

(limite superior)

-∴ ± =( ) ( , , )x s2 4 58 11 90

Resposta: 24 dos 25 pacientes têm a dosagem do cálcio sérico dentro do intervalo calculado em torno da média. Este número representa 24/25, ou 96% do total das medidas. Pelo teorema de Chebyshev, o mínimo esperado seria de 75% das amostras.

BIOESTATISTICA_Vol_01.indb 266 25/06/12 17:13

Page 267: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Parâmetros da distribuição de frequências 267

B. Desvio padrão versus distribuição normal gaussiana

(regra empírica)

Também chamada de regra empírica ou regra normal, tem como emba-samento o resultado teórico das relações do desvio padrão na curva normal gaussiana, além de ser mais precisa em descrever a dispersão em torno da média quando comparada ao teorema de Chebyshev. A curva normal gaus-siana representa uma distribuição de frequência teórica, cujo gráfico de linha descreve uma curva simétrica em forma de sino (curva normal), conforme mostrado na Figura 8.7.

Regra empírica

Para um conjunto de dados que apresente uma distribuição simétrica em forma de sino, o desvio padrão corresponde às seguintes características de dis-persão em relação à média aritmética:

• 68% das observações estão situadas no intervalo entre um desvio padrão acima e abaixo da média aritmética.

• 95,4% das observações estão situadas no intervalo entre dois desvios padrão acima e abaixo da média aritmética.

• 99,7% das observações estão situadas no intervalo entre três desvios padrão acima e abaixo da média aritmética.

Fig. 8.7 – Relações do desvio padrão na curva normal gaussiana

BIOESTATISTICA_Vol_01.indb 267 25/06/12 17:13

Page 268: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental268

Observando-se a Figura 8.7, pode-se notar que, se a distribuição for simé-trica (em forma de sino), as porcentagens descritas na regra empírica podem ser igualmente repartidas entre as metades da distribuição, em cada lado da média aritmética. Por exemplo, uma vez que 68% das observações estão situadas den-tro do intervalo de 1 desvio padrão da média, em uma distribuição simétrica isso implica que 34% das medidas estão situadas entre a média e um desvio padrão, em cada lado da média. Este mesmo conceito mostra que 2,35% das medidas repousam além de 2 desvios padrão em cada direção em relação à média, o que é resultante do fato de que cerca de 95,4% dos valores da distribuição caem dentro do intervalo de 2 desvios padrão da média. A seguir, mostramos outras relações entre o desvio padrão e a distribuição normal gaussiana.

Outras relações

• 90% das observações - Intervalo entre 1,645 desvios padrão acima e abaixo da média.

• 95% das observações - Intervalo entre 1,96 desvios padrão acima e abaixo da média (esta é a relação mais frequentemente utilizada para análises na área das ciências da saúde).

• 98% das observações - Intervalo entre 2,33 desvios padrão acima e abaixo da média.

• 99% das observações - Intervalo entre 2,58 desvios padrão acima e abaixo da média.

C. Desvio padrão versus amplitude

Em estatística descritiva existe uma outra questão que, muito frequentemente, preocupa o pesquisador ao analisar o valor do desvio padrão calculado para o seu conjunto de dados. “Qual é o tamanho ideal do desvio padrão para que uma dis-tribuição de frequência dos dados de uma amostra seja considerada confiável, homogênea”? O desvio padrão deve ser comparado a que medida da amostra?

Ora, essa preocupação não é totalmente destituída de motivos, porque valores extremamente elevados para o desvio padrão denotam uma amostra com muita dispersão nos dados e alto grau de assimetria da distribuição, fato-res estes que indicam um possível erro na seleção dos participantes ou falta de acurácia e precisão durante a coleta dos dados. Mas, como regra geral, para a

BIOESTATISTICA_Vol_01.indb 268 25/06/12 17:13

Page 269: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Parâmetros da distribuição de frequências 269

determinação do tamanho ideal do desvio padrão de uma amostra, o raciocínio segue o seguinte princípio: segundo o teorema de Chebyshev e pelas relações do desvio padrão na curva normal, sabe-se que a maioria das medidas, apro-ximadamente 95,4% delas, está situada no intervalo de dois desvios padrão em relação à média. E, independente da forma da distribuição e do número de medidas, quase que a totalidade delas (99,7%) está situada no intervalo de três desvios padrão. Consequentemente, em um conjunto de dados bem coletados, poderíamos esperar que a amplitude total da distribuição fosse algo em torno de 4 (± 2s) a 6 (± 3s) desvios padrão, o que nos fornece a seguinte relação:

• Tamanho ideal do s: AmplitudeDesvio padrão

Amplitude

6 4≤ ≤

Na prática, o tamanho do desvio padrão não deve ser maior que 1/4 da amplitude total da amostra, com um valor desejado situado algo entre 1/6 e 1/4 do total dessa medida.

C. Desvio padrão versus unidade padrão normalizada (valor z)

Como já relatado, uma boa descrição de uma distribuição de frequência nor-mal pode ser feita, unicamente, pela utilização da média aritmética e do desvio padrão. Na prática, para a grande maioria das vezes queremos comparar núme-ros pertencentes a diferentes conjuntos de dados, de diferentes amostras ou populações, os quais, em regra geral, apresentam valores diferentes para o desvio padrão e para a média. Assim, a fim de que a comparação possa ser feita, é neces-sário que todos os valores estejam expressos na mesma unidade de medida. Por exemplo: se o objetivo é comparar a estatura de dois grupos de pessoas, todas as medidas deverão estar na mesma unidade, ou seja, em centímetros ou metros. Aqui notamos uma desvantagem para o uso do desvio padrão como medida de variação, pois ele depende da unidade de medida empregada nos dados.

Para eliminar esse inconveniente, os dados podem ser convertidos para unidades padrão normalizadas (valores z), cuja fórmula é apresentada abaixo.

• Fórmulaparaconverterparaunidadepadrão: zx x

sz

x= − = −ou

µσ

BIOESTATISTICA_Vol_01.indb 269 25/06/12 17:13

Page 270: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental270

• Procedimentos - O passo inicial consiste em estabelecer uma média igual a zero, subtraindo-se, de cada observação, o valor da média, na unidade que tenha sido calculada. Posteriormente, divide-se o resultado pelo valor do desvio padrão para que se possam calcular quantos desvios padrão cada observação possui acima ou abaixo da média. Como as mesmas unidades são utilizadas para a média e o desvio padrão, o mesmo valor, em termos de desvio padrão, será obtido de cada observação, independentemente da unidade utilizada. O resul-tado obtido é o valor normalizado (valor z) para aquela observação individual.

Para ilustrar: suponha que o objetivo é padronizar os valores da massa corporal para um grupo de indivíduos cujos pesos têm uma média de 82 kg e um desvio padrão de 12 kg. Para dois indivíduos, um com 98 kg e o outro com 74 kg os valores padronizados seriam:

• Indivíduo A: zA= − =98 82

121 33,

• Indivíduo B: z

B= − = −74 82

120 66,

ATENÇÃO A distribuição de frequência dos valores normalizados (valores z) sempre tem uma média igual a zero desvio padrão, e um desvio padrão igual a 1 (desvio padrão).

Exemplo ilustrativo: Suponha que o objetivo é comparar as notas de mate-

mática e física de um aluno, em relação ao rendimento geral de sua turma.

Disciplina Notas do aluno

( )x s± da turma Valor z Resultado

Matemática 68 52 ± 1068 52

101 6

− = .1,6 desvios padrão acima da média da turma.

Física 82 74 ± 1682 74

160 50

− = ,0,5 desvios padrão acima da média da turma.

Em uma primeira olhada para o quadro de notas, e sem considerar a média da turma, parece que o referido aluno se saiu muito melhor em física que em matemática. Porém, quando suas notas são comparadas com

BIOESTATISTICA_Vol_01.indb 270 25/06/12 17:13

Page 271: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Parâmetros da distribuição de frequências 271

a média da turma, em termos de desvio padrão, podemos verificar que, em matemática o aluno obteve nota 1,6 desvios padrão acima da média da classe, ao passo que, em física, sua nota foi apenas 0,5 desvios padrão acima. Observe que, efetuar a comparação tomando-se como referência as notas originais, não mostra o real rendimento do aluno em relação à sua turma. Porém, quando as notas são expressas em desvio padrão, isto é per-feitamente possível.

8.2.5 Coeficiente de variação (CV)Inicialmente desenvolvido por Karl Pearson (1857-1936), o coeficiente de

variação é uma medida relativa da dispersão, ou da variabilidade, que indica a relação percentual entre o desvio padrão e a média dos dados. É calculado pela seguinte fórmula:

Cvs

xCv

s

x= =ou 100% ×

Quando queremos comparar a dispersão para uma mesma variável, em

duas ou mais amostras diferentes, o desvio padrão pode ser utilizado como um bom parâmetro de comparação. Por outro lado, o desvio padrão, quando tomado isoladamente, não informa se a variação para aquele conjunto de dados é grande ou pequena. Por exemplo: um desvio padrão de 10 kg em relação à massa ponderal de pessoas é grande ou pequeno? Depende. Se o valor for rela-tivo ao peso de adultos, provavelmente não é grande, mas, para crianças, 10 kg podem representar uma grande variação nos dados.

De outro modo, quando queremos comparar a variabilidade relativa em diferentes tipos de dados, inclusive dados medidos em diferentes unidades de medição, como o metro e o quilograma, por exemplo, o desvio padrão não pode ser utilizado, uma vez que ele depende da unidade de medida. Aqui a solução é a utilização do coeficiente de variação, o qual independe da unidade de medi-ção empregada.

Exemplo: Uma empresa agropecuária deseja conhecer qual de suas espécies de galinha poedeira apresenta maior variabilidade nas medidas do

BIOESTATISTICA_Vol_01.indb 271 25/06/12 17:13

Page 272: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental272

comprimento e do peso dos ovos. Esta característica é fundamental para o planejamento das embalagens do produto. O Quadro 8.5 mostra a média e o desvio padrão dos comprimentos e dos pesos de ovos das duas espécies. Qual espécie apresenta maior variação em relação às medidas?

Interpretando os resultados, podemos afirmar que existe mais dispersão relativa (variação) para o comprimento dos ovos da espécie A quando com-parados aos ovos da espécie B. Por outro lado, a espécie B apresenta maior variação em relação aos pesos dos ovos.

De todo jeito, é interessante notar que o coeficiente de variação é muito útil quando os dados comparados estão em diferentes unidades de medição; ou, se na mesma unidade, as médias a serem comparadas são bas-tante diferentes.

Quadro 8.5 – Medidas do peso e do comprimento dos ovos de duas espécies

de galinha poedeira

Espécie Variável ( )x s± Cv% Resultado

A

Peso (g)

55,4 ± 9,19 1

55 416 43

,

,, %x100=

A espécie A apresenta menor variação no peso.

A espécie B apresenta menor variação no comprimento.

Comprimento(cm)

4,9 ± 1,11 1

4 922 45

,

,, %x100=

B

Peso(g)

68,2 ± 13,613 6

68 219 95

,

,, %x100=

Comprimento(cm)

6,4 ± 0,80 8

6 412 50

,

,, %x100=

8.3 MEDIDAS DE ASSIMETRIA E CURTOSENeste capítulo, o enfoque tem sido o estudo das medidas de posição pela

descrição de um conjunto de dados com base na média, mediana e moda, assim como a descrição da variação dos dados por meio da análise da amplitude e do desvio padrão. Porém, uma outra característica, que pode ser observada em um conjunto de dados, é a forma de sua distribuição de frequência, que, juntamente com as medidas de posição e de dispersão, completam o quadro

BIOESTATISTICA_Vol_01.indb 272 25/06/12 17:13

Page 273: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Parâmetros da distribuição de frequências 273

geral para o estudo da estatística descritiva, sendo as medidas de assimetria

e curtose as mais importantes, as quais descreveremos a seguir.

8.3.1 Medidas de assimetria (enviesamento)As medidas de assimetria têm por objetivo avaliar o quanto uma distri-

buição de frequência se afasta da condição de simetria em relação à sua forma gráfica. Elas possibilitam a análise de uma distribuição de frequência de acordo com as relações entre suas medidas de média, mediana e moda, quando obser-vadas graficamente. A Figura 8.8 mostra os tipos de distribuição conforme a simetria de sua forma gráfica.

 

Fig. 8.8 – Tipos de distribuição conforme a simetria de sua forma gráfica

Assim, para calcular a assimetria de uma distribuição, temos:

• Primeiro coeficiente de assimetria de Pearson (Ap) – Mede a distân-cia, em número de desvios padrão, da média até a moda. É dado pela fórmula:

Ax Mo

sP= −

• SegundocoeficientedeassimetriadePearson(Ap) – Mede a distância, em número de desvios padrão, da média até a mediana. É dado pela fórmula:

Ax Md

sP= −3.( )

BIOESTATISTICA_Vol_01.indb 273 25/06/12 17:13

Page 274: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental274

Interpretação:Ap = 0 (distribuição simétrica);Ap > 0 (distribuição assimétrica positiva);AP < 0 (distribuição assimétrica negativa).

O coeficientedeassimetriadePearson varia de –3 a +3. Valores próxi-mos a –3 indicam uma inclinação negativa considerável. Um valor como 1,4, por exemplo, mostra moderada inclinação positiva, ao passo que um valor igual a zero indica que a distribuição é simétrica, uma vez que a média e a mediana são iguais.

Exemplo: Calcular o coeficiente de assimetria para uma distribuição com média = 3,98, moda = 2,6 e desvio padrão = 2,4

AP= − =( , , )

,,

3 98 2 6

2 40 58 distribuição assimétrica positiva( )

8.3.2 Medidas de curtose (achatamento)A curtose mede o grau de achatamento da curva de frequência de uma

distribuição em relação à curva padrão normal (gaussiana). Isto é, ela mede o quanto uma curva de frequência é achatada ou afilada em relação à curva normal de referência. É calculada com base na concentração ou dispersão dos valores de um conjunto de dados em relação às medidas de tendência central de uma distribuição.

• Coeficientede curtose – Ou coeficientepercentílico de curtose, é utili-zado para o cálculo do grau de achatamento de uma curva de frequência. É dado pela fórmula:

kQ Q

P P=

−−

( )

( ),3 1

90 102

onde: Q3 e Q1 = Terceiro e primeiro quartil.P10 e P90 = Décimo e nonagésimo percentil.

A curva normal padrão apresenta um coeficiente de curtose igual a 0,263 e é chamada de mesocúrtica. Se o coeficiente for maior que 0,263 a curva recebe a denominação de platicúrtica, e, se for menor que 0,263, será cha-

BIOESTATISTICA_Vol_01.indb 274 25/06/12 17:13

Page 275: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Parâmetros da distribuição de frequências 275

mada de leptocúrtica. A Figura 8.9 mostra os três tipos de curva quanto ao grau de achatamento.

 

Fig. 8.9 – Tipos de distribuição conforme o coeficiente de curtose

O coeficiente de curtose também pode ser calculado para dados tabelados, segundo a fórmula:

k

x x f

f

ss s

x x f

i i

i i=

=−

∑∑

( )

( )( )

4

4

4 2 22

, onde: = ii

n

∑−

1

2

(Amostra)

=σ σ4 2 2=−

( )( )x x

i

222

f

N

i∑

(População)

Exemplo: Considerando o conjunto de dados abaixo relacionados, calcule o coeficiente de curtose.

Dados: Q1 = 4,25 Q3 = 8,65 P10 = 1,60 P90 = 8,30

k = −−

= = ∴ >8 65 4 25

2 8 30 1 60

4 40

13 400 328

, ,

.( , , )

,

,, k 2630, : .ddiissttrriibbuuiiççããoo lleeppttooccúúrrttiiccaa

BIOESTATISTICA_Vol_01.indb 275 25/06/12 17:13

Page 276: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental276

8.4 MEDIDAS DE POSIÇÃO (SEPARATRIZES) O desvio padrão é o parâmetro mais comumente utilizado para descre-

ver a dispersão em um conjunto de dados. Entretanto, existem outros métodos para se demonstrar a variação ou a amplitude dos valores de uma distribuição, sendo um destes métodos o que determina a localização de valores que divi-dem o conjunto das observações em partes iguais. Estas medidas de posição, também chamadas de medidas separatrizes, são o quartil, o decil e o percen-

til (centil).

8.4.1 Quartil (Q)Quartis São valores de x que subdividem os termos de uma distribuição,

quando dispostos em ordem crescente ou decrescente de apresentação, em quatro partes iguais, cada uma reunindo 25% das observações. Há, portanto, em uma distribuição de frequência, três quartis:

• Primeiro quartil (Q1 ou P25) – Corresponde ao valor abaixo do qual está situado um quarto (25%) dos dados da série, e as três quartas partes res-tantes (75%) estão acima dele. A fórmula para encontrar Q1 é:

Posição (Qn

1

1

4)= +

• Segundo quartil (Q2) – Corresponde ao valor que subdivide os valores observados em duas partes iguais. É, portanto, a própria mediana (Q2 = Md). A posição é calculada por:

Posição (Qn n

2

2 1

4

1

2)

( )= + = +

• Terceiro quartil (Q1 ou P75) – Corresponde ao valor abaixo do qual estão situados três quartos (75%) dos dados da série, e quarta parte restante (25%) está acima dele. A fórmula para encontrar Q3 é:

Posição (Qn

3

3 1

4)

( )= +

BIOESTATISTICA_Vol_01.indb 276 25/06/12 17:13

Page 277: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Parâmetros da distribuição de frequências 277

•Amplitude interquartílica (AIQ) – Corresponde à diferença entre o valor do terceiro quartil (Q3) e o valor do primeiro quartil (Q1). Corresponde aos 50% dos dados que ocupam a posição mais central da distribuição. A amplitude interquartílica é menos afetada pelos valores extremos do que a amplitude e o desvio padrão, o que faz desta medida a melhor escolha quando a distribuição de frequência apresenta alto grau de assimetria.

AIQ Q Q= −3 1

• Fórmulaparadadosagrupadosemclassesdefrequência

Q l hq fac

fiq i

fii

i ANTi

= +−

= ∑

inf onde:. , .44

Sendo: Qi = Valor do quartil. i = 1, 2, 3. linf = Limite inferior da classe quartílica h = Amplitude da classe quartílica. qi = Posição do elemento quartílico. facANT = Frequência acumulada anterior à classe quartílica. fi = Frequência da classe quartílica.

8.4.2 Decil (D)Os decis são os nove valores que dividem uma distribuição de frequência

em 10 partes iguais.

• Fórmulaparadadosnãoagrupadosemclassesdefrequência

D iN

i= +

. ,

1

10

onde: Di = Valor do decil. i = 1, 2, 3, ..., 9. N = Número de observações do conjunto de dados.

BIOESTATISTICA_Vol_01.indb 277 25/06/12 17:13

Page 278: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental278

• Fórmulaparadadosagrupadosemclassesdefrequência

D l hd fac

fi

fii

i ANT

i= +

= ∑

inf onde: d i. ,110

Sendo: Di = Valor do decil. i = 1, 2, 3...,9. linf = Limite inferior da classe decílica. h = Amplitude da classe decílica. di = Posição do elemento decílico. facANT = Frequência acumulada anterior à classe decílica. fi = Frequência da classe decílica.

8.4.3 Centil ou Percentil (P)

Os centis ou percentis são os noventa e nove valores que dividem uma distribuição de frequência em cem partes iguais.

• Fórmulaparadadosnãoagrupadosemclassesdefrequência

P iN

i= +

. ,

1

100onde: Pi = Valor do percentil.

i = 1, 2, 3, ..., 99.N = Número de observações do conjunto de dados.

• Fórmulaparadadosagrupadosemclassesdefrequência

P l hp fac

fip i

fii

i ANTi

= +−

= ∑

inf onde:. , .1100

Sendo: Pi = Valor do percentil. i = 1, 2, 3...,99. linf = Limite inferior da classe percentílica. h = Amplitude da classe percentílica. pi = Posição do elemento percentílico.

BIOESTATISTICA_Vol_01.indb 278 25/06/12 17:13

Page 279: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Parâmetros da distribuição de frequências 279

facANT = Frequência acumulada anterior à classe percentílica. fi = Frequência da classe percentílica.

• Relação geral das medidas separatrizes

O Quadro 8.6 mostra a relação geral entre as medidas separatrizes. Note que, no quadro, Md = Q2 = D5 = P50.

Quadro 8.6 – Relação geral entre as medidas de posição (separatrizes)

Mediana| - - - - - - - - - - - - - - - - - - - | - - - - - - - - - - - - - - - - - - - |

Md

Quartis| - - - - - - - - - | - - - - - - - - - | - - - - - - - - - | - - - - - - - - - |

Q1 Q2 Q3

Decis| - - - | - - - | - - - | - - - | - - - | - - - | - - - | - - - | - - - | - - - |

D1 D2 D3 D4 D5 D6 D7 D8 D9

Percentis| - - - | - - - | - - - | - - - | - - - | - - - | - - - | - - - | - - - | - - - |

P10 P20 P30 P40 P50 P60 P70 P80 P90

• Fórmula geral para medidas separatrizes (dados agrupados)

As medidas de posição para valores agrupados podem ser calculadas pela fór-mula geral mostrada abaixo. A ordem da medida separatriz k e o divisor w devem ser utilizados conforme o quadro a seguir.

S lh Fac

fi

N k

wKANT=

−inf+

p, onde: p =

.( ) .

Sendo: Sk = Medida separatriz (Md, Qi, Di, Pi). Para: k = Ordem da medida separatriz. w = Divisor. p = Posição da observação. fi = Frequência da classe.

SK k wMd 1 2Qi 1, 2, 3 4Di 1, 2, ..., 9 10Pi 1, 2, ..., 99 100

N = Número de observações do conjunto de dados.

Exemplo: Determine os valores correspondentes a Q1, Q3, D4, P90 e a ampli-tude interquartílica da série de dados relacionados na Tabela 8.9.

BIOESTATISTICA_Vol_01.indb 279 25/06/12 17:13

Page 280: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental280

Tabela 8.9 – Peso ao nascer de 250 crianças nascidas vivas na maternidade A, em 2008

Peso (kg) ix if Fac1,5 |— 2,0 1,75 8 8

2,0 |— 2,5 2,25 32 40

2,5 |— 3,0 2,75 62 102

3,0 |— 3,5 3,25 70 172

3,5 |— 4,0 3,75 44 216

4,0 |— 4,5 4,25 24 240

4,5 |— 5,0 4,75 10 250

Total – Σf = 250 –

Solução

•Cálculo de Q1: (k = 1; w = 4)

p= ( : ver emN k

wi Fac

h

f

., )

,

= × = =

=

250 1

462 50 3

0 5

ii

ANT

f

l

Fac

= =

==

362

2 5

40

inf ,

Cálculo: Q lh Fac

fi

ANT1

2 50 5 62 50 40

622 6=

−= + − =inf+

p.( ),

, .( , ), 88 kg

Interpretação: 2,68 kg representam o peso abaixo do qual estão 25% das crianças nascidas vivas na maternidade A.

•Cálculo de Q3 : (k = 3; w = 4)

p= ( : ver emN k

wi Fac

h

., )

,

= × = =

=

250 3

4187 50 5

0 55

44

3 5

172

5f f

l

Fac

i

ANT

= =

==

inf ,

BIOESTATISTICA_Vol_01.indb 280 25/06/12 17:13

Page 281: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Parâmetros da distribuição de frequências 281

Cálculo: Q lh Fac

fi

ANT3

3 50 5 187 50 172

443=

−= + − =inf+

p.( ),

, .( , ),,68 kg

Interpretação: 3,68 kg representam o peso abaixo do qual estão 75% das crianças nascidas vivas na maternidade A.

•Cálculo de D4 : (k = 4; w = 10)

p= ( : ver emN k

wi Fac

h

f

.)

,

= × = =

=

250 4

10100 3

0 5

ii

ANT

f

l

Fac

= =

==

362

2 5

40

inf ,

Cálculo: D lh Fac

fi

ANT4

2 50 5 100 40

443 18=

−= + − =inf+

p.( ),

, .( ), kkg

Interpretação: 3,18 kg representam o peso abaixo do qual estão 40% das crianças nascidas vivas na maternidade A.

•Cálculo de P90 : (k = 90; w = 100)

p= ( : ver emN k

wi Fac

h

.)

,

= × = =

=

250 90

100225 6

0 55

24

4 0

216

6f f

l

Fac

i

ANT

= =

==

inf ,

Cálculo: P lh Fac

fi

ANT90

4 00 5 225 216

244 1=

−= + − =inf+

p.( ),

, .( ), 99 kg

Interpretação: 4,19 kg representam o peso abaixo do qual estão 90% das crianças nascidas vivas na maternidade A.

BIOESTATISTICA_Vol_01.indb 281 25/06/12 17:13

Page 282: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental282

• Cálculo da Amplitude Interquartílica

AIQ Q Q= − = − =3 1

3 68 2 68 1, , kg

8.4.4 Gráfico Box Plot (box-and-whisker plot)Também conhecido como diagrama de Tukey, o gráfico box plot é muito

utilizado nas áreas das ciências biológicas e da saúde, e tem como parâme-tros de referência a mediana, o primeiro e o terceiro quartis, além de exibir o menor e o maior valor da distribuição. Este tipo de gráfico, que pode ser representado no plano cartesiano, consiste em um retângulo (box) que se estende de Q1 a Q3, e uma linha que se estende do menor valor até Q1, e de Q3 até o maior valor. Uma linha, que corresponde à mediana, divide o retân-gulo em duas partes. Na prática, pode-se, também, desenhá-lo, tomando-se a média aritmética e o desvio padrão ou erro padrão. Aqui, utilizaremos apenas a mediana. Outra vantagem do box plot é a detecção de valores outliers na distribuição.

Sua utilidade é para verificar a assimetria de uma distribuição, sendo mais apropriado quando o conjunto de dados é muito pequeno, tal que sua demonstração em um histograma não pode ser bem representada. Por exem-plo, o coeficiente de assimetria de Pearson (Ap) é baseado na diferença entre a média aritmética e a moda, ao passo que, no gráfico box plot, a simetria ou a inclinação da curva são verificadas pela posição da mediana em relação aos dois quartis, Q1 e Q3. Se a linha da mediana está posicionada próxima ao centro do retângulo, isto indica que a distribuição é simétrica. Por outro lado, se a mediana está deslocada para a esquerda do centro do retângulo, a distribuição é inclinada positivamente; se para a direita, a distribuição é inclinada negativa-mente. O comprimento das duas linhas, que se estendem, uma, do menor valor até Q1, e a outra, de Q3 até o maior valor, também podem ser utilizadas como indicadores da simetria ou inclinação.

Nota: a denominação box-and-whisker plot advém do fato das linhas dese-nhadas a partir do retângulo, apresentarem um aspecto semelhante aos fios do bigode de um gato (whisker).

BIOESTATISTICA_Vol_01.indb 282 25/06/12 17:13

Page 283: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Parâmetros da distribuição de frequências 283

• Construindo um gráfico box plot

Para que se possa construir um gráfico box plot são necessários o cálculo de cinco valores estatísticos: a mediana, o primeiro e terceiro quartis, e o maior e menor valores da distribuição.

Exemplo: Os dados abaixo se referem ao tempo de espera, em minutos, dos usuários de um lava-jato de automóveis. O proprietário deseja conhecer algumas informações a respeito do tempo de espera de seus clientes, tal como: quanto tempo demora uma lavagem? Dentro de qual intervalo de tempo a maioria das lavagens são completadas?

Tempo de espera(min)

88 77 70 80 74 82 85 96 76 67 80 75 73 93 72

Os valores devem ser ordenados de forma crescente.

Tempo de espera(min)

67 70 72 73 74 75 76 77 80 80 82 85 88 93 96

Então:Menor valor = 67 minutosPrimeiro quartil (Q1) = 73 minutosMediana (Md) = 77 minutosTerceiro quartil (Q3) = 85 minutosMaior valor = 96 minutos

•Passo 1 – Criar uma escala apropriada ao longo do eixo horizontal.•Passo 2 – Desenhar um retângulo cujo comprimento inicia em Q1 (73 minu-

tos) e termina em Q3 (85 minutos).•Passo 3 – No interior do retângulo, traçar uma linha vertical no valor que

corresponde à mediana (77 minutos).•Passo 4 – Traçar uma linha horizontal que se estende do retângulo ao

menor valor (67 minutos), e outra que se estende do retângulo ao maior valor (96 minutos).

BIOESTATISTICA_Vol_01.indb 283 25/06/12 17:13

Page 284: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental284

 

Fig. 8.10 – Gráfico box plot da distribuição de frequência dos tempos de espera

dos clientes de um lava-jato

Interpretandoográfico: o box plot mostra que 50% das lavagens ocorrem no espaço de tempo compreendido entre 73 min e 85 min. A amplitude inter-quartílica equivale a 12 minutos. O gráfico também mostra que a distribuição é inclinada positivamente (para a direita). Neste caso, duas informações indicam esta inclinação: primeiro, a linha à direita do retângulo, que se estende de Q3 (85 min) até o maior valor (96 min), é maior que a linha situada à esquerda do retângulo, a qual se estende de Q1 (73 min) até o menor valor (67 min); em outras palavras, 25% dos dados, maiores que o terceiro quartil, apresentam uma amplitude maior que os 25% dos dados que são menores que o primeiro quartil. A segunda indicação é que a mediana não está posicionada no centro do retângulo. Ela encontra-se visivelmente deslocada para a esquerda. Ou seja, a distância entre Q1 (73 min) e a mediana (77 min) é menor que a distância entre a mediana e Q3 (85 min). Embora essas distâncias sejam diferentes, o número de lavagens entre elas é igual para ambas; isto é, o número de lavagens entre 73 min e 77 min é igual ao número de lavagens entre 77 min e 85 min.

• Detectando valores outliers

Em um conjunto de dados, um valor outlier corresponde a uma medida inconsistente ou discrepante, que apresenta um valor relativamente maior ou menor aos demais valores da distribuição. A detecção de sua presença é sem-pre muito importante, uma vez que pode causar distorções nos parâmetros de uma amostra, em especial, na média aritmética, sendo a sua ocorrência mais frequente quando a distribuição de frequência dos dados, da amostra ou

BIOESTATISTICA_Vol_01.indb 284 25/06/12 17:13

Page 285: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Parâmetros da distribuição de frequências 285

da população, apresenta um alto grau de inclinação, com tendência a incluir valores extremamente grandes ou pequenos em relação aos demais valores da distribuição.

As causas da ocorrência de um valor outlier podem ser:

•Medidas incorretas (inválidas) – Esta situação costuma ocorrer quando o pesquisador utiliza equipamentos descalibrados ou defeituosos para a medição de suas variáveis; ou quando a leitura do dado observado é incor-reta, por desatenção do observador; ou quando o valor de uma observação é registrado incorretamente no banco de dados.

•Medidas de fonte diferente – Ocorre quando a medida, mesmo que corre-tamente mensurada, pertence a uma população diferente daquela de onde os dados em estudo foram retirados.

•Medidas raras – Nesta condição, a medida foi registrada corretamente e pertence à mesma população de onde foi retirada toda a amostra, mas é resultante de um evento raro.

Portanto, qualquer que seja a causa do valor outlier, o bom senso manda que ele seja retirado do conjunto de dados, e, se possível, substituído por uma nova observação. Neste sentido, dois são os métodos utilizados para que se possam detectar valores outliers: o primeiro é o métodográfico, que utiliza o box plot; o segundo é o método numérico, que utiliza os valores z (z-escore). Geralmente, ambos produzem resultados idênticos.

Métodográfico

Este método, que utiliza o gráfico box plot, é bastante preciso, uma vez que os valores do primeiro e do terceiro quartil não são afetados pelos valores extremos de uma distribuição, isto é, por valores outliers.

Para aplicação do método, é necessário calcular, no gráfico box plot, dois limi-tes, um interno e outro externo, em ambos os lados do retângulo. O limite interno corresponde ao ponto situado à distância de 1,5 vezes a amplitude interquartílica (1,5 x AIQ), a partir das laterais do retângulo, enquanto que o limite externo é determinado pela distância de três vezes a amplitude interquartílica (3 x AIQ), tam-bém, em ambos os lados do retângulo. A Figura 8.11 mostra esses limites.

BIOESTATISTICA_Vol_01.indb 285 25/06/12 17:13

Page 286: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental286

Exemplo:

 

Fig. 8.11 – Gráfico box plot. As linhas tracejadas mostram os limites internos e externos

utilizados para detecção de valores outliers

Os valores situados entre os limites interno e externo, em ambos os lados do retângulo, são considerados valores outliers potenciais, os quais são valo-res extremos que representam observações relativamente raras, uma vez que, em uma distribuição gaussiana, menos que 1% dos valores são esperados que estejam posicionados fora dos limites internos calculados para a distribuição.

Do mesmo modo, os valores situados além dos limites externos são con-siderados como valores outliers verdadeiros, isto porque, na distribuição normal, menos que 0,01% das medidas são esperadas que estejam situadas fora dos limites externos calculados para a distribuição.

No exemplo dado, nenhum valor da distribuição está situado além do limite interno. Portanto, não existem valores outliers na amostra selecionada. Na prática, programas estatísticos, tal como o BioEstat, calculam e demons-tram, visualmente, no gráfico box plot, a presença de valores outliers.

Método numérico

Este método considera uma observação como um valor outlier quando o valor z para esta observação é maior que três, em valor absoluto, isto é, sem considerar o sinal. Para transformar uma observação em valor z, ver item 8.2.4 (desvio padrão).

Embora os dois métodos geralmente forneçam resultados semelhantes, note que a presença de valores outliers pode superestimar a variância da distribuição

Limite interno inferior = Q AIQ11 5− , ( )

= 73 1 5 12− , ( )

= 773 18 55− = min

BIOESTATISTICA_Vol_01.indb 286 25/06/12 17:13

Page 287: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Parâmetros da distribuição de frequências 287

e, consequentemente, o desvio padrão. Isto diminuirá as chances de que um valor extremo possa ser detectado com um valor z menor que três, em valor absoluto.

8.5 ERRO PADRÃO DA MÉDIA (Sx ) Em estatística, o erro padrão da média é definido como o desvio padrão de

uma população de médias amostrais, em vez de observações individuais, e é igual ao desvio padrão dividido pela raiz quadrada do tamanho da amostra. É calculado pela fórmula:

EP Ss

Nx

= =

Embora aparentemente difícil, este conceito é bastante fácil de ser entendido quando se conhece a aplicação do erro padrão da média: medir a variabilidade de um conjunto de médias de uma mesma população, em vez da variabilidade das observações individuais, como o faz o desvio padrão. Ou seja, o erro padrão nos dá uma idéia de quão variável pode ser a média retirada de uma população. Por exem-plo, responda intuitivamente: qual dos procedimentos teria mais chance de mostrar a verdadeira média populacional, se tomássemos uma mostra de n elementos ou se medíssemos toda a população? É claro que seria medir a população como um todo, procedimento este que, na maioria dos casos, não é possível de ser feito. Na prática, trabalhamos, quase sempre, com amostras.

Do mesmo modo, quando se obtém uma amostra aleatória de tamanho n, de uma população, o objetivo é estimar a média populacional. Porém, é razoável supor que, se uma outra amostra for retirada da mesma população, a média desta segunda amostra será algo diferente da primeira. Assim, se retirarmos várias amostras, estas estarão sujeitas a uma dada variação, e formarão, portanto, uma população de médias amostrais. Essa variação na composição das amostras depende do erro aleatório e é conhecida como erro amostral, e o erro padrão da média estima a variação desta população de médias.

Portanto, ao se retirar de uma população todas as possíveis amostras aleatórias de tamanho n, obter-se-á um conjunto de médias amostrais, que, se tomadas cada uma delas como se fosse uma observação individual, e representadas em um histograma,

BIOESTATISTICA_Vol_01.indb 287 25/06/12 17:13

Page 288: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental288

este mostrará uma curva denominada Distribuição Amostral das Médias (DAM), a qual segue os padrões da distribuição normal gaussiana, sendo o desvio padrão dessa distribuição, o próprio erro padrão. Por conseguinte, quanto maior o número o das amostras, mais a forma da distribuição amostral das médias (DAM) se aproxima da forma da curva normal gaussiana, qualquer que seja a forma da distribuição na população, isto é, mesmo que a distribuição da variável na população não seja normal. A este princípio estatístico dá-se o nome de Teorema do Limite Central.

Assim, como a distribuição amostral das médias segue o padrão da curva normal gaussiana, a área total sob ela é iguala a 1, com 68% das médias, aproximadamente, situadas no intervalo entre µ−EP e µ+EP , ao passo que, aproximadamente 95% estão entre o intervalo de µ−2EP e µ+2EP .

Na prática, a distribuição amostral das médias pode ser considerada como nor-mal sempre que n ≥ 30 e, quanto maior o tamanho da amostra n, menor será o erro padrão e melhor será a estimativa da média da população.

Isto posto, podemos afirmar que o erro padrão é um parâmetro que per-mite ao pesquisador fazer dois tipos de inferência: estimar o tamanho provável do erro ao redor dos estimadores estatísticos, como a média, por exemplo, e realizar testes de significância estatística para verificação de hipóteses. Essas duas aplicações serão demonstradas ainda nesta parte do livro.

Exemplo: Os valores abaixo se referem às estaturas, em centímetros, de uma amostra de cinco rapazes, cujo desvio padrão é igual a 3,84 cm. Determinar o erro padrão da média para a amostra considerada.

Estatura (cm): 178 180 185 176 184

EP = cms

N= = =3 84

5

3 84

2 241 71

, ,

,,

Distribuição amostral das médias versus significância

estatística

Uma das aplicações do erro padrão da média é estabelecer uma diferença significativa entre dois valores, tal como a diferença entre a média da amostra ( )x e a verdadeira média da população ( )µ .

BIOESTATISTICA_Vol_01.indb 288 25/06/12 17:13

Page 289: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Parâmetros da distribuição de frequências 289

Para uma distribuição normal, considera-se como não-significativos todos os desvios resultantes de valores situados ao redor da verdadeira média da população, que, arbitrariamente, corresponde a 95% dos valores observa-dos, com a metade (47,5%) deles situados abaixo da média, enquanto a outra metade (47,5%) está situada acima da média. Para esse intervalo de desvios não-significativos dá-se o nome, na curva normal gaussiana, de região de não-

-significância, a qual é indicada por C. Por outro lado, os desvios resultantes de valores situados fora deste intervalo são considerados desviossignifican-

tes, os quais correspondem a uma fração alfa (α) do total dos valores possíveis da distribuição, e indicam a região designificância, também conhecida como níveldesignificância, que equivale a α = 1 – C. Note que estes valores são arbi-trários, sendo os mais utilizados na área das ciências da saúde o valor α = 0,05 e α = 0,01, e que a região de significância está igualmente distribuída em duas áreas que correspondem às caudas direita e esquerda da curva. A Figura 8.12 mostra as áreas de significância e não-significância na curva normal gaussiana.

 

Fig. 8.12 – Regiões de significância (α/2) e não-significância (C) para os desvios situados na

curva normal gaussiana

8.6 INTERVALO DE CONFIANÇA (IC)

Em estatística, define-se como intervalo de confiança (ou estimativa intervalar), o intervalo de valores que apresenta uma probabilidade calculada de conter o verdadeiro valor de um parâmetro populacional desconhecido. Isto é, em vez de estimar o parâmetro por um valor único, o intervalo de

BIOESTATISTICA_Vol_01.indb 289 25/06/12 17:13

Page 290: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental290

confiança fornece um intervalo de estimativas possíveis (ou prováveis) para aquele parâmetro, sendo, portanto, a maneira mais usual de estimativa por intervalo. Ou seja, ele determina os limites inferior e superior, dentro do qual espera-se encontrar, probabilisticamente, o verdadeiro valor da variável esti-mada, dando-nos a ideia de que temos um determinado nível de confiança que a verdadeira média da população, de onde foi retirada amostra, encontra--se naquele intervalo.

Na prática, os intervalos de confiança indicam a confiabilidade de uma estimativa e podem ser usados para descrever quão confiáveis são os resulta-dos de uma pesquisa. Por exemplo: o desvio padrão mostra a variabilidade de um conjunto de dados, quando considerados individualmente, ao passo que o erro padrão mostra a variabilidade de um conjunto de médias retiradas destes mesmos dados. Assim, com base na curva normal gaussiana, podemos afirmar que a média ± 1,96DP ( , )x s±1 96 estima o intervalo no interior do qual se esperaria que 95% dos valores observados na amostra estivessem situados, enquanto que, a média ± 1,96EP ( , )x s

x±1 96 estima o intervalo no interior

do qual se esperaria que 95% das médias das amostras de uma população esti-vessem situadas. A esta relação, média ± 1,96EP, dá-se o nome de intervalo

deconfiançade95% (IC95%), que corresponde ao intervalo, no interior do qual o pesquisador pode ter 95% de certeza de que a verdadeira média da população está situada. Outros intervalos de confiança, como o IC99%, podem, também, ser calculados. As fórmulas mais usuais são mostradas a seguir:

IC x EP90 1 645% ,= ± IC x EP95 1 96% ,= ± IC x EP99 2 58% ,= ±

•Níveldeconfiança(1–α) – É a probabilidade de que o intervalo de con-fiança contenha o verdadeiro valor do parâmetro.

Exemplo: Em um quartel, o comandante está interessado em saber se a estatura dos soldados da Quinta Companhia de Guardas está dentro dos padrões exigidos pela corporação. Com tal finalidade, ele selecionou, aleatoriamente, uma amostra constituída por 10 soldados, cujas estaturas, em centímetros, estão expressas no quadro abaixo. Qual o intervalo de confiança de 95% para a média de todos os soldados da Quinta Companhia de Guardas?

BIOESTATISTICA_Vol_01.indb 290 25/06/12 17:13

Page 291: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Parâmetros da distribuição de frequências 291

Estatura (cm):178 180 185 176 186

183 179 182 178 184

•Dados: n =10 x =181 10, cm e s =3 38, cm

•Cálculo do erro padrão (EP)

EPs

N

= = = =3 38

10

3 38

3 161 07

, ,

,, cm

• Cálculodointervalodeconfiançade95%(IC95%)

IC x EP IC95 1 96 95 181 10 1 96 1 07% , % , ( , )( , )= ± ∴ = ±

IC95 181 10 2 08% , ,= ±

IC95 181 10 2 08 179 0% , , ,= − = 22 (limite inferior)

= +181 10 2, ,, ,08 183 18= (limite superior)

cmIC95 179 02% ,= << <µ 183 18, cm

• Interpretação do resultado: a verdadeira média das estaturas dos soldados da Quinta Companhia de Guardas está situada no intervalo com-preendido entre 179,02 cm e 183,18 cm, com 95% de certeza. Ou seja, aproximadamente 95% dos soldados desta Companhia têm estatura com-preendida no referido intervalo.

Intervalo de confiança versus significância de um desvio

entre x e µ

Uma das aplicações do intervalo de confiança é comparar se existe diferença estatisticamente significativa entre a média calculada para uma amostra ( )x e a verdadeira média da população (µ) de onde a amostra foi retirada. Tomando-se o exemplo anterior, o comandante deseja saber se a média da estatura dos sol-dados da Quinta Companhia de Guardas difere da média das estaturas de todos os soldados do quartel? Os dados antropométricos de toda a guarnição mostram uma média para a estatura igual a 172,40 cm, com desvio padrão igual a 5,20 cm.

BIOESTATISTICA_Vol_01.indb 291 25/06/12 17:13

Page 292: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental292

Neste caso, para que se possa saber se a média do grupo (181,10 cm) se desvia significativamente da média de toda a guarnição de soldados (172,40 cm), é necessário que se conheçam quais são os limites do intervalo dos des-vios não-significativos para as médias da guarnição, considerando-se um nível de significância α = 5%. Isto é, deve-se conhecer o intervalo de confiança de 95% para as médias de todos os soldados do quartel. Este procedimento toma por base o intervalo µ ± 1,96EP que determina uma região de 95% no centro da curva DAM, a qual corresponde à regiãodenão-significância (C), e duas regiões de 2,5% situadas uma em cada cauda da curva, denominadas de região

designificância (α). Assim, temos:

• Cálculo do erro padrão: EPn

= cmσ = = =5 20

10

5 20

3 161 64

, ,

,,

•Cálculodointervalodeconfiança:

IC EP IC95 1 96 95 172 40 1 96 1 64% , % , ( , )( , )= ± ∴ = ±µ

IC95 172 40 3 21% , ,= ±

IC95 172 40 3 21 169 1% , , ,= − = 99 (limite inferior)

= +172 40 3, ,, ,21 175 61= (limite superior)

cmIC95 169 19% ,= << <µ 175 61, cm

Portanto, uma vez calculado o IC95%, é interessante notar que as médias amostrais cujos valores estão situados entre os limites de 169,19 cm e 175,61 cm não apresentam desvios significativos em relação à verdadeira média da população (172,40 cm), enquanto que, as médias com valores situados fora desse intervalo apresentam desvios significativos. Assim, como a média obtida para os 10 soldados (181,10 cm) situa-se fora da região de não-significância, podemos afirmar que ela desvia-se significativamente da verdadeira média da corporação militar, apresentando-se mais elevada.

Valor z versus significância de um desvio entre x e µ

Uma maneira mais simples de avaliar se um desvio é significativo ou não, em relação à média populacional, consiste em padronizar o desvio em unida-

BIOESTATISTICA_Vol_01.indb 292 25/06/12 17:13

Page 293: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Parâmetros da distribuição de frequências 293

des de erro padrão, e, posteriormente, comparar o valor obtido com o valor crítico (zα) escolhido. Este método baseia-se no seguinte princípio: uma média amostral desvia-se significativamente da verdadeira média populacional se o seu valor for, ao menos, 1,96 erros padrão maior ou menor que esta. Ou seja, um desvio será significativo se estiver situado a uma distância superior que zα erros padrão em relação à média populacional; e não-significativo, se a distân-cia for menor que zα erros padrão. Os passos são os seguintes:

• Escolheroníveldesignificância: α = 0,05 (5%).•Buscar o valor crítico de z na tabela normal: z0,05 =1,96.•Calcular o desvio, em erros padrão, entre x e µ:

zx

n

calc= − = − = =µ

σ181 10 172 40

5 20

10

8 70

1 645 30

, ,

,

,

,,

•Regra de decisão: Se | zcalc | < valor crítico (zα), então o desvio é não-significativo.

Se | zcalc | ≥ valor crítico (zα), então o desvio é significativo.

Conclusão: a média da estatura da amostra de soldados da Quinta Companhia de Guardas desvia-se significativamente da média da estatura dos soldados da corporação, pois zcalc é maior que o valor crítico (1,96) para α = 0,05.

Outras fórmulas• Intervalo de confiançapara estimar a diferença entre duasmédias

amostrais

IC x x zs

n

s

n

zx x

951 2 2

1

2

1

2

2

2

1 2 1 2

% ( )

( ) ( )

/= − ± +

=− − −

α

µ µ

σ11

2

1

2

2

2n n

(A média da amostra está situada a 5,30 erros padrão acima da ver-dadeira média da população).

BIOESTATISTICA_Vol_01.indb 293 25/06/12 17:13

Page 294: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental294

•Intervalodeconfiançaparaumaproporção

IC p z

p p

n

zp p

p p

n

951

1

2% ˆ

ˆ( ˆ )

ˆ

( )

/= ± −

= −

α

Onde: p̂p

==Proporção populacional estimada.

Proporçãoo em uma amostra.

• Intervalo de confiança para estimar a diferença entre duasproporções

IC p p zp p

n

p p

n

z

951 1

1 2 21 1

1

2 2

2

% ( ˆ ˆ )ˆ ( ˆ ) ˆ ( ˆ )

/= − ±

−+

=

α

(( ˆ ˆ ) ( )

( ) ( )

p p p p

p p

n

p p

n

1 2 1 2

1 1

1

2 2

2

1 1

− − −

−+

BIOESTATISTICA_Vol_01.indb 294 25/06/12 17:13

Page 295: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

9Distribuição de Probabilidades

Em estatística, o objetivo maior é obter informações sobre uma deter-minada característica de uma população de interesse, mediante a análise de informações coletadas a partir de uma amostra, sendo essas características representadas por variáveis aleatórias pré-definidas no início do estudo. Como o próprio termo indica, uma variável aleatória é aquela cujos participan-tes do estudo são randomicamente selecionados, sendo ela uma informação estatística que pode variar, de um indivíduo para o outro, por influência do acaso, independentemente da ação do investigador. Desse modo, é sempre desejável que se possa prever o valor que uma variável aleatória pode assu-mir em um determinado experimento, de tal forma que se possa conhecer o comportamento de sua distribuição de frequência, mesmo que com algum grau de incerteza.

Porém, com base na teoria das probabilidades, jamais será possível prever o que vai ocorrer com uma variável em um dado experimento, pois sempre existe a influência do acaso, ou da incerteza, sobre o desfecho da vari-ável em estudo; no entanto, ela nos permite prever o que pode ocorrer com a variável, além de fornecer a chance (probabilidade) da ocorrência de cada um dos seus possíveis desfechos, isto é, pode prever a probabilidade da ocor-rência de um determinado evento, embora não possa prever qual o evento

BIOESTATISTICA_Vol_01.indb 295 25/06/12 17:13

Page 296: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental296

irá acontecer. Assim, tal como os valores característicos de uma determinada variável aleatória podem ser resumidos em uma tabela chamada distri-

buição de frequência, também, as probabilidades das ocorrências de uma determinada variável podem ser expressos em tabelas e gráficos chamados distribuição de probabilidade. Com essa finalidade, duas funções são utili-zadas para relacionar os valores de uma variável aleatória e a probabilidade de suas ocorrências: função de densidade de probabilidade, utilizada para representar a distribuição de probabilidade de uma variável aleatória con-tínua; e a função de distribuição acumulada, que descreve a distribuição da probabilidade de uma variável aleatória de valor real X assumir um valor igual ou menor que x.

Assim, diversas distribuições de probabilidade teóricas podem ser utili-zadas em estatística, das quais, três delas são muito úteis na área das ciências biológicas e da saúde. São elas: a distribuição normal (gaussiana), para a qual a variável aleatória assume valores medidos em escala dimensional, isto é, a variável é contínua; e as distribuições binomial e de Poisson, cuja variável é discreta. A seguir, passaremos a discutir cada uma delas.

9.1 DISTRIBUIÇÃO NORMAL (GAUSSIANA)

A distribuição normal, uma das mais importantes distribuições da estatística paramétrica, é também conhecida como curva de distribuição normal, curva de Gauss ou Gaussiana, e foi primeiramente desenvolvida pelo matemático francês Abraham de Moivre1 (1667-1754). Sob o aspecto gráfico, a distribuição normal de probabilidades é descrita como uma curva em forma de sino, unimodal e simétrica, com a maioria dos seus valores se concentrando em torno de sua média e, à medida que se afastam do cen-tro, as observações são cada vez mais raras, sendo, portanto, descrita como uma distribuição teórica. Essa distribuição, além de descrever uma série de fenômenos físicos e biológicos, possui grande uso na estatística inferencial, sendo inteiramente descrita por seus dois parâmetros: a média, simbolizada

1. Matemático francês famoso pela Fórmula de De Moivre, que relaciona os números complexos com a trigonometria, e por seus trabalhos na distribuição normal e na teoria das probabilidades.

BIOESTATISTICA_Vol_01.indb 296 25/06/12 17:13

Page 297: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Distribuição De probabiliDaDes 297

pela letra grega µ (mi), e o desvio padrão, representado pela letra grega σ (sigma), sendo σ a distância horizontal entre a média e o ponto de inflexão da curva2. Os valores da variável x são representados no eixo horizontal, a frequência dos valores de x são representadas no eixo vertical, e a média de

x corresponde à projeção do ponto de frequência máxima da curva. A seguir, a Figura 9.1 mostra a relação entre a curva normal e o histograma da distri-buição de frequência da amostra.

 

Fig. 9.1 – Relação entre a curva normal gaussiana e o histograma da distribuição de frequência

da amostra

Desse modo, como a distribuição normal corresponde a uma distribui-ção de probabilidade, a área sob sua curva é igual a 1, ou 100%, com metade da área situada à direita da média, e metade à esquerda, podendo, portanto, ser utilizada para cálculo de probabilidades. Assim, conhecendo-se seus parâmetros, consegue-se determinar qualquer probabilidade da ocorrên-cia de uma variável, pois a probabilidade de uma observação assumir um valor entre dois pontos quaisquer é igual à área compreendida entre esses dois pontos.

Por sua vez, uma descrição empírica pode ser feita por uma equação numé-rica que represente a função densidade de probabilidade da distribuição

normal com média μ e desvio padrão σ, sendo definida pela equação:

2. Corresponde ao ponto no qual a curva passa de convexa a côncava.

BIOESTATISTICA_Vol_01.indb 297 25/06/12 17:13

Page 298: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental298

P X x

xx( ) exp

( )= = − −

−∞< < +∞1

2 2

2

2σ π

µσ

,

Se a variável aleatória X segue esta distribuição, escreve-se, então X ~ N(μ,σ). Se μ = 0 e σ = 1, a distribuição é chamada de distribuição normal

padrão e a função de densidade de probabilidade reduz-se a:

f xx

( ) exp= −

1

2 2

2

π

Contudo, em razão da complexidade para o cálculo da função de probabi-lidade, utiliza-se, na prática, a Tabela Normal Padrão ou Normal Reduzida

(distribuição z), elaborada pela normalização da variável x (ver Tabelas no final deste livro), cuja fórmula será mostrada adiante, no item 9.1.2.

Assim, a principal importância da distribuição normal está na sua apli-cação prática nos testes de hipótese, pois ela constitui a base da inferência estatística, mesmo quando a população não está normalmente distribuída. Porém, na prática, muitas variáveis têm distribuição normal, tais como o peso ao nascer ou as estaturas de pessoas adultas, e muitos testes estatísticos são baseados, ou na distribuição normal ou em distribuições a ela relacionadas, como as distribuições t, F ou qui-quadrado, especialmente quando o número de observações é grande. Contudo, estes testes requerem que as variáveis analisadas sejam normalmente distribuídas na população, ou seja, que elas atendam à condição de normalidade. Por outro lado, não se deve usar um teste estatístico baseado na distribuição normal para analisar dados de variáveis que não são normalmente distribuídas. Neste caso, deve-se optar por testes não-paramétricos, mesmo que estes sejam menos robustos em identificar uma diferença significante. Entretanto, quanto mais o tamanho da amostra aumenta, mais a forma da Distribuição Amostral das Médias (DAM) se aproxima da forma da normal, mesmo que a distribuição da variável na população não seja normalmente distribuída, e, para n > 30, o Teorema

do Limite Central garante a convergência da média amostral para o padrão de normalidade.

BIOESTATISTICA_Vol_01.indb 298 25/06/12 17:13

Page 299: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Distribuição De probabiliDaDes 299

9.1.1 Características da curva normalEmbora algumas dessas características já tenham sido anteriormente

citadas, por questões didáticas elas serão novamente apresentadas. São as seguintes:

• É contínua, unimodal e tem a forma de um sino, cujas extremidades se estendem cada vez mais próximas ao eixo horizontal (eixo x), sem jamais tocá-lo, determinando uma figura aberta nas caudas. Isto é, suas caudas são ditas assintóticas3. Isto significa que, teoricamente, os valores assu-midos para x podem variar de – ∞ a + ∞.

• Apresenta-se simétrica em relação à média (µ) e, portanto, a média, a mediana e a moda são coincidentes.

• Possui dois pontos de inflexão, que correspondem aos valores de x situa-dos à distância de um desvio padrão (σ) acima e abaixo da média.

• A área total da curva, delimitada pela linha base, é igual a 1 ou 100% e abrange o total dos dados da distribuição.

• Aproximadamente 68% das observações estão situadas no intervalo entre um desvio padrão acima e abaixo da média aritmética.

• Aproximadamente 95,4% das observações estão situadas no intervalo entre dois desvios padrão acima e abaixo da média aritmética.

• Aproximadamente 99,7% das observações estão situadas no intervalo entre três desvios padrão acima e abaixo da média aritmética.

Outras características:

• 90% das observações estão situadas no intervalo entre 1,645 desvios padrão acima e abaixo da média.

• 95% das observações estão situadas no intervalo entre 1,96 desvios padrão acima e abaixo da média (esta é a relação mais frequentemente

utilizada para análises na área das ciências da saúde).• 98% das observações estão situadas no intervalo entre 2,33 desvios padrão

acima e abaixo da média.• 99% das observações estão situadas no intervalo entre 2,58 desvios padrão

acima e abaixo da média.

3. Assíntota - Termo da geometria analítica que significa uma reta que é tangente a uma curva no infinito. Do grego asymptotas, ‘que não pode coincidir’ (Dicionário Aurélio).

BIOESTATISTICA_Vol_01.indb 299 25/06/12 17:13

Page 300: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental300

A Figura 9.2 mostra as relações do desvio padrão na curva normal.

 

Fig. 9.2 – Relações do desvio padrão na curva normal gaussiana

Note que, para efeito de comparação entre duas ou mais curvas, as dis-tribuições com o mesmo desvio padrão e diferentes médias possuem formas semelhantes, mas diferem quanto à localização em relação ao eixo horizontal (Figura 9.3), enquanto que distribuições com o mesmo valor de média e valores diferentes de desvio padrão, apresentam amplitudes diferentes (Figura 9.4). Aquelas com desvio padrão de maior valor se apresentam mais abertas, com maior variabilidade dos seus dados em relação à média, ao passo que, aquelas que apresentam um valor menor para o desvio padrão, possuem menor disper-são dos dados em torno de suas médias.

 

Fig. 9.3 – Distribuições com mesmo desvio padrão e diferentes valores de média

BIOESTATISTICA_Vol_01.indb 300 25/06/12 17:13

Page 301: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Distribuição De probabiliDaDes 301

 

Fig. 9.4 – Distribuições com o mesmo valor de média e diferentes desvios padrão

9.1.2 Curva normal padronizada (reduzida) Embora a curva normal represente uma importante ferramenta estatística,

sua aplicação prática é somente descrever, com base na média (µ) e no desvio padrão (σ), os valores de x dentro de uma distribuição. Todavia, como os valo-res de µ e σ podem variar livremente, para cada par de valores atribuídos a µ e σ, existe uma curva normal característica, o que leva a uma infinidade de cur-vas. Portanto, em razão dessa pluralidade, torna-se necessária a adoção de uma curva modelo que padronize todas as outras, pela transformação dos valores reais de x em valores relativos. Essa distribuição, que é tomada como referên-cia, é chamada de curva normal padronizada ou curva normal reduzida, a qual, por convenção, apresenta média (µ) = 0 e desvio padrão (σ) = 1. Com este procedimento, qualquer curva normal com média ≠ 0 e desvio padrão ≠ 1 pode ser convertida em curva normal padronizada pela transformação de cada valor de x em uma nova variável denominada z (valor z), a qual mede o afastamento, em número de desvio padrão, do valor de x em relação à média. O cálculo dos valores z é dado pela expressão:

zx

N= − ∴µσ

µ σ ( , )0 1 = 0 e = 1

Na prática, os valores referentes à área acumulada para diferentes valores

assumidos por z, encontram-se tabelados, não havendo, portanto, necessidade de ser calculados (ver tabela no final deste livro). Nesta tabela, os valores situ-ados à direita, em cada coluna, mostram as áreas sob a curva, compreendidas

BIOESTATISTICA_Vol_01.indb 301 25/06/12 17:13

Page 302: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental302

entre a média e um valor de z maior ou menor que zero. Ou seja, na tabela, é possível obter-se qualquer área sob a curva normal padronizada, situada entre cada ponto do eixo horizontal e a média. Por exemplo: para um valor z = 1 (isto é, igual a σ), a área compreendida entre este valor e a média é igual a 0,3413 (ou 34,13%). Como a distribuição é simétrica, a área situada entre z = – 1 e z = + 1 é 0,6826 (ou 68,26%). Deste modo, para que se possam calcular áreas que não estejam situadas entre 0 e z, devem ser realizadas operações de soma ou subtração com as áreas pré-determinadas.

9.1.3 Aplicação da curva normalDe modo geral, a grande aplicação da curva normal padronizada é deter-

minar, pelo cálculo da área compreendida entre os intervalos dos valores de x, a probabilidade ou a frequência relativa teórica de um dado evento. Para tanto, pressupõe-se que o valor do desvio padrão σ seja conhecido, o que, na prática, raramente acontece. Nestes casos, a alternativa é trabalhar com o desvio padrão da amostra (s), a qual deverá ser normalmente distribuída ou apresentar um valor de n > 30. Para pequenas amostras, o que geralmente acontece na área das ciências da saúde, a distribuição z deverá ser substituída pela distribuição t

de Student, desde que a amostra obedeça aos princípios de normalidade. Esta distribuição será discutida em outro capítulo. A seguir, mostraremos alguns exemplos de aplicação para a curva normal padronizada.

• Cálculo de uma área situada entre µ e x

Exemplo: em uma maternidade, o peso de crianças ao nascer apresenta uma distribuição normal, com média µ = 3.300 g e desvio padrão σ = 150 g. Para efeito de estatística interna do hospital, o administrador deseja saber qual a proporção de crianças nascidas com peso entre 3.300 g e 3.500 g?

Cálculo de z par x = 3.500 g.

zx= − = − =µσ

3 500 3 300

1501 33

. .,

A área tabelada para o intervalo z = 0 e z = 1,33 é igual a 0,4082 (40,82%).

BIOESTATISTICA_Vol_01.indb 302 25/06/12 17:13

Page 303: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Distribuição De probabiliDaDes 303

 

Resposta - A proporção de crianças nascidas com peso entre 3.300 g e 3.500 g é igual a 40,82%.

Exemplo: para os dados do exemplo anterior, qual a proporção de crianças nascidas com peso acima de 3.500 g?

• Na tabela da curva normal, temos:Área A = 0,4082 e área A + B = 0,50, logo área B = 0,50 – 0,4082 = 0,0918.

 

Resposta - A proporção de crianças nascidas com peso acima de 3.500 g é igual a 9,18%.

• Cálculo de uma área situada entre dois valores de x

Exemplo: Na mesma maternidade, o administrador deseja saber qual a quantidade de fraldas descartáveis de tamanho médio que deve ser adquirida, sabendo-se que este tamanho de fraldas serve para crianças nascidas com peso compreendido entre 2.900 g e 3.500 g?

BIOESTATISTICA_Vol_01.indb 303 25/06/12 17:13

Page 304: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental304

Os valores de z para as áreas A e B são:

z

z

A

B

= − = − = −

= −

2 900 3 300

150

400

1502 67

3 500 3 300

15

. .,

. .

00

200

1501 33= = ,

• Na tabela da curva normal, temos:Área A = 0,4962 e área B = 0,4082, logo área A + B = 0,4962 + 0,4082 = 0,9044.

 

Resposta - A quantidade de fraldas de tamanho médio deve ser igual a 90,44% do total de fraldas adquiridas pela maternidade.

Exemplo: para os dados do exemplo anterior, qual a proporção de crianças nascidas com peso abaixo de 2.900 g?

Cálculo de z para x = 2.900 g.

z = − = − = −2 900 3 300

150

400

1502 67

. .,

• Na tabela da curva normal, temos:Área B = 0,4962 e área A + B = 0,50, logo área A = 0,50 – 0,4962 = 0,0038.

BIOESTATISTICA_Vol_01.indb 304 25/06/12 17:13

Page 305: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Distribuição De probabiliDaDes 305

 

Resposta - A proporção de crianças nascidas com peso abaixo de 2.900 g é igual a 0,38%.

• Cálculo dos valores de x que limitam uma área conhecida

Exemplo: ainda para os dados do exemplo anterior, quais os valores de x que delimitam o primeiro e o terceiro quartis?

Os escores de z desejados correspondem a 0,25 da área da curva normal, em cada lado da média.

zQ1 = – 0,68 e zQ3 = + 0,68

zx x

x

Q

Q Q

Q

1

1 1

1

0 683 300

150

102

=−

∴ − =−

= −

µ

σ

logo,

,.

++ ≅3 300 3 198. . g

zx x

x

Q

Q Q

Q

3

3 3

3

3 300

150

102 3

=−

∴−

= +

µ

σ0,68=

logo,

.

.. .300 3 402≅ g

 

Resposta - Os valores de x que delimitam o primeiro e o terceiro quartis são, respectivamente: xQ1 = 3.198 g e xQ3 = 3.402 g.

BIOESTATISTICA_Vol_01.indb 305 25/06/12 17:13

Page 306: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental306

9.2 DISTRIBUIÇÃO BINOMIAL (Ensaios de Bernoulli)

Dentre todas as distribuições de probabilidade, a distribuição binomial tem sido a mais frequentemente empregada na área das ciências da saúde e tem como finalidade descrever o comportamento de uma variável dicotômica em amostras aleatórias, tomando por base o ensaio de Bernoulli4, sendo este um experimento aleatório que admite apenas duas possibilidades possíveis como resultado, mutuamente excludentes e caracterizadas por “sucesso” ou “insucesso”. Ou seja, esta distribuição é útil para fornecer a probabilidade de um desfecho ocorrer em um determinado número de ensaios independentes, quando há uma probabilidade constante de sucesso em cada ensaio, tal como cura ou doença, masculino e feminino, sucesso e fracasso, cara ou coroa em um lançamento de moedas. Assim, as variáveis que apresentam essas característi-cas, são chamadas variáveis randômicas binomiais.

Por exemplo, vamos supor que uma amostra de 100 pessoas seja selecio-nada a partir do total de alunos de uma universidade, e para cada pessoa é perguntado se ela é a favor (“cara”) ou contra (“coroa”) a um determinado ato da reitoria. Digamos que estamos interessados em saber quantos alunos são a favor (r). Agindo deste modo, a amostragem de 100 estudantes é ánaloga a um experimento com 100 arremessos de uma moeda, no qual podemos verificar o número de estudantes a favor e contra o ato do reitor, pois esta pesquisa de opinião admite somente duas respostas.

O evento descrito acima corresponde a um experimento binomial, e sua distribuição somente é aplicável se a sequência de testes forma um ensaio de Bernoulli e obedece às seguintes condições:

• Cada tentativa admite somente dois resultados, que são mutuamente excludentes, denominados, arbitrariamente, de “sucesso” e “fracasso”.

• A probabilidade de sucesso é indicada por “p” e permanece constante em todas as tentativas. Já a probabilidade de fracasso é indicada por “q”, sendo q = 1 - p.

4. Jakob Bernoulli (1654-1705) – Matemático suíço, conhecido pelas suas contribuições para a teoria da probabilidade, foi o primeiro a desenvolver o cálculo infinitesimal criado por Newton e Leibniz.

BIOESTATISTICA_Vol_01.indb 306 25/06/12 17:13

Page 307: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Distribuição De probabiliDaDes 307

• O resultado de uma tentativa não é afetado pelos resultados das outras tentativas, ou seja, as tentativas são independentes.

Assim, tomando-se como exemplo de variável binária, os resultados pos-síveis decorrentes do arremesso não viciado de uma moeda, a probabilidade de se conseguir “cara” é p = 1/2 (50%), sendo a de se conseguir “coroa” igual a q = 1 – 1/2 (50%). Deste modo, a fórmula da distribuição binomial empregada para se obter o número de sucessos em um ensaio de Bernoulli é a seguinte:

P rn

r n r

r n rp q( )!

!( )!,=

−−

onde: P = Probabilidade de ocorrência do evento (sucessos). n = Número de repetições do experimento. r = Número desejado de sucessos. n – r = Número esperado de fracassos. p = Probabilidade de sucesso. q = Probabilidade de fracasso.

! = Símbolo do fatorial de um número inteiro, onde n! = n x (n – 1) x (n -2) x ... x 1.

Ex.: 4! = 4 x 3 x 2 x 1 = 24. Por convenção, 0! = 1.

Esta fórmula permite o cálculo da probabilidade (P) de sucesso em n observações, sem que se tenha a necessidade de calcular todas as possíveis combinações do evento, pois n!/r!(n – r)! corresponde à fórmula para calcular os coeficientes no triângulo de Pascal5, o qual pode ser utilizado para o cál-culo das probabilidades da distribuição binomial.

Exemplo: Tomando-se 6 arremessos não-viciados de uma moeda, qual a probabilidade de se conseguir 3 “caras”? (“cara” = sucesso, “coroa” = insucesso).

5. Blaise Pascal (1623-1662). Filósofo, físico e matemático francês, foi autor de importantes contribuições para as Ciências Naturais Aplicadas, com as quais trabalhou para a construção da calculadora mecânica e desenvolveu estudos dos fluidos, da pressão e do vácuo.

BIOESTATISTICA_Vol_01.indb 307 25/06/12 17:13

Page 308: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental308

P( )!

!( )!, ,

(3

6

3 6 30 5 0 5

6 5 4 3 2 1

3 2 1

3 6 3=

− ( ) ( ) = × × × × ×× ×

))( )( , ) ( , ) , ,

( )

3 2 10 5 0 5 20 0 0157 0 3140

3

3 3

× ×= × =

∴ =P 331,40%.

Exemplo: Em uma determinada população, 80% das pessoas apresentam grupo sanguíneo com fator Rh positivo. Objetivando estudar a presença do fator Rh na população (sucesso), temos: Fator Rh positivo (p = 0,80) e Fator Rh negativo (q = 0,20). Qual a probabilidade que em 2 dentre 6 pessoas dessa população apresentem fator Rh positivo?

P( )!

!( )!, ,

(2

6

2 6 20 8 0 2

2 6 2=

− ( ) ( ) = × × × × ××

− 6 5 4 3 2 1

2 1)(44 3 2 1)

1,54%.

× × ×=

∴ =

( , )( , ) ,

( )

0 64 0 0016 0 0154

2P

Exemplo: tomando-se os dados do problema anterior, qual a probabilidade que, em uma amostra de 10 pessoas, 4 delas apresentem o fator Rh positivo?

P( )!

!( )!, , ( , ) ,4

10

4 10 40 8 0 2 210 0 0041 0 8

3 6 3=

− ( ) ( ) = =−

6610

4∴ =86,10%.P( )

Parâmetros da distribuição binomialSemelhante à distribuição normal, que pode ser descrita tão somente

pelos seus parâmetros da média e desvio padrão, a distribuição binomial tam-bém apresenta dois parâmetros, n e p, os quais são suficientes para descrevê-la, desde que se informe o número desejado de sucessos (valor de r). Portanto, para um determinado tipo de evento no qual se deseja calcular a probabili-dade de sucesso, essa distribuição corresponde a um conjunto de distribuições, cada uma com valores específicos para n e p. O cálculo da média e da variância na distribuição binomial são bastante simples, e são dados pelas fórmulas a seguir:

BIOESTATISTICA_Vol_01.indb 308 25/06/12 17:13

Page 309: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Distribuição De probabiliDaDes 309

Média( )µ =np Variância( )σ2 =npq Desvio padrão( )σ = npq

Na prática, não precisamos calcular todas as probabilidades de sucesso para um determinado evento aleatório, pois todos os possíveis resultados tam-bém podem ser obtidos na tabela da distribuição binomial (ver Tabelas), bastando, para tanto, procurar a probabibilidade que corresponde aos valores desejados de r, n e p. Assim, podemos utilizar a tabela da distribuição binomial para combinar diferentes probabilidades a um mesmo evento, tal como mos-trado no exemplo 4.

Exemplo: ainda com os dados do problema anterior, qual a probabilidade que, em uma amostra de 6 indivíduos, 5 ou mais deles apresentem o fator Rh positivo? Note que o problema proposto corresponde à soma das probabili-dades, que podem ser obtidas na tabela, de que 5 e 6 indivíduos selecionados apresentem o fator Rh positivo.

P(r ≥ 5) = P(r=5) + P(r=6) = 0,393 + 0,262 = 0,6550 (65,50%)

Resposta – A probabilidade é igual a 65,50%.

9.2.1 Distribuição binomial versus distribuição normalQuando da discussão da distribuição normal gaussiana, demonstramos

que, na aplicação de um teste de hipótese para variáveis paramétricas, a con-dição fundamental é que esta variável apresente-se normalmente distribuída na população. Por outro lado, quando se trabalha com proporção de sucessos para uma variável dicotômica, a distribuição a ser empregada é a distribui-

ção amostral de proporções (DAP), a qual, mesmo que P seja representado por uma fração (P = r/n), não é contínua, mas binomial, pois, para cada tama-nho de amostra existe um número limitado de possíveis valores de P. Porém, a forma da distribuição binomial aproxima-se da forma da distribuição nor-mal gaussiana quando p for pequeno e n for grande. Na prática, a distribuição binomial se aproxima da distribuição normal à medida que o número de expe-rimentos aumenta e, para n > 30, as duas curvas são muito semelhantes. Neste caso, é possível utilizar a distribuição normal para realizar testes de hipóteses

BIOESTATISTICA_Vol_01.indb 309 25/06/12 17:13

Page 310: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental310

em amostras cujas variáveis são binárias, ou seja, é possível realizar testes de hipótese com proporções de maneira semelhante à aplicada para médias arit-méticas. Para tanto, é necessário que se cumpram as seguintes condições: ser np > 5 e nq > 5.

Exemplo: No caso do exemplo anterior, supondo-se que uma amostra constituída por 20 pessoas foi selecionada, é possível a utilização da distribui-ção normal, como uma aproximação da distribuição binomial, para o teste de hipótese?

Dados: p = 0,8 e q = 0,2

np

nq

= = >

= = <

20 0 8 16 5

20 0 2 4 5

( , )

( , )

Conclusão – Não se deve usar a distribuição normal, pois np > 5 e nq < 5.

A média e o erro padrão de uma distribuição amostral de proporções (DAP) são representados por:

Média da D pAP DAP( )µ = σ

DAP

pq

n=

Portanto, se considerarmos 100 arremessos não viciados de uma moeda, sendo a probabilidade de sair “cara” (p = 0,5) igual à de sair “coroa” (q = 0,5), o erro padrão da distribuição amostral de proporções será:

σDAP

pq

n= = × = =0 5

1000 0025 0 05

,, ,

0,5

Sendo a média (µDAP) = p = 0,5, com base nas propriedades da curva nor-mal, podemos estimar que aproximadamente 68% das amostras apresentarão valores de P situados entre 0,45 e 0,55 (µDAP ± σDAP) e que cerca de 95% apresen-tarão valores de P dentro do intervalo 0,40 e 0,60 (µDAP ± 1,96σDAP ). Com base nesta aproximação com a curva normal, é possível realizar testes de hipóteses com proporções de maneira semelhante à aplicada para médias aritméticas, desde que np > 5 e nq > 5.

BIOESTATISTICA_Vol_01.indb 310 25/06/12 17:13

Page 311: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Distribuição De probabiliDaDes 311

9.2.2 Aplicação da distribuição binomialTeste de significância para uma proporção

Nas amostras suficientemente grandes, as hipóteses referentes a uma pro-porção populacional podem ser testadas de modo semelhante às hipóteses para uma média populacional. Para tanto, é necessário converter os dados em unidades padrão normalizadas (valores z), cuja fórmula é apresentada abaixo.

z

x

calc= −µ

σ

Adaptando a fórmula para proporções, temos:

zp P C

P Q

n

calc

p

p p

=− −| |

,

onde: p = Proporção de sucessos na amostra. Pp = Proporção na população de referência. Qp = 1 – Pp. C = 1/(2n) Correção de continuidade que aproxima a DAP da distri-

buição normal.

Exemplo: Para testar a capacidade da identificação do sexo (masculino ou feminino) de uma pessoa, somente pela observação visual de sua arcada dentária, cinco odontólogos foram selecionados para o estudo. A cada um deles, foram mostradas, de maneira aleatória, 20 fotografias de arcadas den-tárias, sendo 10 de pacientes do sexo masculino e 10 do sexo feminino. Foi solicitado aos profissionais que identificassem, pela observação da fotografia, o sexo de cada um dos pacientes. Como não foram observadas diferenças esta-tisticamente significativas em relação ao número de acertos dos profissionais, os dados foram reunidos em um único valor. Sessenta das 100 identificações realizadas estavam corretas. Assim, com base nos dados fornecidos, é possível a identificação do sexo de uma pessoa apenas pela observação visual de sua arcada dentária? Considerar nível de significância de 5% (α ≤ 0,05).

BIOESTATISTICA_Vol_01.indb 311 25/06/12 17:13

Page 312: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental312

Obs. – Note que a proporção esperada de acertos ao acaso é igual a 0,5, pois o evento só aceita duas respostas, com a mesma probabilidade de ocor-rência para cada uma delas.

Dados: Pp = 0,50 p = 60/100 = 0,6 C = 1/(2 x 100) = 0,005 zα/2 = 1,96

zcalc

= − −

×=| , , | ,

,

,

,

0 6 0 5 0 005

0 5

100

0 095

0 050,5==1 90,

Como: |zcalc| = 1,90 < zα/2 =1,96, então a área sob a curva corresponde à região de não-significância.

Conclusão: a proporção de acertos dos odontólogos não difere da pro-porção de acertos esperados por acaso. Não é possível identificar o sexo dos pacientes pela observação visual de suas arcadas dentárias.

Cálculo do intervalo de confiança para proporções

De modo semelhante ao calculado para médias, o intervalo de confiança para proporções também pode ser calculado pela fórmula básica. Se a amos-tra é suficientemente grande, a proporção na população de referência (Pp), geralmente desconhecida, pode ser substituída pela proporção de sucessos na amostra (p). Assim temos:

IC x z

n n

P P

n

p p= ± ∴−

ασ σ

/

( )

2

1= =EP

Convertendo a fórmula para proporções, temos:

IC p zp p

n= ± −

α/( )

2

1

BIOESTATISTICA_Vol_01.indb 312 25/06/12 17:13

Page 313: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Distribuição De probabiliDaDes 313

Exemplo: A partir dos dados do exemplo anterior, qual o intervalo de con-fiança de 95% (IC95%)? Note que, neste caso, Pp é conhecido.

IC PP P

n

IC

p p95 1 96

1

95 0 50 5 0 5

1000

% ,( )

% ,( , )( , )

,

= ±−

= ± = 55 0 05

95 0 5 0 05 0 45

±

= − =

,

% , , ,IC (limite inferior)

(limite superior)= + =0 5 0 05 0 55

95

, , ,

%IC == <0 45, Pp<0,55

Teste de significância entre as proporções de duas amostras

independentes

Este tipo de teste é utilizado quando se deseja comparar as proporções de sucesso de uma determinada característica em duas amostras independentes, sendo uma o grupo-controle e a outra o grupo-tratamento, por exemplo. Ou seja, quando se deseja saber se a proporção encontrada para uma caracterís-tica de uma amostra, difere significativamente da proporção encontrada para a mesma característica, em outra amostra. Empregam-se as seguintes fórmulas:

zp p C

p q n ncalc

A B

A B

=− −

+

| |

( / / )0 0

1 1

pr r

n n

A B

A B

0=

++

Cn nA B

= +

0 5

1 1,

onde: pA e pB = Proporção de sucessos nas amostras A e B. nA e nB = Tamanho das amostras A e B.

BIOESTATISTICA_Vol_01.indb 313 25/06/12 17:13

Page 314: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental314

p0 = Proporção de sucessos considerando as duas amostras A e B. q0 = 1- p0. rA e rB = Número de sucessos nas amostras A e B. C = Correção de continuidade que aproxima a DAP da distribuição

normal.

Exemplo: Uma indústria alimentícia desejava testar a efetividade de dois tipos de embalagem A e B, para a conservação de um determinado produto, por um período de seis meses de prateleira (shelf-life). Duas amostras foram coletadas, sendo 100 do produto armazenado com a embalagem A, e 100 com a embalagem B. Como resultado, obteve-se: a embalagem A conservou 94 dos 100 produtos embalados, enquanto a embalagem B conservou 72. Existe dife-rença estatisticamente significante entre as proporções encontradas para as duas embalagens?

Dados: pA = 94/100 = 0,94 pB = 72/100 = 0,72 nA = 100 nB = 100 rA = 94 rB =72

C = +

= ×

= +

0 51

100

1

1000 5

94 70

, , 0,02=0,01

p22

100 1000 83 1 0 83 0 17

0 9

0+= ∴ = − =

=

, , ,

| ,

q

zcalc

44 0 72 0 01

0 83

0 2− −

×=, | ,

,

,

0,17(1/100+ 1/100)

11

0 0543 88

,,=

Como: |zcalc| = 3,88 > zα/2 =1,96, então a área sob a curva corresponde à região de significância.

Conclusão: Existe diferença estatisticamente significante entre as proporções de sucessos para as duas embalagens. A embalagem A é mais efe-tiva quando comparada à embalagem B.

BIOESTATISTICA_Vol_01.indb 314 25/06/12 17:13

Page 315: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Distribuição De probabiliDaDes 315

Cálculo do intervalo de confiança para diferença entre duas proporções

Em algumas situações, é necessário estimar o intervalo de confiança (IC) para a verdadeira diferença entre duas proporções populacionais. O cálculo é efetuado utilizando-se a fórmula a seguir.

IC P P p p zp p

n

p p

nA B A BA A

A

B B

B

( )( ) ( )

/− = − ±

−+

−α 2

1 1

Onde: pA e pB = Proporção de sucessos nas amostras A e B. nA e nB = Tamanho das amostras A e B.

Exemplo: Para os dados do exemplo anterior, qual o intervalo de confiança de 95% para a verdadeira diferença entre as proporções de sucesso das emba-lagens A e B?

IC95 0 94 0 72 1 960 94 0 06

100

0 72% , , ,

, , ,= − ± × + × 0,,28100

95 0 22 0 18

0 22 0 1

IC % , .

, ,

= ±

= − 88 0 04

0 22

=

= +

,

,

(limite inferior)

00 18 0 40

95 0 04

, ,

% ,

=

= < −

(limite superior)

IC P PA BB

<0 40,

Conclusão: A verdadeira diferença na porcentagem entre as embala-gens A e B está situada no intervalo entre 4% e 40%.

9.3 DISTRIBUIÇÃO DE POISSON

Descrita originalmente por Siméon Poisson6, esta é uma distribuição de probabilidades para variáveis randômicas, útil para descrever o número de

6 Siméon-Denis Poisson (1781-1840) – Matemático, geômetra e físico francês, foi um dos mais notáveis cientistas do século XVIII.

BIOESTATISTICA_Vol_01.indb 315 25/06/12 17:13

Page 316: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental316

eventos raros que podem ocorrer em um período específico de tempo, ou em uma determinada área ou em um determinado volume, sendo a unidade de medida sempre contínua, porém com a ocorrência da variável aleatória apresentando uma distribuição discreta, homogeneamente distribuída na população. Assim, de modo semelhante ao ensaio de Bernoulli, excetos que os eventos ocorrem de modo contínuo, em vez de ocorrerem em tentativas, a dis-tribuição de Poisson segue as seguintes características:

• O experimento consiste na contagem do número de vezes que um evento ocorre durante uma determinada unidade (intervalo) de tempo, determi-nada área ou volume (ou peso, distância etc).

• A probabilidade de um evento ocorrer em uma determinada unidade (intervalo) de tempo, área ou volume é a mesma para todas as unidades estudadas.

• A ocorrência de um evento em um intervalo de tempo, área ou volume não tem qualquer efeito sobre a probabilidade da ocorrência de um segundo evento, ou seja, a ocorrência dos eventos é independente.

• O número de eventos que ocorrem em uma unidade (intervalo) de tempo, área ou volume é independente do número de ocorrências em outras uni-dades (intervalos).

• O número médio de sucessos para a ocorrência do evento é representado pela letra grega lambda (λ).

Se r for a ocorrência de algum evento aleatório em um intervalo de tempo, espaço ou volume, a probabilidade da ocorrência de r (distribuição de pro-babilidade de Poisson), a média e a variância são calculadas pelas seguintes fórmulas:

P re

r

r

( )!,=

−λ λonde:

µ λ σ λ= =e2

r = Número de sucessos (assume valores 0, 1, 2, ...).e = 2,7183 (base dos logaritmos neperianos).λ = Número médio de sucesso por amostra, onde λ = np.

BIOESTATISTICA_Vol_01.indb 316 25/06/12 17:13

Page 317: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Distribuição De probabiliDaDes 317

São exemplos de variáveis randômicas para as quais a distribuição de Poisson é uma boa opção para o cálculo das probabilidades:

• Número de casos de uma doença rara e uma população;• Número de animais de uma espécie rara, existentes em uma área

geográfica;• Número de árvores doentes em uma determinada área de uma floresta;• Números de organismos em suspensão encontrados em uma amostra

de água;• Número de produtos defeituosos encontrados em uma linha de produ-

ção etc.

A distribuição de Poisson é o modelo ideal para substituir a distribuição binomial (ensaio de Bernoulli) quando o número de observações ou ensaios for muito grande (n > 30) e p ou 1– p for pequeno (np > 5 e n < 1– p < 5).

Exemplo: Em uma indústria de panificação, uma máquina automática que empacota um determinado tipo de biscoito, em embalagens de 1 kg, produz 6 unidades fora do peso especificado a cada 1.000 pacotes embalados. Qual a probabilidade que, em um lote de 200 unidades, sejam encontrados 8 pacotes fora do peso padrão?

Dados: n = 200 pacotes. p = 6/1.000 = 0,006 Se, µ = λ = n.p, então µ = 200 x 0,006 = 1,2

Pe

r

r

( )!

( , ) ( , )

!

,

.

,

81 2 2 7183

8

1 2951

40

8 1 2

= = =− −λ λ

33200 00003= ,

Resposta – A probabilidade é igual a 0,003%.

Exemplo: Para os dados do exemplo anterior, qual a probabilidade que, em 500 unidades, não haja nenhum pacote com o peso fora do padrão especificado pela fábrica?

BIOESTATISTICA_Vol_01.indb 317 25/06/12 17:13

Page 318: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental318

Dados: n = 500 pacotes. p = 6/1.000 = 0,006 Se, µ = λ = n.p, então µ = 500 x 0,006 = 3,0

P

e

r

r

( )!

( , ) ( , )

!

,,0

3 0 2 7183

0

0 0498

10 0498

0 3

= = = =− −λ λ

Resposta – A probabilidade é igual a 4,98%.

BIOESTATISTICA_Vol_01.indb 318 25/06/12 17:13

Page 319: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

10Inferência Estatística

e Teste de Hipóteses

Nesta parte do livro, referente à estatística descritiva, foram enfatizados o estudo das variáveis aleatórias, a distribuição de frequência e seus respec-tivos parâmetros, com destaque para a utilização das medidas de tendência central e de dispersão, assim como das distribuições de probabilidades como meio de descrever amostras e populações. Até aqui, não nos preocupamos em comparar dados amostrais com dados populacionais, ou mesmo efetuar a comparação estatística entre duas ou mais amostras ou populações. Porém, frequentemente, o pesquisador é levado, como consequência de seus experi-mentos, a formular hipóteses sobre o fenômeno estudado, a comparar dados de diferentes amostras ou populações e tomar decisões sobre parâmetros ou distribuições populacionais com base em informações coletadas a partir de dados amostrais. Tais decisões, chamadas de decisões estatísticas, servem para que o pesquisador possa fazer inferências estatísticas sobre a popu-lação estudada e têm como consequência a rejeição ou a aceitação de suas hipóteses, também chamadas de hipóteses estatísticas, caso estas sejam verdadeiras ou falsas.

Portanto, neste procedimento de tomada de decisão, para aceitar ou rejei-tar uma hipótese anteriormente formulada, o pesquisador deverá seguir um rígido processo chamado de teste de hipótese, o qual é baseado em métodos estatísticos bem definidos e deve ser revestido de profundo rigor científico.

BIOESTATISTICA_Vol_01.indb 319 25/06/12 17:13

Page 320: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental320

Assim, com base neste princípio, descreveremos, neste capítulo, todo o pro-cesso de tomada de decisões, o qual deve ser seguido por um pesquisador para que ele possa, de maneira correta, testar suas hipóteses científicas.

10.1 INFERÊNCIA ESTATÍSTICA

É definida como um conjunto de operações estatísticas cuja finalidade é extrair conclusões a respeito de uma determinada população, a partir da análise de informações qualitativas e quantitativas coletadas em amostras reti-radas dessa população. Tal procedimento pressupõe que um teste de hipótese deva ser realizado, o qual tem como finalidade verificar se uma determinada afirmação (a hipótese) sobre a população em questão, geralmente sobre um parâmetro desta, pode ser aceita como verdadeira ou se deve ser rejeitada, dependendo se os dados encontrados na amostra confirmem ou não tal afir-mação. Ou seja, é o teste de hipótese realizado com a aplicação de métodos estatísticos que fornece a medida de precisão sobre a veracidade ou não da afirmação, uma vez que a inferência estatística, sem uma medida da confiabili-dade, é algo que não difere de uma simples adivinhação. Por exemplo: em um experimento para testar uma nova droga, com base nos dados coletados a par-tir de uma amostra da população, o pesquisador poderá inferir, após testar sua hipótese, se a referida droga é eficiente ou não na cura de determinada doença.

Dessa forma, podemos concluir que a inferência estatística é um processo que provê, ao pesquisador, meios para que ele possa decidir sobre a hipótese formulada, além de informar sobre a margem de erro da decisão. Este pro-cesso admite dois princípios básicos, a estimação de parâmetros e o teste de hipótese. O processo de testar hipótese, por ser mais complexo, será discutido, posteriormente, em um item à parte.

10.1.1 Estimação de parâmetrosA estimativa de parâmetros populacionais é realizada a partir dos dados

coletados de uma amostra extraída da população, sendo, o estimador, uma função das observações usadas para estimar um parâmetro da população e, o valor encontrado para o estimador, chamado de estimativa. Assim, através da

BIOESTATISTICA_Vol_01.indb 320 25/06/12 17:13

Page 321: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

InferêncIa estatístIca e teste de hIpóteses 321

teoria da estimação, pode-se, pela análise de uma amostra aleatória, estimar um parâmetro populacional desconhecido. Portanto, com base nesse princípio, a estimação de parâmetros admite dois tipos de estimativas: a estimativa pon-

tual e a estimativa por intervalo.

Estimativa pontual

É quando, a partir de uma amostra aleatória representativa da população, o pesquisador obtém um valor único para o estimador, de tal maneira, que esse valor represente o verdadeiro valor do parâmetro na população. Por exemplo: seja variável aleatória pressão arterial, homogeneamente distribuída em uma dada população, e cujos valores dos parâmetros populacionais da média (µ) e da variância (σ2) são desconhecidos. Se uma amostra aleatória é extraída da população, a média x e a variância s2 dessa amostra podem ser utiliza-das como estimadores pontuais dos parâmetros populacionais µ e σ2. Deste modo, se o pesquisador deseja estimar a média e a variância da pressão arte-rial em uma população, e uma amostra de 30 indivíduos revela x =148 mmge s2 34= mmHg , então esses valores são tomados como estimativas pontuais para os parâmetros populacionais µ e σ2.

Como é fácil perceber, o valor do parâmetro populacional é, na maioria dos casos, um valor desconhecido, pois raramente podemos medir toda uma população. Deste modo, para que possamos estimá-lo, utilizamos um estima-dor, o qual se refere a uma fórmula matemática que será aplicada aos dados da amostra. Por exemplo, a média aritmética de uma amostra é um estimador do parâmetro média aritmética da população, e a estimativa é o valor que o estima-dor assume para uma amostra em particular, e somente para aquela amostra, pois as estimativas variam de amostra para amostra. Assim, para cada amostra diferente temos diferentes estimativas, e estas são calculadas de acordo com uma mesma fórmula matemática, que é o próprio estimador.

Estimativa por intervalo

Neste tipo de estimativa, é calculado um intervalo de confiança em torno da estimativa pontual, no interior do qual se admite que esteja situado o ver-dadeiro parâmetro populacional. Esta maneira de estimar o parâmetro é mais confiável, pois fornece elementos para que se possa calcular a precisão da esti-

BIOESTATISTICA_Vol_01.indb 321 25/06/12 17:13

Page 322: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental322

mativa. Por exemplo: na estimativa pontual, o cálculo é feito a partir de uma amostra única, embora possamos extrair várias amostras, cada uma delas com um valor diferente. Neste caso, se a amostra for representativa da população, ela tende a gerar um valor muito próximo ao do valor do parâmetro populacio-nal, mas não igual. Porém, como a estimativa é baseada em uma única amostra, não há como saber o quão próximo do verdadeiro valor da população ela é. Logo, para se ter confiança quanto à estimação do verdadeiro valor populacio-nal, deve-se gerar, a partir do valor calculado para a amostra, um intervalo de possíveis valores para o parâmetro populacional.

Assim, quanto maior a amplitude do intervalo, maior será a confiança (probabilidade) que ele contenha o verdadeiro valor populacional. Ou seja, para cada amplitude do intervalo, existe uma probabilidade 1 – α de que ele contenha o parâmetro populacional, sendo 1 – α chamado de nível de con-

fiança, onde α representa a probabilidade do erro, isto é, a probabilidade de que o intervalo não contenha o verdadeiro valor do parâmetro populacional. Tradicionalmente, adota-se α = 1%, 5% ou 10%, e a escolha do nível de con-fiança depende da precisão que se deseja estimar o parâmetro. As fórmulas para calcular o intervalo de confiança foram demonstradas no capítulo que trata sobre os parâmetros da distribuição de frequência.

10.2 TESTE DE HIPÓTESE ESTATÍSTICA

Como foi definido no início deste livro, o objetivo de qualquer pesquisa científica é generalizar, para uma população, todo e qualquer conhecimento científico obtido a partir de uma observação ou de um experimento realizado sobre uma amostra. Assim, além da questão da pesquisa, que precisa ser defi-nida no início do estudo, o pesquisador deve formular sua hipótese a respeito do fenômeno a ser estudado e planejar todo o seu trabalho, de modo que, ao final do experimento, a hipótese possa ser testada, pois, nesta fase, ele pre-cisa decidir se ela deve ser aceita como verdadeira ou se deve ser refutada como falsa.

Nesse sentido, uma hipótese estatística corresponde a uma afirmação provisória que é feita a respeito do valor de um parâmetro populacional,

BIOESTATISTICA_Vol_01.indb 322 25/06/12 17:13

Page 323: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

InferêncIa estatístIca e teste de hIpóteses 323

tomando-se por base os dados fornecidos pela amostra, a qual foi retirada desta população. O parâmetro em questão pode ser uma média, uma proporção ou qualquer outra informação estatística. Porém, para que seja revestida de valor científico, a hipótese precisa ser formulada de modo que possa ser submetida a um teste estatístico, para que, ao final do estudo, seja confirmada como ver-dadeira, caso os dados encontrados sejam coerentes com ela, ou refutada como falsa, se os dados forem incoerentes com suas previsões. A este processo, dá-se o nome de teste de hipótese.

Deste modo, o principal objetivo do teste de hipótese é fornecer ao pes-quisador ferramentas que permitam a ele validar ou refutar sua hipótese, mediante a aplicação de um teste estatístico apropriado. Logicamente, a decisão quanto à validação ou não da hipótese formulada somente se dará com 100% de certeza se toda a população for estudada, isto é, se o verdadeiro valor do parâmetro populacional, como a média µ, por exemplo, for conhecida. Porém, o mais comum é que o pesquisador desconheça o verdadeiro valor do parâmetro populacional, sendo este o motivo pelo qual ele está realizando o estudo com a utilização de amostras.

De qualquer maneira, os testes de hipóteses sempre comparam o valor cal-culado para o parâmetro amostral com o valor que se esperaria encontrar na população estudada, ou comparam os valores de amostras coletadas a partir de diferentes populações, e confirmam se esses valores são iguais ou não. Isto é, um teste de hipótese tem como fundamento fazer comparações entre as médias ou proporções calculadas a partir dos dados colhidos das variáveis estudadas, em amostras de duas ou mais populações, buscando encontrar semelhanças ou diferenças entre elas.

Por exemplo: suponha que, em uma indústria alimentícia, um pesquisa-dor queira testar a eficiência de um novo tipo de embalagem A, em termos de tempo de conservação, em dias, para um determinado tipo de alimento, e com-pará-la com a embalagem B, já tradicionalmente utilizada pela indústria. Para isso, ele seleciona uma amostra de 60 unidades de cada tipo de embalagem e mede tempo médio de conservação de cada uma delas, para posterior compa-ração. Inicialmente, o pesquisador deve ter uma hipótese formulada sobre os tempos de conservação para os dois tipos de embalagem. Digamos que a hipó-tese formulada é que o tempo médio de conservação da embalagem A é igual

BIOESTATISTICA_Vol_01.indb 323 25/06/12 17:13

Page 324: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental324

ao tempo médio de conservação da embalagem B. Assim, somente após aplicar o teste estatístico comparando as duas médias de tempo de conservação, o pes-quisador poderá decidir se sua hipótese é verdadeira ou falsa.

10.2.1 Tipos de hipóteses estatísticasAntes que possa ser testada, a hipótese inicialmente formulada pelo pesqui-

sador deve ser transformada em um modelo estatístico que permita a comparação dos parâmetros em estudo. Isto é, a hipótese original deve ser transformada em uma hipótese estatística. Os tipos de hipóteses estatísticas são:

Hipótese nula ou de nulidade (H0)

É aquela a estabelecer que os valores dos parâmetros que estão sendo comparados são iguais. Ou seja, não há diferença entre as populações de onde foram retiradas as amostras. Em outras palavras: pressupõe que as amostras foram extraídas da mesma população. Tomando o exemplo anterior, temos como hipótese nula a seguinte afirmação: o tempo médio de conservação para a embalagem A é igual ao tempo médio de conservação para a embalagem B. Isto é, não há diferença entre os tempos de conservação para as duas embala-gens. Ou, H0: µA = µB.

Pelos princípios da metodologia científica, a hipótese nula é sempre a primeira a ser formulada, o que parece ser uma incoerência, pois parece sem sentido começar um processo de comparação afirmando que algo não é verda-deiro, que não existe diferença. Porém, é muito mais fácil rejeitar uma hipótese do que provar que ela é verdadeira, pois, se os dados não são coerentes com a hipótese, ela deve ser rejeitada. Por outro lado, se os dados são coerentes, isso não prova que a hipótese formulada seja verdadeira, uma vez que outras hipó-teses podem igualmente ser consideradas.

Hipótese alternativa (HA ou H1)

É a hipótese que contraria a hipótese de nulidade. É aquela que estabelece que os valores dos parâmetros comparados são diferentes. Isto é, há diferença entre as populações de onde foram retiradas as amostras. Assim, pelos prin-cípios da metodologia científica, a hipótese alternativa é aquela a ser tomada

BIOESTATISTICA_Vol_01.indb 324 25/06/12 17:13

Page 325: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

InferêncIa estatístIca e teste de hIpóteses 325

como verdadeira caso a hipótese nula seja refutada, sendo, portanto, aquela que, em geral, o investigador quer ver confirmada em seu experimento.

Tomando novamente o exemplo anterior, temos como hipótese alternativa a seguinte afirmação: o tempo médio de conservação para a embalagem A é dife-rente do tempo médio de conservação para a embalagem B. Isto é, há diferença entre os tempos de conservação das duas embalagens estudadas. Ou, H1: µA ≠ µB.

Note que nesta fase inicial do processo, o pesquisador ainda não pode afirmar se o tempo de conservação da embalagem A é maior ou menor que o tempo da embalagem B, uma vez que o experimento ainda não foi realizado, por isso, na hipótese alternativa, ele apenas afirma que há diferença entre os tempos.

Aqui, é importante frisar que a hipótese que sempre será testada é a hipó-tese nula, a qual pode ser rejeitada ou não, com a hipótese alternativa sendo considerada somente nos casos em que a hipótese nula for rejeitada. Deste modo, para que o pesquisador possa decidir se aceita ou se rejeita a hipótese nula, ele terá que seguir algumas regras, as quais são baseadas em um teste estatístico que será aplicado ao final do estudo. Assim, tomando como referên-cia o resultado do teste, ele terá de escolher uma das duas alternativas abaixo:

• Aceitar a hipótese nula (H0) – A hipótese de nulidade deverá ser aceita sempre que a diferença entre os valores do parâmetro comparado, como a média, por exemplo, não mostrar evidências suficientes que, de fato, este parâmetro foi calculado a partir de amostras retiradas de diferentes popu-lações, sendo a diferença encontrada atribuída a uma ocorrência casual, isto é, a um erro amostral aleatório. Ou seja, a diferença não é real, mas, somente devido ao acaso. Assim, µA = µB.

• Rejeitar a hipótese nula (H0) – A hipótese nula deverá ser rejeitada sem-pre que o pesquisador tenha evidências suficientes de que ela é falsa. Isto é, se ele conseguir provar, pela aplicação do teste estatístico, que a dife-rença encontrada entre os valores calculados para o parâmetro estudado é real, que não ocorreu por acaso. Ou seja, a hipótese nula deverá ser rejei-tada quando a diferença encontrada é grande demais para ser explicada somente pelo acaso, em consequência do erro amostral. Assim, µA ≠ µB.

BIOESTATISTICA_Vol_01.indb 325 25/06/12 17:13

Page 326: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental326

10.2.2 Fundamentos do teste de hipótesePara explicar os fundamentos de um teste de hipótese, tomemos como

ilustração o exemplo da indústria alimentícia que queria testar a eficiência de um novo tipo de embalagem A, em termos de tempo de conservação para um determinado tipo de alimento, e compará-la com a embalagem B, já tradicio-nalmente utilizada pela indústria. Um estudo anterior já havia revelado que a embalagem B apresenta um tempo médio de conservação de 120 dias, com desvio padrão de 22 dias. Para isso, a indústria seleciona uma amostra de 60 unidades da embalagem A e mede tempo médio de conservação para posterior comparação com o tempo da embalagem B. Os dados estão expressos abaixo.

Embalagem A: Embalagem B:

x

n

A=

=

132

60

x

s

B

B

=

=

120

22

dias.

dias.

Com base nessas informações, a indústria pode concluir que o tempo de conservação da embalagem A é estatisticamente diferente do tempo de conser-vação da embalagem B?

Note que, nesta situação, o pesquisador da indústria está interessado em fazer uma inferência acerca de uma média de uma população que já é conhecida, no caso em questão, sobre a média do tempo de conservação da embalagem B. Assim, o que ele quer decidir é se a média do tempo de conservação da emba-lagem A, de fato, é maior que a média do tempo de conservação da embalagem B. Do seu ponto de vista inicial, a hipótese nula é que as médias não são esta-tisticamente diferentes, a menos que o teste estatístico forneça uma evidência convincente do contrário. Portanto, as hipóteses nula e alternativa são:

Hipótese nula (H0): x xA B

=Hipótese alternativa (H1): x x

A B≠

Desta forma, como pode a indústria decidir que existe evidência suficiente

para concluir que os tempos de conservação das duas embalagens são diferen-

BIOESTATISTICA_Vol_01.indb 326 25/06/12 17:13

Page 327: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

InferêncIa estatístIca e teste de hIpóteses 327

tes? Como neste caso, que o tempo de conservação da embalagem A é maior que da embalagem B. Essa evidência convincente somente ocorrerá, em favor da hipótese alternativa quando o valor de x

A exceder o valor de x

B em uma

quantidade tal que não possa ser atribuída a uma simples variação amostral aleatória, ou seja, que não possa ser atribuída ao acaso. Assim, para decidir, o pesquisador escolhe um teste estatístico, no caso, o valor z, que mede a dis-tância, em número de desvios padrão, entre o valor de x

A e x

B. Portanto, se,

na distribuição normal gaussiana, a distância entre xA

e xB

for além daquilo que se esperaria somente por acaso, a hipótese nula será rejeitada e a hipótese alternativa automaticamente aceita como verdadeira.

Ora, se a inferência é sobre uma média populacional µ, é razoável utilizar a média amostral x

B para fazer a inferência, uma vez que as mostras aleatórias

de 60 embalagens selecionadas ao acaso, apresentarão médias que se distri-buem segundo a curva normal gaussiana, com desvio amostral das médias (DAM) σ σ

xn= / . Do mesmo modo, como a distribuição de frequência dos

valores normalizados (valores z) sempre tem uma média igual a zero desvio padrão, e um desvio padrão igual a 1 (desvio padrão), então a população de embalagens B é tomada como referência, isto é: x

B= =µµ0 120 dias.

Portanto, uma vez escolhido o teste estatístico (valor z), o próximo passo é escolher o nível de significância α, o qual mostra, na curva normal gaussiana, a região de não-significância (de rejeição de H0), e determina o número máximo de desvios padrão (zα) que define se a diferença entre x

A e x

B é ou não esta-

tisticamente significativa. Assim, considerando-se α = 0,05, temos z0,05 = 1,96. Logo, uma diferença entre x

A e x

B de até 1,96 desvios padrão é considerada

como não-significativa, isto é, que ocorreu por acaso. A Figura 10.1 mostra a região de rejeição do teste na curva normal gaussiana.

Observando a Figura 10.1, podemos concluir que a chance do valor xA

=132 estar posicionado a mais do que 1,96 desvios padrão de distância, acima de x

B=120 , isto é, na região de rejeição, é somente 2,5%, se, de fato, a

verdadeira média µ for igual a 120 dias. Desta forma, se o valor da média amos-tral x

A=132 estiver além de 1,96 desvios padrão acima de x

B=120 , ou H0 é

verdade porque um evento relativamente raro ocorreu, ou HA é a hipótese ver-dadeira e o valor de x

A difere significativamente do valor de x

B. Neste caso,

BIOESTATISTICA_Vol_01.indb 327 25/06/12 17:13

Page 328: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental328

como na maioria das vezes, pode-se descartar a ocorrência de um evento raro e rejeitar a hipótese nula, e concluir que a hipótese alternativa é a verdadeira.

 

Fig. 10.1 – Curva normal gaussiana mostrando a região de rejeição para a diferença entre e

Bem, uma vez que o fundamento foi totalmente compreendido, é hora de aplicar o teste estatístico para calcular quantos desvios padrão x

A=132 dista

de xB =120 . Se o desvio não for significativo, conclui-se que não existe dife-rença estatística entre x

A e x

B, aceitando-se, então, a H0 como verdadeira. Mas

se o desvio for significativamente grande, é provável que exista, de fato, uma diferença entre x

A e x

B. O teste estatístico é dado por:

Note que zcalc = 1 significa que xA

=132 está a um desvio padrão acima de x

B=120 ; um valor 1,5z = significa que x

A=132 está a 1,5 desvios padrão

acima de xB

=120 , e assim, sucessivamente. O resultado obtido mostra que xA

dista 4,22 desvios padrão em relação à xB

, sendo esta distância maior que o valor z0,05 = 1,96 tomado como referência, podendo ser considerada como um desvio significativo, pois a distância é maior do que aquela que se espera-ria encontrar somente por acaso, por sorte que, se, de fato, a população tiver

zx x

n

calc

A

x

A=−

=−

= − = =µ

σµ

σ0 0 132 120

22

60

12

2 844 22

,,

BIOESTATISTICA_Vol_01.indb 328 25/06/12 17:13

Page 329: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

InferêncIa estatístIca e teste de hIpóteses 329

a média igual a 120 dias, é muito pouco provável que se obtenha, ao acaso, uma média amostral igual a 132 dias, para uma amostra de 60 embalagens. Portanto, neste caso, é mais razoável que o pesquisador rejeite a hipótese nula (H0), de que as duas embalagens têm o mesmo tempo de conservação, e aceite a hipótese alternativa (HA), que o tempo de conservação para a embalagem A é maior que o tempo para a embalagem B.

10.2.3 Tipos de erro na verificação de hipótesesToda inferência estatística está sujeita a erros de decisão, uma vez que toda

conclusão sobre uma população é feita com base no estudo de uma amostra. Isto acontece porque, ao rejeitar a hipótese nula (H0), o pesquisador admite que a diferença entre os valores do parâmetro estudado seja uma diferença real, verdadeira; porém, quando a hipótese nula não é rejeitada, a diferença é atribuída ao erro amostral, o qual é decorrente do erro aleatório. Neste sentido, além do fator aleatório, outras podem ser as causas que contribuem para um erro de decisão, tais como, o erro de sistematização do método e o tamanho inadequado da amostra selecionada. Assim, ao decidir se os dados são compa-tíveis ou incompatíveis com a hipótese formulada, o pesquisador está sujeito a dois tipos de erro:

Erro alfa ou erro tipo I

Também chamado de erro falso positivo, essa situação ocorre quando o pesquisador afirma que existe uma diferença verdadeira entre os valores encontrados para o parâmetro, quando, de fato, a diferença não existe, sendo explicada somente pelo erro amostral, decorrente do acaso. Isto é, o pesquisa-dor rejeita a hipótese nula, afirmando que ela é falsa, quando, efetivamente, ela é verdadeira. Este tipo de erro, que é mais frequente quando o pesquisador tra-balha com pequenas amostras, geralmente n < 10, ou quando compara diversos grupos simultaneamente, apresenta uma probabilidade α de ocorrer (P = α), a qual deve ser definida no início do estudo.

Erro beta ou erro tipo II

Também conhecido como erro falso negativo, este tipo de erro ocorre quando o pesquisador afirma que não existe diferença significativa entre os valores encontrados, quando, de fato, a diferença existe, ou seja, ela é real, pois não é decorrente do acaso. Isto é, o pesquisador aceita a hipótese nula como

BIOESTATISTICA_Vol_01.indb 329 25/06/12 17:13

Page 330: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental330

verdadeira quando efetivamente ela é falsa; ou, ele não rejeita a hipótese nula quando a hipótese alternativa é a verdadeira. A probabilidade máxima de ocor-rer um erro tipo II é representada por β, sendo mais relacionada a pequenas amostras que o erro tipo I.

No exemplo da indústria alimentícia que queria testar os dois tipos de embalagem, A e B, o erro tipo II seria o pesquisador concluir que o tempo médio de conservação da embalagem A não é diferente do tempo de conservação da embalagem B. Ou seja, seria o pesquisador não rejeitar a hipótese nula, mesmo sendo ela falsa.

O Quadro 10.1 mostra os tipos de erro de decisão e as respectivas probabilidades.

Quadro 10.1 – Tipos de erro de decisão associados à realização de um teste de hipótese, e suas

respectivas probabilidades

DECISÃOAVALIAÇÃO DO ERRO

Hipótese nula verdadeira Hipótese nula falsa

Rejeita a hipótese nula (H0)

Erro tipo IAfirma que há diferença entre

os grupos, quando não há.

Probabilidade = α

Decisão correta

Probabilidade = 1 – β

Não rejeita a hipótese nula (H0)Decisão correta

Probabilidade = 1 – α

Erro tipo IINão afirma que há diferença entre os grupos, quando há.

Probabilidade = β

10.2.4 Nível alfa e valor PComo já referido anteriormente, as decisões estatísticas sobre testes de

hipóteses estão sempre acompanhadas de incertezas, uma vez que, geralmente, se estuda uma amostra e não a população como um todo. Porém, para ajudar o pesquisador a decidir se aceita ou não uma hipótese como verdadeira, é sempre possível medir, a partir dos dados da amostra, o provável erro de sua decisão. Assim, antes de realizar qualquer tipo de cálculo estatístico para testar a hipótese de nulidade, isto é, ainda no início da pesquisa, ele deve estabelecer o nível de significância da pesquisa, também chamado de nível alfa (α), o qual é um critério que especifica a probabilidade máxima que o pesquisador está disposto a aceitar um erro do tipo I (rejeitar a hipótese H0 sendo ela ver-

BIOESTATISTICA_Vol_01.indb 330 25/06/12 17:13

Page 331: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

InferêncIa estatístIca e teste de hIpóteses 331

dadeira) ao testar a sua hipótese. Em geral, na área das ciências da saúde, o nível alfa é estabelecido em 0,05, que traduz que o pesquisador está disposto a correr um risco de 5% (não mais do que isso) de estar errado ao afirmar que a hipótese nula é verdadeira. Ou seja, que não há diferença estatisticamente sig-nificante entre os grupos estudados. Por exemplo, um nível alfa de 0,05 indica que o pesquisador assume que há 5% de probabilidade que a relação entre as variáveis estudadas seja ocasionada somente pelo acaso. Em outras palavras, sabendo-se que na população não há relação entre as variáveis, se o experi-mento de interesse fosse repetido 20 vezes, haveria apenas uma vez em que a relação seria considerada positiva.

Na prática, outros valores para o nível alfa podem ser estabelecidos, tais como: 0,01 (1%), 0,10 (10%) ou até 0,20 (20%). Porém, ao estabelecer um nível de 0,01, o investigador aumenta o rigor científico de sua pesquisa e, por conseguinte, o tamanho de sua amostra. Níveis maiores, como 0,20, por exemplo, devem ser justificados no projeto, pois as chances de erro aumentam consideravelmente.

De qualquer forma, a determinação do nível alfa, ainda no início do pro-jeto, dá à pesquisa um padrão de qualidade, pois introduz um parâmetro que estabelece um juízo de valor nas decisões do pesquisador quando dos testes de hipóteses, uma vez que mantém a ocorrência do erro de decisão sob controle.

O valor P (com letra maiúscula), também conhecido como valor crítico

amostral, só pode ser obtido por um teste estatístico, o qual é realizado ao final do estudo. Este valor fornece, como resultado da pesquisa, a probabilidade da ocorrência do erro tipo I, isto é, ele fornece a probabilidade de que a diferença observada entre os grupos estudados tenha sido obtida somente pelo acaso, em razão da variação aleatória; ou a probabilidade de que não há associação entre a exposição a um determinado fator de risco e o desfecho estudado. Ou seja, o valor P representa a probabilidade de erro envolvida em aceitar o resultado observado como válido, isto é, como representativo da população em estudo.

Observe que, enquanto o nível alfa é previamente determinado, ainda na fase de elaboração do projeto, o valor P é calculado pelo teste estatístico a partir dos dados obtidos no estudo, de modo que, ao final da pesquisa, o investigador possa comparar o valor P com o nível de significância previamente escolhido, para, então, determinar se aceita ou rejeita a hipótese nula. Lembre-se que

BIOESTATISTICA_Vol_01.indb 331 25/06/12 17:13

Page 332: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental332

o nível alfa determina a probabilidade máxima que o pesquisador aceita em cometer um erro falso-positivo, enquanto o valor P mostra a probabilidade da ocorrência deste tipo de erro quando ele decide, com base nos resultados obtidos, rejeitar a hipótese de nulidade, sendo ela verdadeira. Portanto, consi-derando-se um nível alfa de 0,05 (5%), a diferença entre os grupos estudados será considerada como estatisticamente significante quando P ≤ 0,05, sendo a hipótese nula rejeitada e a hipótese alternativa automaticamente aceita como verdade. Por outro lado, a diferença entre os grupos será considerada não-significante quando P > 0,05, com a hipótese nula sendo aceita como ver-dadeira. No primeiro caso, a aceitação da diferença como significativa decorre do fato da probabilidade da ocorrência do erro falso-positivo ser menor ou, no máximo, igual à probabilidade inicialmente aceita pelo pesquisador em come-ter este tipo de erro. No segundo caso, o raciocínio é inverso. Ou seja, se o valor P for menor que o nível alfa, a hipótese nula é rejeitada. Resumindo: o nível alfa corresponde ao preço que o pesquisador está disposto a pagar, em termos de probabilidade, ao rejeitar a hipótese nula sendo ela verdadeira.

Note que, neste processo, o teste estatístico fornece apenas o valor crítico amostral, como o valor t (do teste t de Student), z (do teste normal), F (do teste ANOVA) ou χ2 (do teste qui-quadrado) etc, os quais serão discutidos em outros capítulos. O verdadeiro valor P deve ser calculado com base nas respectivas tabelas dos valores críticos, as quais estão disponíveis na parte final deste livro. Porém, na prática, os programas estatísticos para computadores fornecem o valor P todas as vezes que um determinado teste estatístico é executado.

Aqui uma observação importante: falhar em rejeitar a hipótese nula não é a mesma coisa que aceitar a hipótese nula como verdade, pois é enganosa a afirmação de que o valor P significa a probabilidade da hipótese nula ser verdadeira. Assim, quando um valor P não é significativo, isto é, quando ele não é menor que o nível alfa estipulado, isso não prova que a hipótese nula seja de fato verdadeira, mesmo que este valor seja extremamente grande, como 0,80 (80%), por exemplo. Isto apenas indica que a probabilidade de erro falso-positivo é grande demais para que H0 possa ser rejeitada. Assim, é inte-ressante frisar que o pesquisador deve estar ciente, ao analisar os resultados de sua pesquisa, que existe uma grande distinção entre significância estatís-tica e relevância científica, pois uma diferença entre os valores do parâmetro

BIOESTATISTICA_Vol_01.indb 332 25/06/12 17:13

Page 333: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

InferêncIa estatístIca e teste de hIpóteses 333

estudado, ou uma associação entre um fator de risco e um desfecho, podem ser estatisticamente significativos, com P valor extremamente pequeno, mas não ter nenhuma relevância científica. Desse modo, é importante entender que o fato de uma diferença ser estatisticamente significante, não implica, neces-sariamente, que ela seja cientificamente importante, visto que outros fatores também devem ser observados, tais como a pertinência de associação entre as variáveis correlacionadas, o tamanho das amostras comparadas e a magnitude da diferença observada.

Em relação à pertinência de associação, o pesquisador deve ter o bom senso de não cruzar variáveis que não apresentem nenhuma correlação de causa e efeito, pois se assim o fizer, poderá correr o risco de encontrar falsas associações, destituídas de qualquer valor científico, porém com valores de P significantes. Por exemplo: em um estudo que utilize os dados antropométri-cos de adultos, não faz sentido associar idade e estatura, pois os indivíduos estudados já não crescem mais, embora continuem envelhecendo. Quanto ao tamanho amostral, é importante considerar que, quando se trabalha com pequenas amostras, até mesmo fortes associações podem ser consideradas não-significantes, sem que isto implique falta de relevância científica. Por outro lado, estudos com grandes amostras, como em estudos epidemiológicos, por exemplo, fracas associações podem determinar valores de P extremamente pequenos, isto é, bastante significantes, mesmo que destituídos de qualquer valor científico. Do mesmo modo, o tamanho da diferença observada também é relevante para se determinar a importância científica de um experimento, pois pequenas diferenças podem apresentar resultados significantes, embora sem nenhum resultado prático em termos de relevância científica. Por exemplo: em um estudo conduzido com uma grande amostra, para avaliar a eficácia de uma determinada droga em reduzir os níveis de colesterol plasmático, uma redução de 1,0 mg/dL pode ser estatisticamente significativa, mas não tem nenhuma relevância clínica, pois uma redução desta magnitude não irá interferir na saúde do paciente.

Cabe aqui uma pergunta: como decidir, então, se um resultado estatistica-mente significante pode ser considerado cientificamente importante? A resposta é: uma análise multifatorial é imprescindível, ou seja, não basta apenas a simples interpretação do valor P. Outras análises estatísticas devem ser realizadas no sen-

BIOESTATISTICA_Vol_01.indb 333 25/06/12 17:13

Page 334: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental334

tido de reforçar a decisão do pesquisador. Entre elas sugerimos as medidas que avaliam a força de associação entre as variáveis, tal como o risco relativo com seu respectivo intervalo de confiança, pois esta informação estima a magnitude da associação, assim como a amplitude do limite inferior e superior mostra a varia-bilidade dessa estimativa, além de fornecer subsídios para o teste de hipótese.

10.2.5 Poder do teste estatísticoO poder do teste corresponde à probabilidade de rejeição da hipótese nula

quando ela é, de fato, falsa. Isto é, corresponde à probabilidade de aceitar a hipótese alternativa como verdadeira quando de fato ela o é. Assim, como a pro-babilidade de cometer um erro falso negativo (erro tipo II) é determinada por β, a probabilidade que complementa esse erro corresponde à probabilidade de se afirmar que existe uma diferença quando ela realmente existe, sendo, então, o poder do teste representado por 1 – β. Na prática, o que todo pesquisador deseja é que o teste utilizado seja capaz de detectar uma pequena diferença entre os gru-pos de estudo, caso ela exista. Porém, essa capacidade não depende somente do poder do teste, ou do tamanho do erro β, mas, também, do valor de α estipulado e do tamanho da amostra selecionada. Assim, com o intuito de melhorar a capa-cidade de detecção para uma pequena diferença, deve haver um balanceamento desses três fatores, com o nível α devendo ser fixado em um valor razoável, diga-mos 5%, e o poder do teste aprimorado pelo aumento do tamanho amostral. Na prática, o poder do teste é mais utilizado para o cálculo do tamanho da amostra.

10.2.6 Teste unicaudal e bicaudalApós a decisão sobre que teste estatístico utilizar para verificar sua hipó-

tese, o pesquisador deverá determinar se o teste será unicaudal ou bicaudal. Essa escolha deve ser realizada ainda na fase de planejamento da pesquisa, isto é, antes da fase de execução, pois dessa forma, a escolha não será influenciada pelos dados amostrais coletados.

De qualquer maneira, no dia-a-dia da pesquisa, a maioria dos testes esta-tísticos que utilizam médias para verificação de hipótese é do tipo bicaudal (ou bilateral). Neste tipo de teste, o pesquisador irá testar a hipótese nula, que não existe diferença entre as médias, contra a hipótese alternativa de que a diferença existe, ou seja, que H0: µA = µ0 versus HA: µA ≠ µ0. Assim, se rejeitar a

BIOESTATISTICA_Vol_01.indb 334 25/06/12 17:13

Page 335: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

InferêncIa estatístIca e teste de hIpóteses 335

hipótese nula, ele poderá concluir que µA ≠ µ0 e, portanto, que µA poderá ser de tal maneira maior como menor do que o verdadeiro valor do parâmetro popu-lacional µ0. Um bom caso para ilustrar a escolha de um teste bicaudal é quando o pesquisador deseja testar um novo tratamento, como por exemplo, quando ele deseja comparar uma nova droga para hipertensão arterial contra uma droga já bem estabelecida no mercado. Inicialmente, o pesquisador não pode afirmar se a droga a ser testada terá um efeito melhor ou pior do que a droga controle, assim ele deve considerar as duas possibilidades e aceitar que as duas condições são possíveis. Nesse caso, ele deverá considerar o afastamento em ambas as direções da curva de distribuição teórica (curva normal gaussiana), pois a zona de rejeição ou região de significância está igualmente distribuída em ambas as caudas da curva. Se o nível de significância for 5%, a zona de rejei-ção do teste corresponde a 2,5% em cada cauda. A Figura 10.2 mostra a curva com a zona de rejeição bilateralmente distribuída.

Fig. 10.2 – Curva normal gaussiana para um teste bicaudal. A região de rejeição é igualmente

distribuída nas duas caudas da curva

Todavia, existem certas situações nas quais o pesquisador pode estar inte-ressado apenas no caso em que o efeito do tratamento a ser testado seja maior (ou menor) do que o efeito do tratamento controle, isto é, que HA: µA > µ0 (ou µA < µ0). É o caso, por exemplo, se ele deseja testar, em crianças, um novo tipo de hormônio do crescimento. Para tanto, ele irá selecionar uma amostra de n

crianças, medir suas estaturas antes e depois de ministrar o novo hormônio e, então, compará-las para saber se houve ou não ganho de altura. Como as

 

BIOESTATISTICA_Vol_01.indb 335 25/06/12 17:13

Page 336: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental336

crianças selecionadas não poderão ter suas estaturas diminuídas, só existem dois resultados possíveis: ou elas nada cresceram, sendo esta a hipótese nula (H0) ou apresentaram algum ganho de estatura. Nesse caso, considerando que o primeiro resultado seja descartado (H0), a hipótese alternativa (HA) só poderá ser aquela que considera que haverá algum ganho nas estaturas das crianças e, portanto, que µA > µ0. Neste exemplo, o teste é unicaudal, pois a zona de rejei-ção ou região de significância deve ser toda ela colocada em uma única cauda da distribuição, podendo ser à esquerda ou à direita, dependendo se o resul-tado esperado é menor ou maior do que o valor de µ0. No exemplo em questão, a região de rejeição é integralmente situada na cauda direita da distribuição gaussiana. A Figura 10.3 mostra a curva normal para um teste unicaudal, com a zona de rejeição unilateralmente distribuída.

Fig. 10.3 – Curva normal gaussiana para um teste unicaudal. A região de rejeição é

integralmente distribuída em uma das caudas da curva

Note que, no caso do teste unicaudal (unilateral), o valor crítico de z deve ser modificado, pois a área que determina a região de significância está toda ela situada em uma das caudas da curva. Assim, para um nível de significância de 5%, o valor crítico que determina a distância entre µ0 e a região de rejeição passa de z = 1,96σ para z = 1,645σ, uma vez que este é o valor de z que deter-mina, na cauda da curva, uma área de 5%.

No dia-a-dia da pesquisa, a maioria das situações exige um teste bicau-dal, e somente em algumas poucas situações o teste unicaudal deve ser a escolha. Porém, na dúvida, a opção é sempre pelo bicaudal, pois, neste caso,

 

BIOESTATISTICA_Vol_01.indb 336 25/06/12 17:13

Page 337: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

InferêncIa estatístIca e teste de hIpóteses 337

o pesquisador estará pecando pelo excesso de rigor científico, uma vez que os testes bicaudais são mais robustos no que diz respeito em evitar o erro falso-negativo.

10.3 ETAPAS DE UM TESTE DE HIPÓTESE ESTATÍSTICA

Um teste de hipótese compreende uma série de passos que devem ser segui-dos em uma ordem predeterminada. Note que os três primeiros passos devem ser definidos antes que o procedimento de amostragem seja realizado, ou seja, ainda na fase de delineamento da pesquisa, pois os dados devem ser coletados para testar a hipótese, não para formulá-la. Os passos são os seguintes:

• 1o Passo – Formular a questão da pesquisa sob a forma de hipóteses

estatísticas – A hipótese inicial deve ser transformada em hipóteses esta-tísticas, que incluem a hipótese nula (H0) e a hipótese alternativa (HA). A hipótese nula, que representa uma afirmação negativa do desfecho a ser pesquisado, é aquela que será inicialmente testada, ou seja, que µA = µ0. Após a aplicação do teste estatístico, caso a hipótese nula seja rejeitada, a hipótese alternativa será automaticamente considerada como verdadeira. Isto é, que µA ≠ µ0.

• 2o Passo – Estabelecer o nível de significância (α) – O qual corresponde à probabilidade máxima que o pesquisador está disposto a aceitar um erro do tipo I, ou seja, é o erro máximo que o pesquisador aceita cometer ao rejeitar a hipótese nula sendo ela verdadeira. Também referido como nível alfa, o nível de significância estabelece, na distribuição normal, a região de rejeição para a hipótese nula. Na área das ciências da saúde, o nível alfa é tradicionalmente estabelecido e 5,0% (α = 0,05).

• 3o Passo – Escolher o teste estatístico – A escolha do teste estatístico apropriado é um dos pontos mais importante no processo de verificação de hipóteses e, geralmente, representa uma grande dificuldade para um

BIOESTATISTICA_Vol_01.indb 337 25/06/12 17:13

Page 338: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental338

pesquisador iniciante, pois, da sua escolha correta, depende o sucesso na interpretação final dos resultados da pesquisa. Portanto, a escolha do teste depende de vários fatores, tais como o tipo de delineamento da pesquisa, o tipo e o número de variáveis comparadas, assim como o tipo parâmetro estudado. Esta é uma decisão que depende exclusivamente da experiên-cia do pesquisador, pois mesmos os softwares estatísticos, que indicam à escolha deste ou daquele teste, precisam de informações que só o pesqui-sador poderá fornecer.

• 4o Passo – Determinar o valor crítico – Que corresponde ao valor de alcance do teste estatístico, para que ele seja considerado significativo. Para cada tipo de teste e nível de significância, há um valor crítico para a rejeição da hipótese nula. Ou seja, cada teste tem uma distribuição, a qual é dividida em uma área de aceitação da hipótese nula e uma área de rejeição, sendo o valor crítico, um valor numérico que representa a linha divisória entre essas duas áreas. Por exemplo: para um teste t bicaudal, se o nível alfa foi determinado em 5%, o valor crítico é z0,05 = 1,960 (ver tabela t de Student).

• 5o Passo – Calcular o valor do teste e comparar com o valor crítico – Para cada tipo de teste estatístico, existe uma fórmula apropriada para calcular o valor que será comparado com o valor crítico especificado pelo pesquisador. Na prática, com a utilização dos programas computacionais, o valor crítico nunca é calculado pelo pesquisador, isto porque, ao escolher, antecipadamente, o nível alfa, o programa calcula o valor do teste e fornece automaticamente o valor P que servirá de base para a aceitação ou rejeição da hipótese nula. Assim, quando o valor calculado pelo teste for maior ou igual ao valor crítico da tabela, a hipótese nula deve ser rejeitada. Quando o valor calculado for menor do que o valor crítico tabelado, a hipótese nula não deve ser rejeitada.

• 6o Passo – Concluir – É afirmar, em palavras, o resultado da comparação entre o valor calculado do teste e o valor crítico tabelado. Não basta afirmar, simplesmente, se a diferença encontrada é ou não significante. A afirmação deve ser precisa, de modo que possa esclarecer qual a real relação entre os

BIOESTATISTICA_Vol_01.indb 338 25/06/12 17:13

Page 339: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

InferêncIa estatístIca e teste de hIpóteses 339

parâmetros estudados, isto é, o que é diferente de que, e quanto importa essa diferença.O exemplo a seguir mostra os passos para um teste de hipótese unicaudal.

Exemplo (teste unicaudal) – Um preparador físico deseja testar um novo programa de treinamento para reduzir os níveis de glicemia de pacientes dia-béticos frequentadores de uma academia de ginástica especializada. Pelos dados cadastrais desses pacientes, sabe-se que o nível glicêmico médio é 172 mg/dL, com desvio padrão de 60 mg/dL. Para a pesquisa, ele seleciona uma amostra de 30 pacientes, os quais são submetidos ao programa por certo perí-odo de tempo. Ao final do treinamento, o valor médio da glicemia é 136 mg/dL. Considerando um nível alfa de 5% e um teste unicaudal, pode o pesquisador afirmar que a redução do nível glicêmico dos pacientes estudados se deve ao programa de treinamento ou ocorreu exclusivamente em razão do acaso?

• Passo 1 – Formular as hipóteses estatísticas: H x

0 0: =µ e H x

A: <µ

0

• Passo 2 – Escolher o nível de significância (nível alfa): α =0 05, (5%) – Unicaudal à esquerda.

• Passo 3 – Determinar o valor crítico do teste: z

0 051 645

,,= −

• Passo 4 – Calcular o valor do teste:

zx

n

calc=

−= − = − = −

µσ

0 136 172

60

30

36

10 943 29

.,

• Passo 5 – Regra de decisão:

Se | , aceita-se

Se | ,

z z H

z z

calc

calc

| .

|

<

≥α

α

0

rrejeita-se

Como | >

H

z zcalc

0

0 053 29 1 645

.

| , ,,

= = ,, rejeita-se H0.

BIOESTATISTICA_Vol_01.indb 339 25/06/12 17:14

Page 340: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental340

• Passo 6 – Conclusão:A média da glicemia dos pacientes que participaram do programa de trei-

namento é significativamente menor do que a glicemia dos demais pacientes. Portanto, o treinamento foi efetivo em reduzir os níveis de glicemia dos pacientes estudados.

10.4 TIPOS DE ANÁLISES ESTATÍSTICAS

O papel de todo processo de pesquisa científica é estudar os fenômenos naturais para que as relações entre as diversas variáveis sejam conhecidas, e leis explicativas sejam propostas. Assim, torna-se necessário entender o com-portamento dessas variáveis pela aplicação de métodos estatísticos, de tal maneira que seja possível, finalmente, inferir sobre suas relações. Deste modo, em uma investigação científica, o pesquisador estará sempre trabalhando com pelo menos uma variável, porém, na prática, o que se observa é que as análi-ses estatísticas, na maioria dos casos, verificam as relações entre duas ou mais variáveis, simultaneamente, fato este que aumenta a complexidade dos proce-dimentos para o teste de hipótese. Assim, considerando o número de variáveis presentes em uma pesquisa, as análises estatísticas podem ser classificadas em univariadas, bivariadas e multivariadas, segundo contemplem uma, duas ou mais de duas variáveis, respectivamente.

Na análise univariada, as inferências são realizadas com uma só variável, de maneira isolada. Este tipo de análise é indicado para as pesquisas em que as variá-veis independentes não apresentam relações entre si, não sendo, portanto, indicada quando o fenômeno estudado apresenta dependência de muitas variáveis, as quais atuam simultaneamente, tanto com efeitos antagônicos como sinérgicos.

Na análise bivariada, o pesquisador estuda a relação entre uma variável preditora e uma variável resposta, e quantifica a correlação entre elas, de modo a inferir o quanto de uma influencia sobre a outra, tentando estabelecer uma associação entre elas. Já a análise multivariada estuda as relações entre três ou mais variáveis, sendo uma delas a variável resposta e as demais, as variáveis preditoras. Isto é, estuda as relações entre as variáveis preditoras e verifica como suas interações determinam o comportamento da variável-resposta.

BIOESTATISTICA_Vol_01.indb 340 25/06/12 17:14

Page 341: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

InferêncIa estatístIca e teste de hIpóteses 341

É importante frisar que o número de variáveis introduzidas no estudo deve ser determinado ainda na fase de delineamento da pesquisa, como também é importante notar que, para cada tipo de análise, existem os tipos específicos de testes estatísticos. Ou seja, não é qualquer tipo de teste que se aplica a qualquer tipo de análise estatística, devendo, o pesquisador conhecer as particularidades de aplicação de cada um deles. Por este motivo, as próximas partes deste livro estão distribuídas de acordo com o tipo de teste estatístico, seja ele paramétrico e não paramétrico, aplicado em análises univariada, bivariada e multivariada.

10.5 A ESCOLHA DO TESTE ESTATÍSTICO

A escolha do teste estatístico apropriado deve ser realizada ainda na fase de delineamento do estudo, logo após a escolha das variáveis que comporão a pesquisa. Esta escolha, que geralmente traduz-se em algum grau de dificuldade para um pesquisador menos experiente, envolve uma série de fatores que deve-rão ser considerados, sendo os mais importantes o tipo de delineamento do estudo, o tipo de variável estudada e o número de grupos comparados. Assim, quando se considera o modelo de delineamento, deve-se verificar se a compa-ração entre os grupos é um estudo do tipo pareado ou se envolve comparação de grupos de amostras independentes, ou se o estudo é do tipo caso-controle ou coorte etc. Quanto ao tipo de variável, o pesquisador deve estar atento, pois a variáveis podem ser paramétricas, ordinais, dicotômicas ou nominais e, para cada tipo de variável, um tipo diferente de teste estatístico de ser escolhido. Igualmente, o número de variáveis a serem comparadas também determina o tipo de teste, pois a análise pode ser univariada, bivariada ou multivariada, assim como o número de grupos estudados também deve ser considerado.

Com base nesses requisitos, os testes estatísticos podem ser classificados em dois grandes grupos, os testes paramétricos e os testes não-paramétricos, conforme o tipo de variável estudada. Os testes paramétricos são mais robustos do que os não-paramétricos e, conseqüentemente, devem ser a primeira escolha do investigador, quando o seu emprego for permitido, isto é, quando os dados coletados achem-se normalmente distribuídos. Quando a escolha é um teste não-paramétrico, o pesquisador admite que a distribuição de seus dados não

BIOESTATISTICA_Vol_01.indb 341 25/06/12 17:14

Page 342: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental342

seja normal, ou que ele não tem elementos suficientes para poder afirmar que o sejam. Na dúvida, o pesquisador deve optar pela estatística não-paramétrica.

De qualquer maneira, seja qual for a opção do pesquisador, ele precisa ainda decidir qual, dentre os diversos testes existentes em ambos os grupos, é o mais apropriado para o modelo de sua pesquisa. Isto porque, existem tes-tes específicos para amostras dependentes e independentes, como, da mesma forma, o número de comparações a serem realizadas na pesquisa é também importante, uma vez que existem testes indicados para comparação somente entre duas amostras, e outros indicados a comparações múltiplas, entendendo--se como múltiplas, um número de comparações superior a duas amostras. Deste modo, com o intuito de facilitar, ao leitor, quanto à escolha do teste esta-tístico apropriado, os quadros 10.2 e 10.3 mostram as opções para as análises bivariadas e multivariadas, respectivamente.

Quadro 10.2 – Escolha do teste estatístico para análise bivariada conforme

o tipo de variável estudada

Tipos de variáveis

Primeira variável

Contínua Ordinal Dicotômica Nominal

Segu

nda

variá

vel

Dicotômica não-pareada

• Teste t de Student

• Teste de Mann-Whitney

• Teste qui-quadrado para tendência linear

• Teste qui-quadrado

• Teste exato de Fisher

---

Dicotômica pareada

• Teste t pareado • Teste de Wilcoxon• Teste do

qui-quadrado de McNemar

---

Nominal

• Análise de variância de uma via (ANOVA).

• Teste Kruskal-Wallis• Teste

qui-quadrado• Teste

qui-quadrado

Ordinal ---

• Coeficiente de correla-ção de Spearman

• Coeficiente de correla-ção de Kendall

--- ---

• Contínua

• Coeficiente de corre-lação de Pearson

• Regressão linear

• Agrupar a variáveis contínuas e calcular o coef. de correlação de Spearman ou coef. de correlação de Kendall ou qui-quadrado.

--- ---

BIOESTATISTICA_Vol_01.indb 342 25/06/12 17:14

Page 343: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

InferêncIa estatístIca e teste de hIpóteses 343

Quadro 10.3 – Escolha do teste estatístico para análise multivariada, conforme o tipo de variável

estudada

Tipos de variáveis

Variável dependente

Contínua Ordinal Dicotômica Nominal

Variá

veis

inde

pend

ente

s

Todas são categóricas

• Análise de variância (ANOVA)

• Não existe teste para análise multivariada de variáveis dependentes ordinais.

• Tratar como variáveis contínuas ou realizar a análise do log-linear.

• Regressão logística

• Análise do log-linear

• Análise do log-linear

Algumas categóricas e algumas contínuas

• Análise de covariân-cia (ANCOVA)

• Regressão logística

• Agrupar as variáveis contínuas e realizar análise do log-linear.

Todas são contínuas

• Regressão linear múltipla

• Regressão logística

• Análise da função discriminante

• Análise da função discriminante

• Agrupar as variáveis contínuas e realizar análise do log-linear.

BIOESTATISTICA_Vol_01.indb 343 25/06/12 17:14

Page 344: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

BIOESTATISTICA_Vol_01.indb 344 25/06/12 17:14

Page 345: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

TABELAS

BIOESTATISTICA_Vol_01.indb 345 25/06/12 17:14

Page 346: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

BIOESTATISTICA_Vol_01.indb 346 25/06/12 17:14

Page 347: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 347

zÁrea entre0 e z

zÁrea entre0 e z

zÁrea entre0 e z

zÁrea entre0 e z

zÁrea entre0 e z

zÁrea entre0 e z

0,00 0,0000 0,56 0,2123 1,12 0,3686 1,68 0,4535 2,24 0,4875 2,80 0,4974

0,01 0,0040 0,57 0,2157 1,13 0,3708 1,69 0,4545 2,25 0,4878 2,81 0,4975

0,02 0,0080 0,58 0,2190 1,14 0,3729 1,70 0,4554 2,26 0,4881 2,82 0,4976

0,03 0,0120 0,59 0,2224 1,15 0,3749 1,71 0,4564 2,27 0,4884 2,83 0,4977

0,04 0,0160 0,60 0,2257 1,16 0,3770 1,72 0,4573 2,28 0,4887 2,84 0,4977

0,05 0,0199 0,61 0,2291 1,17 0,3790 1,73 0,4582 2,29 0,4890 2,85 0,4978

0,06 0,0239 0,62 0,2324 1,18 0,3810 1,74 0,4591 2,30 0,4893 2,86 0,4979

0,07 0,0279 0,63 0,2357 1,19 0,3830 1,75 0,4599 2,31 0,4896 2,87 0,4979

0,08 0,0319 0,64 0,2389 1,20 0,3849 1,76 0,4608 2,32 0,4898 2,88 0,4980

0,09 0,0359 0,65 0,2422 1,21 0,3869 1,77 0,4616 2,33 0,4901 2,89 0,4981

0,10 0,0398 0,66 0,2454 1,22 0,3888 1,78 0,4625 2,34 0,4904 2,90 0,4981

0,11 0,0438 0,67 0,2486 1,23 0,3907 1,79 0,4633 2,35 0,4906 2,91 0,4982

0,12 0,0478 0,68 0,2517 1,24 0,3925 1,80 0,4641 2,36 0,4909 2,92 0,4982

0,13 0,0517 0,69 0,2549 1,25 0,3944 1,81 0,4649 2,37 0,4911 2,93 0,4983

0,14 0,0557 0,70 0,2580 1,26 0,3962 1,82 0,4656 2,38 0,4913 2,94 0,4984

0,15 0,0596 0,71 0,2611 1,27 0,3980 1,83 0,4664 2,39 0,4916 2,95 0,4984

0,16 0,0636 0,72 0,2642 1,28 0,3997 1,84 0,4671 2,40 0,4918 2,96 0,4985

0,17 0,0675 0,73 0,2673 1,29 0,4015 1,85 0,4678 2,41 0,4920 2,97 0,4985

0,18 0,0714 0,74 0,2704 1,30 0,4032 1,86 0,4686 2,42 0,4922 2,98 0,4986

0,19 0,0753 0,75 0,2734 1,31 0,4049 1,87 0,4693 2,43 0,4925 2,99 0,4986

0,20 0,0793 0,76 0,2764 1,32 0,4066 1,88 0,4699 2,44 0,4927 3,00 0,4987

0,21 0,0832 0,77 0,2794 1,33 0,4082 1,89 0,4706 2,45 0,4929 3,01 0,4987

0,22 0,0871 0,78 0,2823 1,34 0,4099 1,90 0,4713 2,46 0,4931 3,02 0,4987

0,23 0,0910 0,79 0,2852 1,35 0,4115 1,91 0,4719 2,47 0,4932 3,03 0,4988

0,24 0,0948 0,80 0,2881 1,36 0,4131 1,92 0,4726 2,48 0,4934 3,04 0,4988

0,25 0,0987 0,81 0,2910 1,37 0,4147 1,93 0,4732 2,49 0,4936 3,05 0,4989

0,26 0,1026 0,82 0,2939 1,38 0,4162 1,94 0,4738 2,50 0,4938 3,06 0,4989

Tabela 1 - Distribuição normal gaussiana:

valores de z e respectivas áreas entre a média (zero) e z

BIOESTATISTICA_Vol_01.indb 347 25/06/12 17:14

Page 348: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental348

Tabela 1 - Distribuição normal gaussiana: valores de z e respectivas áreas entre

a média (zero) e z(continuação)

zÁrea entre0 e z

zÁrea entre0 e z

zÁrea entre0 e z

zÁrea entre0 e z

zÁrea entre0 e z

zÁrea entre0 e z

0,27 0,1064 0,83 0,2967 1,39 0,4177 1,95 0,4744 2,51 0,4940 3,07 0,4989

0,28 0,1103 0,84 0,2995 1,40 0,4192 1,96 0,4750 2,52 0,4941 3,08 0,4990

0,29 0,1141 0,85 0,3023 1,41 0,4207 1,97 0,4756 2,53 0,4943 3,09 0,4990

0,30 0,1179 0,86 0,3051 1,42 0,4222 1,98 0,4761 2,54 0,4945 3,10 0,4990

0,31 0,1217 0,87 0,3078 1,43 0,4236 1,99 0,4767 2,55 0,4946 3,11 0,4991

0,32 0,1255 0,88 0,3106 1,44 0,4251 2,00 0,4772 2,56 0,4948 3,12 0,4991

0,33 0,1293 0,89 0,3133 1,45 0,4265 2,01 0,4778 2,57 0,4949 3,13 0,4991

0,34 0,1331 0,90 0,3159 1,46 0,4279 2,02 0,4783 2,58 0,4951 3,14 0,4992

0,35 0,1368 0,91 0,3186 1,47 0,4292 2,03 0,4788 2,59 0,4952 3,15 0,4992

0,36 0,1406 0,92 0,3212 1,48 0,4306 2,04 0,4793 2,60 0,4953 3,16 0,4992

0,37 0,1443 0,93 0,3238 1,49 0,4319 2,05 0,4798 2,61 0,4955 3,17 0,4992

0,38 0,1480 0,94 0,3264 1,50 0,4332 2,06 0,4803 2,62 0,4956 3,18 0,4993

0,39 0,1517 0,95 0,3289 1,51 0,4345 2,07 0,4808 2,63 0,4957 3,19 0,4993

0,40 0,1554 0,96 0,3315 1,52 0,4357 2,08 0,4812 2,64 0,4959 3,20 0,4993

0,41 0,1591 0,97 0,3340 1,53 0,4370 2,09 0,4817 2,65 0,4960 3,21 0,4993

0,42 0,1628 0,98 0,3365 1,54 0,4382 2,10 0,4821 2,66 0,4961 3,22 0,4994

0,43 0,1664 0,99 0,3389 1,55 0,4394 2,11 0,4826 2,67 0,4962 3,23 0,4994

0,44 0,1700 1,00 0,3413 1,56 0,4406 2,12 0,4830 2,68 0,4963 3,24 0,4994

0,45 0,1736 1,01 0,3438 1,57 0,4418 2,13 0,4834 2,69 0,4964 3,25 0,4994

0,46 0,1772 1,02 0,3461 1,58 0,4429 2,14 0,4838 2,70 0,4965 3,30 0,4995

0,47 0,1808 1,03 0,3485 1,59 0,4441 2,15 0,4842 2,71 0,4966 3,35 0,4996

0,48 0,1844 1,04 0,3508 1,60 0,4452 2,16 0,4846 2,72 0,4967 3,40 0,4997

0,49 0,1879 1,05 0,3531 1,61 0,4463 2,17 0,4850 2,73 0,4968 3,45 0,4997

0,50 0,1915 1,06 0,3554 1,62 0,4474 2,18 0,4854 2,74 0,4969 3,50 0,4998

0,51 0,1950 1,07 0,3577 1,63 0,4484 2,19 0,4857 2,75 0,4970 3,60 0,4998

0,52 0,1985 1,08 0,3599 1,64 0,4495 2,20 0,4861 2,76 0,4971 3,70 0,4999

0,53 0,2019 1,09 0,3621 1,65 0,4505 2,21 0,4864 2,77 0,4972 3,80 0,4999

0,54 0,2054 1,10 0,3643 1,66 0,4515 2,22 0,4868 2,78 0,4973 3,90 0,49995

0,55 0,2088 1,11 0,3665 1,67 0,4525 2,23 0,4871 2,79 0,4974 4,00 0,49997

BIOESTATISTICA_Vol_01.indb 348 25/06/12 17:14

Page 349: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 349

α Bilateral: 0,40 0,20 0,10 0,05 0,02 0,01 0,001

gl α Unilateral: 0,20 0,10 0,05 0,025 0,01 0,005 0,0005

1 1,376 3,078 6,314 12,706 31,821 63,656 636,578

2 1,061 1,886 2,920 4,303 6,965 9,925 31,600

3 0,978 1,638 2,353 3,182 4,541 5,841 12,924

4 0,941 1,533 2,132 2,776 3,747 4,604 8,610

5 0,920 1,476 2,015 2,571 3,365 4,032 6,869

6 0,906 1,440 1,943 2,447 3,143 3,707 5,959

7 0,896 1,415 1,895 2,365 2,998 3,499 5,408

8 0,889 1,397 1,860 2,306 2,896 3,355 5,041

9 0,883 1,383 1,833 2,262 2,821 3,250 4,781

10 0,879 1,372 1,812 2,228 2,764 3,169 4,587

11 0,876 1,363 1,796 2,201 2,718 3,106 4,437

12 0,873 1,356 1,782 2,179 2,681 3,055 4,318

13 0,870 1,350 1,771 2,160 2,650 3,012 4,221

14 0,868 1,345 1,761 2,145 2,624 2,977 4,140

15 0,866 1,341 1,753 2,131 2,602 2,947 4,073

16 0,865 1,337 1,746 2,120 2,583 2,921 4,015

17 0,863 1,333 1,740 2,110 2,567 2,898 3,965

18 0,862 1,330 1,734 2,101 2,552 2,878 3,922

19 0,861 1,328 1,729 2,093 2,539 2,861 3,883

20 0,860 1,325 1,725 2,086 2,528 2,845 3,850

21 0,859 1,323 1,721 2,080 2,518 2,831 3,819

22 0,858 1,321 1,717 2,074 2,508 2,819 3,792

23 0,858 1,319 1,714 2,069 2,500 2,807 3,768

24 0,857 1,318 1,711 2,064 2,492 2,797 3,745

25 0,856 1,316 1,708 2,060 2,485 2,787 3,725

26 0,856 1,315 1,706 2,056 2,479 2,779 3,707

27 0,855 1,314 1,703 2,052 2,473 2,771 3,689

28 0,855 1,313 1,701 2,048 2,467 2,763 3,674

29 0,854 1,311 1,699 2,045 2,462 2,756 3,660

30 0,854 1,310 1,697 2,042 2,457 2,750 3,646

40 0,851 1,303 1,684 2,021 2,423 2,704 3,551

60 0,848 1,296 1,671 2,000 2,390 2,660 3,460

120 0,845 1,289 1,658 1,980 2,358 2,617 3,373

infinito 0,842 1,282 1,645 1,960 2,326 2,576 3,290

Tabela 2 - Valores críticos da distribuição t de Student

BIOESTATISTICA_Vol_01.indb 349 25/06/12 17:14

Page 350: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental350

gl do gl do numerador

denominador 1 2 3 4 5 6 7 8 9 10 11 12

1 648 799 864 900 922 937 948 957 963 969 973 977

2 38,51 39,00 39,17 39,25 39,30 39,33 39,36 39,37 39,39 39,40 39,41 39,41

3 17,44 16,04 15,44 15,10 14,88 14,73 14,62 14,54 14,47 14,42 14,37 14,34

4 12,22 10,65 9,98 9,60 9,36 9,20 9,07 8,98 8,90 8,84 8,79 8,75

5 10,01 8,43 7,76 7,39 7,15 6,98 6,85 6,76 6,68 6,62 6,57 6,52

6 8,81 7,26 6,60 6,23 5,99 5,82 5,70 5,60 5,52 5,46 5,41 5,37

7 8,07 6,54 5,89 5,52 5,29 5,12 4,99 4,90 4,82 4,76 4,71 4,67

8 7,57 6,06 5,42 5,05 4,82 4,65 4,53 4,43 4,36 4,30 4,24 4,20

9 7,21 5,71 5,08 4,72 4,48 4,32 4,20 4,10 4,03 3,96 3,91 3,87

10 6,94 5,46 4,83 4,47 4,24 4,07 3,95 3,85 3,78 3,72 3,66 3,62

11 6,72 5,26 4,63 4,28 4,04 3,88 3,76 3,66 3,59 3,53 3,47 3,43

12 6,55 5,10 4,47 4,12 3,89 3,73 3,61 3,51 3,44 3,37 3,32 3,28

13 6,41 4,97 4,35 4,00 3,77 3,60 3,48 3,39 3,31 3,25 3,20 3,15

14 6,30 4,86 4,24 3,89 3,66 3,50 3,38 3,29 3,21 3,15 3,09 3,05

15 6,20 4,77 4,15 3,80 3,58 3,41 3,29 3,20 3,12 3,06 3,01 2,96

16 6,12 4,69 4,08 3,73 3,50 3,34 3,22 3,12 3,05 2,99 2,93 2,89

17 6,04 4,62 4,01 3,66 3,44 3,28 3,16 3,06 2,98 2,92 2,87 2,82

18 5,98 4,56 3,95 3,61 3,38 3,22 3,10 3,01 2,93 2,87 2,81 2,77

19 5,92 4,51 3,90 3,56 3,33 3,17 3,05 2,96 2,88 2,82 2,76 2,72

20 5,87 4,46 3,86 3,51 3,29 3,13 3,01 2,91 2,84 2,77 2,72 2,68

21 5,83 4,42 3,82 3,48 3,25 3,09 2,97 2,87 2,80 2,73 2,68 2,64

22 5,79 4,38 3,78 3,44 3,22 3,05 2,93 2,84 2,76 2,70 2,65 2,60

23 5,75 4,35 3,75 3,41 3,18 3,02 2,90 2,81 2,73 2,67 2,62 2,57

24 5,72 4,32 3,72 3,38 3,15 2,99 2,87 2,78 2,70 2,64 2,59 2,54

25 5,69 4,29 3,69 3,35 3,13 2,97 2,85 2,75 2,68 2,61 2,56 2,51

26 5,66 4,27 3,67 3,33 3,10 2,94 2,82 2,73 2,65 2,59 2,54 2,49

27 5,63 4,24 3,65 3,31 3,08 2,92 2,80 2,71 2,63 2,57 2,51 2,47

28 5,61 4,22 3,63 3,29 3,06 2,90 2,78 2,69 2,61 2,55 2,49 2,45

29 5,59 4,20 3,61 3,27 3,04 2,88 2,76 2,67 2,59 2,53 2,48 2,43

30 5,57 4,18 3,59 3,25 3,03 2,87 2,75 2,65 2,57 2,51 2,46 2,41

Tabela 3.1 - Distribuição F: valores críticos para um teste bilateral (α = 0,05)

BIOESTATISTICA_Vol_01.indb 350 25/06/12 17:14

Page 351: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 351

gl do gl do numerador

denominador 14 16 20 24 30 40 50 75 100 200 500 infinito

1 983 987 993 997 1001 1006 1008 1011 1013 1016 1017 1018

2 39,43 39,44 39,45 39,46 39,46 39,47 39,48 39,48 39,49 39,49 39,50 39,50

3 14,28 14,23 14,17 14,12 14,08 14,04 14,01 13,97 13,96 13,93 13,91 13,90

4 8,68 8,63 8,56 8,51 8,46 8,41 8,38 8,34 8,32 8,29 8,27 8,26

5 6,46 6,40 6,33 6,28 6,23 6,18 6,14 6,10 6,08 6,05 6,03 6,02

6 5,30 5,24 5,17 5,12 5,07 5,01 4,98 4,94 4,92 4,88 4,86 4,85

7 4,60 4,54 4,47 4,41 4,36 4,31 4,28 4,23 4,21 4,18 4,16 4,14

8 4,13 4,08 4,00 3,95 3,89 3,84 3,81 3,76 3,74 3,70 3,68 3,67

9 3,80 3,74 3,67 3,61 3,56 3,51 3,47 3,43 3,40 3,37 3,35 3,33

10 3,55 3,50 3,42 3,37 3,31 3,26 3,22 3,18 3,15 3,12 3,09 3,08

11 3,36 3,30 3,23 3,17 3,12 3,06 3,03 2,98 2,96 2,92 2,90 2,88

12 3,21 3,15 3,07 3,02 2,96 2,91 2,87 2,82 2,80 2,76 2,74 2,72

13 3,08 3,03 2,95 2,89 2,84 2,78 2,74 2,70 2,67 2,63 2,61 2,60

14 2,98 2,92 2,84 2,79 2,73 2,67 2,64 2,59 2,56 2,53 2,50 2,49

15 2,89 2,84 2,76 2,70 2,64 2,59 2,55 2,50 2,47 2,44 2,41 2,40

16 2,82 2,76 2,68 2,63 2,57 2,51 2,47 2,42 2,40 2,36 2,33 2,32

17 2,75 2,70 2,62 2,56 2,50 2,44 2,41 2,35 2,33 2,29 2,26 2,25

18 2,70 2,64 2,56 2,50 2,44 2,38 2,35 2,30 2,27 2,23 2,20 2,19

19 2,65 2,59 2,51 2,45 2,39 2,33 2,30 2,24 2,22 2,18 2,15 2,13

20 2,60 2,55 2,46 2,41 2,35 2,29 2,25 2,20 2,17 2,13 2,10 2,09

21 2,56 2,51 2,42 2,37 2,31 2,25 2,21 2,16 2,13 2,09 2,06 2,04

22 2,53 2,47 2,39 2,33 2,27 2,21 2,17 2,12 2,09 2,05 2,02 2,00

23 2,50 2,44 2,36 2,30 2,24 2,18 2,14 2,08 2,06 2,01 1,99 1,97

24 2,47 2,41 2,33 2,27 2,21 2,15 2,11 2,05 2,02 1,98 1,95 1,94

25 2,44 2,38 2,30 2,24 2,18 2,12 2,08 2,02 2,00 1,95 1,92 1,91

26 2,42 2,36 2,28 2,22 2,16 2,09 2,05 2,00 1,97 1,92 1,90 1,88

27 2,39 2,34 2,25 2,19 2,13 2,07 2,03 1,97 1,94 1,90 1,87 1,85

28 2,37 2,32 2,23 2,17 2,11 2,05 2,01 1,95 1,92 1,88 1,85 1,83

29 2,36 2,30 2,21 2,15 2,09 2,03 1,99 1,93 1,90 1,86 1,83 1,81

30 2,34 2,28 2,20 2,14 2,07 2,01 1,97 1,91 1,88 1,84 1,81 1,79

Tabela 3.1 - Distribuição F: valores críticos para um teste bilateral (α = 0,05) (continuação)

BIOESTATISTICA_Vol_01.indb 351 25/06/12 17:14

Page 352: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental352

gl do gl do numerador

denominador 1 2 3 4 5 6 7 8 9 10 11 12

32 5,53 4,15 3,56 3,22 3,00 2,84 2,71 2,62 2,54 2,48 2,43 2,38

34 5,50 4,12 3,53 3,19 2,97 2,81 2,69 2,59 2,52 2,45 2,40 2,35

36 5,47 4,09 3,50 3,17 2,94 2,78 2,66 2,57 2,49 2,43 2,37 2,33

38 5,45 4,07 3,48 3,15 2,92 2,76 2,64 2,55 2,47 2,41 2,35 2,31

40 5,42 4,05 3,46 3,13 2,90 2,74 2,62 2,53 2,45 2,39 2,33 2,29

42 5,40 4,03 3,45 3,11 2,89 2,73 2,61 2,51 2,43 2,37 2,32 2,27

44 5,39 4,02 3,43 3,09 2,87 2,71 2,59 2,50 2,42 2,36 2,30 2,26

46 5,37 4,00 3,42 3,08 2,86 2,70 2,58 2,48 2,41 2,34 2,29 2,24

48 5,35 3,99 3,40 3,07 2,84 2,69 2,56 2,47 2,39 2,33 2,27 2,23

50 5,34 3,97 3,39 3,05 2,83 2,67 2,55 2,46 2,38 2,32 2,26 2,22

55 5,31 3,95 3,36 3,03 2,81 2,65 2,53 2,43 2,36 2,29 2,24 2,19

60 5,29 3,93 3,34 3,01 2,79 2,63 2,51 2,41 2,33 2,27 2,22 2,17

65 5,26 3,91 3,32 2,99 2,77 2,61 2,49 2,39 2,32 2,25 2,20 2,15

70 5,25 3,89 3,31 2,97 2,75 2,59 2,47 2,38 2,30 2,24 2,18 2,14

80 5,22 3,86 3,28 2,95 2,73 2,57 2,45 2,35 2,28 2,21 2,16 2,11

100 5,18 3,83 3,25 2,92 2,70 2,54 2,42 2,32 2,24 2,18 2,12 2,08

125 5,15 3,80 3,22 2,89 2,67 2,51 2,39 2,30 2,22 2,15 2,10 2,05

150 5,13 3,78 3,20 2,87 2,65 2,49 2,37 2,28 2,20 2,13 2,08 2,03

200 5,10 3,76 3,18 2,85 2,63 2,47 2,35 2,26 2,18 2,11 2,06 2,01

400 5,06 3,72 3,15 2,82 2,60 2,44 2,32 2,22 2,15 2,08 2,03 1,98

1000 5,04 3,70 3,13 2,80 2,58 2,42 2,30 2,20 2,13 2,06 2,01 1,96

infinito 5,02 3,69 3,12 2,79 2,57 2,41 2,29 2,19 2,11 2,05 1,99 1,94

Tabela 3.1 - Distribuição F: valores críticos para um teste bilateral (α = 0,05)

BIOESTATISTICA_Vol_01.indb 352 25/06/12 17:14

Page 353: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 353

gl do gl do numerador

denominador 14 16 20 24 30 40 50 75 100 200 500 infinito

32 2,31 2,25 2,16 2,10 2,04 1,98 1,93 1,88 1,85 1,80 1,77 1,75

34 2,28 2,22 2,13 2,07 2,01 1,95 1,90 1,85 1,82 1,77 1,74 1,72

36 2,25 2,20 2,11 2,05 1,99 1,92 1,88 1,82 1,79 1,74 1,71 1,69

38 2,23 2,17 2,09 2,03 1,96 1,90 1,85 1,79 1,76 1,71 1,68 1,66

40 2,21 2,15 2,07 2,01 1,94 1,88 1,83 1,77 1,74 1,69 1,66 1,64

42 2,20 2,14 2,05 1,99 1,92 1,86 1,81 1,75 1,72 1,67 1,64 1,62

44 2,18 2,12 2,03 1,97 1,91 1,84 1,80 1,73 1,70 1,65 1,62 1,60

46 2,17 2,11 2,02 1,96 1,89 1,82 1,78 1,72 1,69 1,63 1,60 1,58

48 2,15 2,09 2,01 1,94 1,88 1,81 1,77 1,70 1,67 1,62 1,58 1,56

50 2,14 2,08 1,99 1,93 1,87 1,80 1,75 1,69 1,66 1,60 1,57 1,55

55 2,11 2,05 1,97 1,90 1,84 1,77 1,72 1,66 1,62 1,57 1,54 1,51

60 2,09 2,03 1,94 1,88 1,82 1,74 1,70 1,63 1,60 1,54 1,51 1,48

65 2,07 2,01 1,93 1,86 1,80 1,72 1,68 1,61 1,58 1,52 1,48 1,46

70 2,06 2,00 1,91 1,85 1,78 1,71 1,66 1,59 1,56 1,50 1,46 1,44

80 2,03 1,97 1,88 1,82 1,75 1,68 1,63 1,56 1,53 1,47 1,43 1,40

100 2,00 1,94 1,85 1,78 1,71 1,64 1,59 1,52 1,48 1,42 1,38 1,35

125 1,97 1,91 1,82 1,75 1,68 1,61 1,56 1,49 1,45 1,38 1,34 1,30

150 1,95 1,89 1,80 1,74 1,67 1,59 1,54 1,46 1,42 1,35 1,31 1,27

200 1,93 1,87 1,78 1,71 1,64 1,56 1,51 1,44 1,39 1,32 1,27 1,23

400 1,90 1,84 1,74 1,68 1,60 1,52 1,47 1,39 1,35 1,27 1,21 1,15

1000 1,88 1,82 1,72 1,65 1,58 1,50 1,45 1,36 1,32 1,23 1,16 1,09

infinito 1,87 1,80 1,71 1,64 1,57 1,48 1,43 1,34 1,30 1,21 1,13 1,01

Tabela 3.1 - Distribuição F: valores críticos para um teste bilateral (α = 0,05) (continuação)

BIOESTATISTICA_Vol_01.indb 353 25/06/12 17:14

Page 354: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental354

gl do gl do numerador

denominador 1 2 3 4 5 6 7 8 9 10 11 12

1 16212 19997 21614 22501 23056 23440 23715 23924 24091 24222 24334 24427

2 198,5 199,0 199,2 199,2 199,3 199,3 199,4 199,4 199,4 199,4 199,4 199,4

3 55,55 49,80 47,47 46,20 45,39 44,84 44,43 44,13 43,88 43,68 43,52 43,39

4 31,33 26,28 24,26 23,15 22,46 21,98 21,62 21,35 21,14 20,97 20,82 20,70

5 22,78 18,31 16,53 15,56 14,94 14,51 14,20 13,96 13,77 13,62 13,49 13,38

6 18,63 14,54 12,92 12,03 11,46 11,07 10,79 10,57 10,39 10,25 10,13 10,03

7 16,24 12,40 10,88 10,05 9,52 9,16 8,89 8,68 8,51 8,38 8,27 8,18

8 14,69 11,04 9,60 8,81 8,30 7,95 7,69 7,50 7,34 7,21 7,10 7,01

9 13,61 10,11 8,72 7,96 7,47 7,13 6,88 6,69 6,54 6,42 6,31 6,23

10 12,83 9,43 8,08 7,34 6,87 6,54 6,30 6,12 5,97 5,85 5,75 5,66

11 12,23 8,91 7,60 6,88 6,42 6,10 5,86 5,68 5,54 5,42 5,32 5,24

12 11,75 8,51 7,23 6,52 6,07 5,76 5,52 5,35 5,20 5,09 4,99 4,91

13 11,37 8,19 6,93 6,23 5,79 5,48 5,25 5,08 4,94 4,82 4,72 4,64

14 11,06 7,92 6,68 6,00 5,56 5,26 5,03 4,86 4,72 4,60 4,51 4,43

15 10,80 7,70 6,48 5,80 5,37 5,07 4,85 4,67 4,54 4,42 4,33 4,25

16 10,58 7,51 6,30 5,64 5,21 4,91 4,69 4,52 4,38 4,27 4,18 4,10

17 10,38 7,35 6,16 5,50 5,07 4,78 4,56 4,39 4,25 4,14 4,05 3,97

18 10,22 7,21 6,03 5,37 4,96 4,66 4,44 4,28 4,14 4,03 3,94 3,86

19 10,07 7,09 5,92 5,27 4,85 4,56 4,34 4,18 4,04 3,93 3,84 3,76

20 9,94 6,99 5,82 5,17 4,76 4,47 4,26 4,09 3,96 3,85 3,76 3,68

21 9,83 6,89 5,73 5,09 4,68 4,39 4,18 4,01 3,88 3,77 3,68 3,60

22 9,73 6,81 5,65 5,02 4,61 4,32 4,11 3,94 3,81 3,70 3,61 3,54

23 9,63 6,73 5,58 4,95 4,54 4,26 4,05 3,88 3,75 3,64 3,55 3,47

24 9,55 6,66 5,52 4,89 4,49 4,20 3,99 3,83 3,69 3,59 3,50 3,42

25 9,48 6,60 5,46 4,84 4,43 4,15 3,94 3,78 3,64 3,54 3,45 3,37

26 9,41 6,54 5,41 4,79 4,38 4,10 3,89 3,73 3,60 3,49 3,40 3,33

27 9,34 6,49 5,36 4,74 4,34 4,06 3,85 3,69 3,56 3,45 3,36 3,28

28 9,28 6,44 5,32 4,70 4,30 4,02 3,81 3,65 3,52 3,41 3,32 3,25

29 9,23 6,40 5,28 4,66 4,26 3,98 3,77 3,61 3,48 3,38 3,29 3,21

30 9,18 6,35 5,24 4,62 4,23 3,95 3,74 3,58 3,45 3,34 3,25 3,18

Tabela 3.2 - Distribuição F: valores críticos para um teste bilateral (α = 0,01)

BIOESTATISTICA_Vol_01.indb 354 25/06/12 17:14

Page 355: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 355

gl do gl do numerador

denominador 14 16 20 24 30 40 50 75 100 200 500 infinito

1 24572 24684 24837 24937 25041 25146 25213 25295 25339 25399 25436 25466

2 199,4 199,4 199,4 199,4 199,5 199,5 199,5 199,5 199,5 199,5 199,5 199,5

3 43,17 43,01 42,78 42,62 42,47 42,31 42,21 42,08 42,02 41,92 41,87 41,83

4 20,51 20,37 20,17 20,03 19,89 19,75 19,67 19,55 19,50 19,41 19,36 19,32

5 13,21 13,09 12,90 12,78 12,66 12,53 12,45 12,35 12,30 12,22 12,17 12,14

6 9,88 9,76 9,59 9,47 9,36 9,24 9,17 9,07 9,03 8,95 8,91 8,88

7 8,03 7,91 7,75 7,64 7,53 7,42 7,35 7,26 7,22 7,15 7,10 7,08

8 6,87 6,76 6,61 6,50 6,40 6,29 6,22 6,13 6,09 6,02 5,98 5,95

9 6,09 5,98 5,83 5,73 5,62 5,52 5,45 5,37 5,32 5,26 5,21 5,19

10 5,53 5,42 5,27 5,17 5,07 4,97 4,90 4,82 4,77 4,71 4,67 4,64

11 5,10 5,00 4,86 4,76 4,65 4,55 4,49 4,40 4,36 4,29 4,25 4,23

12 4,77 4,67 4,53 4,43 4,33 4,23 4,17 4,08 4,04 3,97 3,93 3,90

13 4,51 4,41 4,27 4,17 4,07 3,97 3,91 3,82 3,78 3,71 3,67 3,65

14 4,30 4,20 4,06 3,96 3,86 3,76 3,70 3,61 3,57 3,50 3,46 3,44

15 4,12 4,02 3,88 3,79 3,69 3,59 3,52 3,44 3,39 3,33 3,29 3,26

16 3,97 3,87 3,73 3,64 3,54 3,44 3,37 3,29 3,25 3,18 3,14 3,11

17 3,84 3,75 3,61 3,51 3,41 3,31 3,25 3,16 3,12 3,05 3,01 2,98

18 3,73 3,64 3,50 3,40 3,30 3,20 3,14 3,05 3,01 2,94 2,90 2,87

19 3,64 3,54 3,40 3,31 3,21 3,11 3,04 2,96 2,91 2,85 2,80 2,78

20 3,55 3,46 3,32 3,22 3,12 3,02 2,96 2,87 2,83 2,76 2,72 2,69

21 3,48 3,38 3,24 3,15 3,05 2,95 2,88 2,80 2,75 2,68 2,64 2,61

22 3,41 3,31 3,18 3,08 2,98 2,88 2,82 2,73 2,69 2,62 2,57 2,55

23 3,35 3,25 3,12 3,02 2,92 2,82 2,76 2,67 2,62 2,56 2,51 2,48

24 3,30 3,20 3,06 2,97 2,87 2,77 2,70 2,61 2,57 2,50 2,46 2,43

25 3,25 3,15 3,01 2,92 2,82 2,72 2,65 2,56 2,52 2,45 2,41 2,38

26 3,20 3,11 2,97 2,87 2,77 2,67 2,61 2,52 2,47 2,40 2,36 2,33

27 3,16 3,07 2,93 2,83 2,73 2,63 2,57 2,48 2,43 2,36 2,32 2,29

28 3,12 3,03 2,89 2,79 2,69 2,59 2,53 2,44 2,39 2,32 2,28 2,25

29 3,09 2,99 2,86 2,76 2,66 2,56 2,49 2,40 2,36 2,29 2,24 2,21

30 3,06 2,96 2,82 2,73 2,63 2,52 2,46 2,37 2,32 2,25 2,21 2,18

Tabela 3.2 - Distribuição F: valores críticos para um teste bilateral (α = 0,01) (continuação)

BIOESTATISTICA_Vol_01.indb 355 25/06/12 17:14

Page 356: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental356

Tabela 3.2 - Distribuição F: valores críticos para um teste bilateral (α = 0,01) (continuação)

gl do gl do numerador

denominador 1 2 3 4 5 6 7 8 9 10 11 12

32 9,09 6,28 5,17 4,56 4,17 3,89 3,68 3,52 3,39 3,29 3,20 3,12

34 9,01 6,22 5,11 4,50 4,11 3,84 3,63 3,47 3,34 3,24 3,15 3,07

36 8,94 6,16 5,06 4,46 4,06 3,79 3,58 3,42 3,30 3,19 3,10 3,03

38 8,88 6,11 5,02 4,41 4,02 3,75 3,54 3,39 3,26 3,15 3,06 2,99

40 8,83 6,07 4,98 4,37 3,99 3,71 3,51 3,35 3,22 3,12 3,03 2,95

42 8,78 6,03 4,94 4,34 3,95 3,68 3,48 3,32 3,19 3,09 3,00 2,92

44 8,74 5,99 4,91 4,31 3,92 3,65 3,45 3,29 3,16 3,06 2,97 2,89

46 8,70 5,96 4,88 4,28 3,90 3,62 3,42 3,26 3,14 3,03 2,94 2,87

48 8,66 5,93 4,85 4,25 3,87 3,60 3,40 3,24 3,11 3,01 2,92 2,85

50 8,63 5,90 4,83 4,23 3,85 3,58 3,38 3,22 3,09 2,99 2,90 2,82

55 8,55 5,84 4,77 4,18 3,80 3,53 3,33 3,17 3,05 2,94 2,85 2,78

60 8,49 5,79 4,73 4,14 3,76 3,49 3,29 3,13 3,01 2,90 2,82 2,74

65 8,44 5,75 4,69 4,11 3,73 3,46 3,26 3,10 2,98 2,87 2,79 2,71

70 8,40 5,72 4,66 4,08 3,70 3,43 3,23 3,08 2,95 2,85 2,76 2,68

80 8,33 5,67 4,61 4,03 3,65 3,39 3,19 3,03 2,91 2,80 2,72 2,64

100 8,24 5,59 4,54 3,96 3,59 3,33 3,13 2,97 2,85 2,74 2,66 2,58

125 8,17 5,53 4,49 3,91 3,54 3,28 3,08 2,93 2,80 2,70 2,61 2,54

150 8,12 5,49 4,45 3,88 3,51 3,25 3,05 2,89 2,77 2,67 2,58 2,51

200 8,06 5,44 4,41 3,84 3,47 3,21 3,01 2,86 2,73 2,63 2,54 2,47

400 7,97 5,37 4,34 3,78 3,41 3,15 2,95 2,80 2,68 2,57 2,49 2,41

1000 7,91 5,33 4,30 3,74 3,37 3,11 2,92 2,77 2,64 2,54 2,45 2,38

infinito 7,88 5,30 4,28 3,72 3,35 3,09 2,90 2,74 2,62 2,52 2,43 2,36

BIOESTATISTICA_Vol_01.indb 356 25/06/12 17:14

Page 357: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 357

gl do gl do numerador

denominador 14 16 20 24 30 40 50 75 100 200 500 infinito

32 3,00 2,90 2,77 2,67 2,57 2,47 2,40 2,31 2,26 2,19 2,15 2,11

34 2,95 2,85 2,72 2,62 2,52 2,42 2,35 2,26 2,21 2,14 2,09 2,06

36 2,90 2,81 2,67 2,58 2,48 2,37 2,30 2,21 2,17 2,09 2,04 2,01

38 2,87 2,77 2,63 2,54 2,44 2,33 2,27 2,17 2,12 2,05 2,00 1,97

40 2,83 2,74 2,60 2,50 2,40 2,30 2,23 2,14 2,09 2,01 1,96 1,93

42 2,80 2,71 2,57 2,47 2,37 2,26 2,20 2,10 2,06 1,98 1,93 1,90

44 2,77 2,68 2,54 2,44 2,34 2,24 2,17 2,07 2,03 1,95 1,90 1,87

46 2,75 2,65 2,51 2,42 2,32 2,21 2,14 2,05 2,00 1,92 1,87 1,84

48 2,72 2,63 2,49 2,39 2,29 2,19 2,12 2,02 1,97 1,90 1,85 1,81

50 2,70 2,61 2,47 2,37 2,27 2,16 2,10 2,00 1,95 1,87 1,82 1,79

55 2,66 2,56 2,42 2,33 2,23 2,12 2,05 1,95 1,90 1,82 1,77 1,73

60 2,62 2,53 2,39 2,29 2,19 2,08 2,01 1,91 1,86 1,78 1,73 1,69

65 2,59 2,49 2,36 2,26 2,16 2,05 1,98 1,88 1,83 1,74 1,69 1,65

70 2,56 2,47 2,33 2,23 2,13 2,02 1,95 1,85 1,80 1,71 1,66 1,62

80 2,52 2,43 2,29 2,19 2,08 1,97 1,90 1,80 1,75 1,66 1,60 1,56

100 2,46 2,37 2,23 2,13 2,02 1,91 1,84 1,74 1,68 1,59 1,53 1,49

125 2,42 2,32 2,18 2,08 1,98 1,86 1,79 1,68 1,63 1,53 1,47 1,42

150 2,38 2,29 2,15 2,05 1,94 1,83 1,76 1,65 1,59 1,49 1,42 1,37

200 2,35 2,25 2,11 2,01 1,91 1,79 1,71 1,60 1,54 1,44 1,37 1,31

400 2,29 2,20 2,06 1,95 1,85 1,73 1,65 1,54 1,47 1,36 1,28 1,21

1000 2,26 2,16 2,02 1,92 1,81 1,69 1,61 1,50 1,43 1,31 1,22 1,13

infinito 2,24 2,14 2,00 1,90 1,79 1,67 1,59 1,47 1,40 1,28 1,17 1,01

Tabela 3.2 - Distribuição F: valores críticos para um teste bilateral (α = 0,01) (continuação)

BIOESTATISTICA_Vol_01.indb 357 25/06/12 17:14

Page 358: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental358

gl do gl do numerador

denominador 1 2 3 4 5 6 7 8 9 10 11 12

1 161 199 216 225 230 234 237 239 241 242 243 244

2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,40 19,41

3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,76 8,74

4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,94 5,91

5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,70 4,68

6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,03 4,00

7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,60 3,57

8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,31 3,28

9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,10 3,07

10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,94 2,91

11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,82 2,79

12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,72 2,69

13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,63 2,60

14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,57 2,53

15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,51 2,48

16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,46 2,42

17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,41 2,38

18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,37 2,34

19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,34 2,31

20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,31 2,28

21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,28 2,25

22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,26 2,23

23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,24 2,20

24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,22 2,18

25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,20 2,16

26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,18 2,15

27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,17 2,13

28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,15 2,12

29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,14 2,10

30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,13 2,09

Tabela 4.1 - Distribuição F: valores críticos para um teste unilateral (α = 0,05)

BIOESTATISTICA_Vol_01.indb 358 25/06/12 17:14

Page 359: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 359

gl do gl do numerador

denominador 14 16 20 24 30 40 50 75 100 200 500 infinito

1 245 246 248 249 250 251 252 253 253 254 254 254

2 19,42 19,43 19,45 19,45 19,46 19,47 19,48 19,48 19,49 19,49 19,49 19,50

3 8,71 8,69 8,66 8,64 8,62 8,59 8,58 8,56 8,55 8,54 8,53 8,53

4 5,87 5,84 5,80 5,77 5,75 5,72 5,70 5,68 5,66 5,65 5,64 5,63

5 4,64 4,60 4,56 4,53 4,50 4,46 4,44 4,42 4,41 4,39 4,37 4,36

6 3,96 3,92 3,87 3,84 3,81 3,77 3,75 3,73 3,71 3,69 3,68 3,67

7 3,53 3,49 3,44 3,41 3,38 3,34 3,32 3,29 3,27 3,25 3,24 3,23

8 3,24 3,20 3,15 3,12 3,08 3,04 3,02 2,99 2,97 2,95 2,94 2,93

9 3,03 2,99 2,94 2,90 2,86 2,83 2,80 2,77 2,76 2,73 2,72 2,71

10 2,86 2,83 2,77 2,74 2,70 2,66 2,64 2,60 2,59 2,56 2,55 2,54

11 2,74 2,70 2,65 2,61 2,57 2,53 2,51 2,47 2,46 2,43 2,42 2,40

12 2,64 2,60 2,54 2,51 2,47 2,43 2,40 2,37 2,35 2,32 2,31 2,30

13 2,55 2,51 2,46 2,42 2,38 2,34 2,31 2,28 2,26 2,23 2,22 2,21

14 2,48 2,44 2,39 2,35 2,31 2,27 2,24 2,21 2,19 2,16 2,14 2,13

15 2,42 2,38 2,33 2,29 2,25 2,20 2,18 2,14 2,12 2,10 2,08 2,07

16 2,37 2,33 2,28 2,24 2,19 2,15 2,12 2,09 2,07 2,04 2,02 2,01

17 2,33 2,29 2,23 2,19 2,15 2,10 2,08 2,04 2,02 1,99 1,97 1,96

18 2,29 2,25 2,19 2,15 2,11 2,06 2,04 2,00 1,98 1,95 1,93 1,92

19 2,26 2,21 2,16 2,11 2,07 2,03 2,00 1,96 1,94 1,91 1,89 1,88

20 2,22 2,18 2,12 2,08 2,04 1,99 1,97 1,93 1,91 1,88 1,86 1,84

21 2,20 2,16 2,10 2,05 2,01 1,96 1,94 1,90 1,88 1,84 1,83 1,81

22 2,17 2,13 2,07 2,03 1,98 1,94 1,91 1,87 1,85 1,82 1,80 1,78

23 2,15 2,11 2,05 2,01 1,96 1,91 1,88 1,84 1,82 1,79 1,77 1,76

24 2,13 2,09 2,03 1,98 1,94 1,89 1,86 1,82 1,80 1,77 1,75 1,73

25 2,11 2,07 2,01 1,96 1,92 1,87 1,84 1,80 1,78 1,75 1,73 1,71

26 2,09 2,05 1,99 1,95 1,90 1,85 1,82 1,78 1,76 1,73 1,71 1,69

27 2,08 2,04 1,97 1,93 1,88 1,84 1,81 1,76 1,74 1,71 1,69 1,67

28 2,06 2,02 1,96 1,91 1,87 1,82 1,79 1,75 1,73 1,69 1,67 1,65

29 2,05 2,01 1,94 1,90 1,85 1,81 1,77 1,73 1,71 1,67 1,65 1,64

30 2,04 1,99 1,93 1,89 1,84 1,79 1,76 1,72 1,70 1,66 1,64 1,62

Tabela 4.1 - Distribuição F: valores críticos para um teste unilateral (α = 0,05)

BIOESTATISTICA_Vol_01.indb 359 25/06/12 17:14

Page 360: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental360

Tabela 4.1 - Distribuição F: valores críticos para um teste unilateral (α = 0,05) (continuação)

gl do gl do numerador

denominador 1 2 3 4 5 6 7 8 9 10 11 12

32 4,15 3,29 2,90 2,67 2,51 2,40 2,31 2,24 2,19 2,14 2,10 2,07

34 4,13 3,28 2,88 2,65 2,49 2,38 2,29 2,23 2,17 2,12 2,08 2,05

36 4,11 3,26 2,87 2,63 2,48 2,36 2,28 2,21 2,15 2,11 2,07 2,03

38 4,10 3,24 2,85 2,62 2,46 2,35 2,26 2,19 2,14 2,09 2,05 2,02

40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,04 2,00

42 4,07 3,22 2,83 2,59 2,44 2,32 2,24 2,17 2,11 2,06 2,03 1,99

44 4,06 3,21 2,82 2,58 2,43 2,31 2,23 2,16 2,10 2,05 2,01 1,98

46 4,05 3,20 2,81 2,57 2,42 2,30 2,22 2,15 2,09 2,04 2,00 1,97

48 4,04 3,19 2,80 2,57 2,41 2,29 2,21 2,14 2,08 2,03 1,99 1,96

50 4,03 3,18 2,79 2,56 2,40 2,29 2,20 2,13 2,07 2,03 1,99 1,95

55 4,02 3,16 2,77 2,54 2,38 2,27 2,18 2,11 2,06 2,01 1,97 1,93

60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,95 1,92

65 3,99 3,14 2,75 2,51 2,36 2,24 2,15 2,08 2,03 1,98 1,94 1,90

70 3,98 3,13 2,74 2,50 2,35 2,23 2,14 2,07 2,02 1,97 1,93 1,89

80 3,96 3,11 2,72 2,49 2,33 2,21 2,13 2,06 2,00 1,95 1,91 1,88

100 3,94 3,09 2,70 2,46 2,31 2,19 2,10 2,03 1,97 1,93 1,89 1,85

125 3,92 3,07 2,68 2,44 2,29 2,17 2,08 2,01 1,96 1,91 1,87 1,83

150 3,90 3,06 2,66 2,43 2,27 2,16 2,07 2,00 1,94 1,89 1,85 1,82

200 3,89 3,04 2,65 2,42 2,26 2,14 2,06 1,98 1,93 1,88 1,84 1,80

400 3,86 3,02 2,63 2,39 2,24 2,12 2,03 1,96 1,90 1,85 1,81 1,78

1000 3,85 3,00 2,61 2,38 2,22 2,11 2,02 1,95 1,89 1,84 1,80 1,76

infinito 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,79 1,75

BIOESTATISTICA_Vol_01.indb 360 25/06/12 17:14

Page 361: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 361

gl do gl do numerador

denominador 14 16 20 24 30 40 50 75 100 200 500 infinito

32 2,01 1,97 1,91 1,86 1,82 1,77 1,74 1,69 1,67 1,63 1,61 1,59

34 1,99 1,95 1,89 1,84 1,80 1,75 1,71 1,67 1,65 1,61 1,59 1,57

36 1,98 1,93 1,87 1,82 1,78 1,73 1,69 1,65 1,62 1,59 1,56 1,55

38 1,96 1,92 1,85 1,81 1,76 1,71 1,68 1,63 1,61 1,57 1,54 1,53

40 1,95 1,90 1,84 1,79 1,74 1,69 1,66 1,61 1,59 1,55 1,53 1,51

42 1,94 1,89 1,83 1,78 1,73 1,68 1,65 1,60 1,57 1,53 1,51 1,49

44 1,92 1,88 1,81 1,77 1,72 1,67 1,63 1,59 1,56 1,52 1,49 1,48

46 1,91 1,87 1,80 1,76 1,71 1,65 1,62 1,57 1,55 1,51 1,48 1,46

48 1,90 1,86 1,79 1,75 1,70 1,64 1,61 1,56 1,54 1,49 1,47 1,45

50 1,89 1,85 1,78 1,74 1,69 1,63 1,60 1,55 1,52 1,48 1,46 1,44

55 1,88 1,83 1,76 1,72 1,67 1,61 1,58 1,53 1,50 1,46 1,43 1,41

60 1,86 1,82 1,75 1,70 1,65 1,59 1,56 1,51 1,48 1,44 1,41 1,39

65 1,85 1,80 1,73 1,69 1,63 1,58 1,54 1,49 1,46 1,42 1,39 1,37

70 1,84 1,79 1,72 1,67 1,62 1,57 1,53 1,48 1,45 1,40 1,37 1,35

80 1,82 1,77 1,70 1,65 1,60 1,54 1,51 1,45 1,43 1,38 1,35 1,32

100 1,79 1,75 1,68 1,63 1,57 1,52 1,48 1,42 1,39 1,34 1,31 1,28

125 1,77 1,73 1,66 1,60 1,55 1,49 1,45 1,40 1,36 1,31 1,27 1,25

150 1,76 1,71 1,64 1,59 1,54 1,48 1,44 1,38 1,34 1,29 1,25 1,22

200 1,74 1,69 1,62 1,57 1,52 1,46 1,41 1,35 1,32 1,26 1,22 1,19

400 1,72 1,67 1,60 1,54 1,49 1,42 1,38 1,32 1,28 1,22 1,17 1,13

1000 1,70 1,65 1,58 1,53 1,47 1,41 1,36 1,30 1,26 1,19 1,13 1,08

infinito 1,69 1,64 1,57 1,52 1,46 1,39 1,35 1,28 1,24 1,17 1,11 1,00

Tabela 4.1 - Distribuição F: valores críticos para um teste unilateral (α = 0,05) (continuação)

BIOESTATISTICA_Vol_01.indb 361 25/06/12 17:14

Page 362: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental362

gl do gl do numerador

denominador 1 2 3 4 5 6 7 8 9 10 11 12

1 4052 4999 5404 5624 5764 5859 5928 5981 6022 6056 6083 6107

2 98,50 99,00 99,16 99,25 99,30 99,33 99,36 99,38 99,39 99,40 99,41 99,42

3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,34 27,23 27,13 27,05

4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 14,45 14,37

5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05 9,96 9,89

6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7,79 7,72

7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62 6,54 6,47

8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,73 5,67

9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 5,18 5,11

10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85 4,77 4,71

11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54 4,46 4,40

12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 4,22 4,16

13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10 4,02 3,96

14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,94 3,86 3,80

15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 3,73 3,67

16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69 3,62 3,55

17 8,40 6,11 5,19 4,67 4,34 4,10 3,93 3,79 3,68 3,59 3,52 3,46

18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 3,51 3,43 3,37

19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43 3,36 3,30

20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37 3,29 3,23

21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40 3,31 3,24 3,17

22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 3,26 3,18 3,12

23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30 3,21 3,14 3,07

24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,17 3,09 3,03

25 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 3,13 3,06 2,99

26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18 3,09 3,02 2,96

27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15 3,06 2,99 2,93

28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12 3,03 2,96 2,90

29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09 3,00 2,93 2,87

30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98 2,91 2,84

Tabela 4.2 - Distribuição F: valores críticos para um teste unilateral (α = 0,01)

BIOESTATISTICA_Vol_01.indb 362 25/06/12 17:14

Page 363: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 363

gl do gl do numerador

denominador 14 16 20 24 30 40 50 75 100 200 500 infinito

1 6143 6170 6209 6234 6260 6286 6302 6324 6334 6350 6360 6366

2 99,43 99,44 99,45 99,46 99,47 99,48 99,48 99,48 99,49 99,49 99,50 99,50

3 26,92 26,83 26,69 26,60 26,50 26,41 26,35 26,28 26,24 26,18 26,15 26,13

4 14,25 14,15 14,02 13,93 13,84 13,75 13,69 13,61 13,58 13,52 13,49 13,46

5 9,77 9,68 9,55 9,47 9,38 9,29 9,24 9,17 9,13 9,08 9,04 9,02

6 7,60 7,52 7,40 7,31 7,23 7,14 7,09 7,02 6,99 6,93 6,90 6,88

7 6,36 6,28 6,16 6,07 5,99 5,91 5,86 5,79 5,75 5,70 5,67 5,65

8 5,56 5,48 5,36 5,28 5,20 5,12 5,07 5,00 4,96 4,91 4,88 4,86

9 5,01 4,92 4,81 4,73 4,65 4,57 4,52 4,45 4,41 4,36 4,33 4,31

10 4,60 4,52 4,41 4,33 4,25 4,17 4,12 4,05 4,01 3,96 3,93 3,91

11 4,29 4,21 4,10 4,02 3,94 3,86 3,81 3,74 3,71 3,66 3,62 3,60

12 4,05 3,97 3,86 3,78 3,70 3,62 3,57 3,50 3,47 3,41 3,38 3,36

13 3,86 3,78 3,66 3,59 3,51 3,43 3,38 3,31 3,27 3,22 3,19 3,17

14 3,70 3,62 3,51 3,43 3,35 3,27 3,22 3,15 3,11 3,06 3,03 3,00

15 3,56 3,49 3,37 3,29 3,21 3,13 3,08 3,01 2,98 2,92 2,89 2,87

16 3,45 3,37 3,26 3,18 3,10 3,02 2,97 2,90 2,86 2,81 2,78 2,75

17 3,35 3,27 3,16 3,08 3,00 2,92 2,87 2,80 2,76 2,71 2,68 2,65

18 3,27 3,19 3,08 3,00 2,92 2,84 2,78 2,71 2,68 2,62 2,59 2,57

19 3,19 3,12 3,00 2,92 2,84 2,76 2,71 2,64 2,60 2,55 2,51 2,49

20 3,13 3,,05 2,94 2,86 2,78 2,69 2,64 2,57 2,54 2,48 2,44 2,42

21 3,07 2,99 2,88 2,80 2,72 2,64 2,58 2,51 2,48 2,42 2,38 2,36

22 3,02 2,94 2,83 2,75 2,67 2,58 2,53 2,46 2,42 2,36 2,33 2,31

23 2,97 2,89 2,78 2,70 2,62 2,54 2,48 2,41 2,37 2,32 2,28 2,26

24 2,93 2,85 2,74 2,66 2,58 2,49 2,44 2,37 2,33 2,27 2,24 2,21

25 2,89 2,81 2,70 2,62 2,54 2,45 2,40 2,33 2,29 2,23 2,19 2,17

26 2,86 2,78 2,66 2,58 2,50 2,42 2,36 2,29 2,25 2,19 2,16 2,13

27 2,82 2,75 2,63 2,55 2,47 2,38 2,33 2,26 2,22 2,16 2,12 2,10

28 2,79 2,72 2,60 2,52 2,44 2,35 2,30 2,23 2,19 2,13 2,09 2,06

29 2,77 2,69 2,57 2,49 2,41 2,33 2,27 2,20 2,16 2,10 2,06 2,03

30 2,74 2,66 2,55 2,47 2,39 2,30 2,25 2,17 2,13 2,07 2,03 2,01

Tabela 4.2 - Distribuição F: valores críticos para um teste unilateral (α = 0,01) (continuação)

BIOESTATISTICA_Vol_01.indb 363 25/06/12 17:14

Page 364: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental364

Tabela 4.2 - Distribuição F: valores críticos para um teste unilateral (α = 0,01) (continuação)

gl do gl do numerador

denominador 1 2 3 4 5 6 7 8 9 10 11 12

32 7,50 5,34 4,46 3,97 3,65 3,43 3,26 3,13 3,02 2,93 2,86 2,80

34 7,44 5,29 4,42 3,93 3,61 3,39 3,22 3,09 2,98 2,89 2,82 2,76

36 7,40 5,25 4,38 3,89 3,57 3,35 3,18 3,05 2,95 2,86 2,79 2,72

38 7,35 5,21 4,34 3,86 3,54 3,32 3,15 3,02 2,92 2,83 2,75 2,69

40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 2,73 2,66

42 7,28 5,15 4,29 3,80 3,49 3,27 3,10 2,97 2,86 2,78 2,70 2,64

44 7,25 5,12 4,26 3,78 3,47 3,24 3,08 2,95 2,84 2,75 2,68 2,62

46 7,22 5,10 4,24 3,76 3,44 3,22 3,06 2,93 2,82 2,73 2,66 2,60

48 7,19 5,08 4,22 3,74 3,43 3,20 3,04 2,91 2,80 2,71 2,64 2,58

50 7,17 5,06 4,20 3,72 3,41 3,19 3,02 2,89 2,78 2,70 2,63 2,56

55 7,12 5,01 4,16 3,68 3,37 3,15 2,98 2,85 2,75 2,66 2,59 2,53

60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 2,63 2,56 2,50

65 7,04 4,95 4,10 3,62 3,31 3,09 2,93 2,80 2,69 2,61 2,53 2,47

70 7,01 4,92 4,07 3,60 3,29 3,07 2,91 2,78 2,67 2,59 2,51 2,45

80 6,96 4,88 4,04 3,56 3,26 3,04 2,87 2,74 2,64 2,55 2,48 2,42

100 6,90 4,82 3,98 3,51 3,21 2,99 2,82 2,69 2,59 2,50 2,43 2,37

125 6,84 4,78 3,94 3,47 3,17 2,95 2,79 2,66 2,55 2,47 2,39 2,33

150 6,81 4,75 3,91 3,45 3,14 2,92 2,76 2,63 2,53 2,44 2,37 2,31

200 6,76 4,71 3,88 3,41 3,11 2,89 2,73 2,60 2,50 2,41 2,34 2,27

400 6,70 4,66 3,83 3,37 3,06 2,85 2,68 2,56 2,45 2,37 2,29 2,23

1000 6,66 4,63 3,80 3,34 3,04 2,82 2,66 2,53 2,43 2,34 2,27 2,20

infinito 6,63 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41 2,32 2,25 2,18

BIOESTATISTICA_Vol_01.indb 364 25/06/12 17:14

Page 365: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 365

gl do gl do numerador

denominador 14 16 20 24 30 40 50 75 100 200 500 infinito

32 2,70 2,62 2,50 2,42 2,34 2,25 2,20 2,12 2,08 2,02 1,98 1,96

34 2,66 2,58 2,46 2,38 2,30 2,21 2,16 2,08 2,04 1,98 1,94 1,91

36 2,62 2,54 2,43 2,35 2,26 2,18 2,12 2,04 2,00 1,94 1,90 1,87

38 2,59 2,51 2,40 2,32 2,23 2,14 2,09 2,01 1,97 1,90 1,86 1,84

40 2,56 2,48 2,37 2,29 2,20 2,11 2,06 1,98 1,94 1,87 1,83 1,80

42 2,54 2,46 2,34 2,26 2,18 2,09 2,03 1,95 1,91 1,85 1,80 1,78

44 2,52 2,44 2,32 2,24 2,15 2,07 2,01 1,93 1,89 1,82 1,78 1,75

46 2,50 2,42 2,30 2,22 2,13 2,04 1,99 1,91 1,86 1,80 1,76 1,73

48 2,48 2,40 2,28 2,20 2,12 2,02 1,97 1,89 1,84 1,78 1,73 1,70

50 2,46 2,38 2,27 2,18 2,10 2,01 1,95 1,87 1,82 1,76 1,71 1,68

55 2,42 2,34 2,23 2,15 2,06 1,97 1,91 1,83 1,78 1,71 1,67 1,64

60 2,39 2,31 2,20 2,12 2,03 1,94 1,88 1,79 1,75 1,68 1,63 1,60

65 2,37 2,29 2,17 2,09 2,00 1,91 1,85 1,77 1,72 1,65 1,60 1,57

70 2,35 2,27 2,15 2,07 1,98 1,89 1,83 1,74 1,70 1,62 1,57 1,54

80 2,31 2,23 2,12 2,03 1,94 1,85 1,79 1,70 1,65 1,58 1,53 1,49

100 2,27 2,19 2,07 1,98 1,89 1,80 1,74 1,65 1,60 1,52 1,47 1,43

125 2,23 2,15 2,03 1,94 1,85 1,76 1,69 1,60 1,55 1,47 1,41 1,37

150 2,20 2,12 2,00 1,92 1,83 1,73 1,66 1,57 1,52 1,43 1,38 1,33

200 2,17 2,09 1,97 1,89 1,79 1,69 1,63 1,53 1,48 1,39 1,33 1,28

400 2,13 2,05 1,92 1,84 1,75 1,64 1,58 1,48 1,42 1,32 1,25 1,19

1000 2,10 2,02 1,90 1,81 1,72 1,61 1,54 1,44 1,38 1,28 1,19 1,11

infinito 2,08 2,00 1,88 1,79 1,70 1,59 1,52 1,42 1,36 1,25 1,15 1,00

Tabela 4.2 - Distribuição F: valores críticos para um teste unilateral (α = 0,01) (continuação)

BIOESTATISTICA_Vol_01.indb 365 25/06/12 17:14

Page 366: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

BIOESTATISTICA_Vol_01.indb 366 25/06/12 17:14

Page 367: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 367

P

n x 0,050 0,100 0,200 0,300 0,400 0,500 0,600 0,700 0,800 0,900 0,950

2 0 0,903 0,810 0,640 0,490 0,360 0,250 0,160 0,090 0,040 0,010 0,003

1 0,095 0,180 0,320 0,420 0,480 0,500 0,480 0,420 0,320 0,180 0,095

2 0,003 0,010 0,040 0,090 0,160 0,250 0,360 0,490 0,640 0,810 0,903

3 0 0,857 0,729 0,512 0,343 0,216 0,125 0,064 0,027 0,008 0,001

1 0,135 0,243 0,384 0,441 0,432 0,375 0,288 0,189 0,096 0,027 0,007

2 0,007 0,027 0,096 0,189 0,288 0,375 0,432 0,441 0,384 0,243 0,135

3 0,001 0,008 0,027 0,064 0,125 0,216 0,343 0,512 0,729 0,857

4 0 0,815 0,656 0,410 0,240 0,130 0,063 0,026 0,008 0,002

1 0,171 0,292 0,410 0,412 0,346 0,250 0,154 0,076 0,026 0,004

2 0,014 0,049 0,154 0,265 0,346 0,375 0,346 0,265 0,154 0,049 0,014

3 0,004 0,026 0,076 0,154 0,250 0,346 0,412 0,410 0,292 0,171

4 0,002 0,008 0,026, 0,063 0,130 0,240 0,410 0,656 0,815

5 0 0,774 0,590 0,328 0,168 0,078 0,031 0,010 0,002

1 0,204 0,328 0,410 0,360 0,259 0,156 0,077 0,028 0,006

2 0,021 0,073 0,205 0,309 0,346 0,313 0,230 0,132 0,051 0,008 0,001

3 0,001 0,008 0,051 0,132 0,230 0,313 0,346 0,309 0,205 0,073 0,021

4 0,006 0,028 0,077 0,156 0,259 0,360 0,410 0,328 0,204

5 0,002 0,010 0,031 0,078 0,168 0,328 0,590 0,774

6 0 0,735 0,531 0,262 0,118 0,047 0,016 0,004 0,001

1 0,232 0,354 0,393 0,303 0,187 0,094 0,037 0,010 0,002

2 0,031 0,098 0,246 0,324 0,311 0,234 0,138 0,060 0,015 0,001

3 0,002 0,015 0,082 0,185 0,276 0,313 0,276 0,185 0,082 0,015 0,002

4 0,001 0,015 0,060 0,138 0,234 0,311 0,324 0,246 0,098 0,031

5 0,002 0,010 0,037 0,094 0,187 0,303 0,393 0,354 0,232

6 0,001 0,004 0,016 0,047 0,118 0,262 0,531 0,735

7 0 0,698 0,478 0,210 0,082 0,028 0,008 0,002

1 0,257 0,372 0,367 0,247 0,131 0,055 0,017 0,004

2 0,041 0,124 0,275 0,318 0,261 0,164 0,077 0,025 0,004

3 0,004 0,023 0,115 0,227 0,290 0,273 0,194 0,097 0,029 0,003

4 0,003 0,029 0,097 0,194 0,273 0,290 0,227 0,115 0,023 0,004

5 0,004 0,025 0,077 0,164 0,261 0,318 0,275 0,124 0,041

6 0,004 0,017 0,055 0,131 0,247 0,367 0,372 0,257

7 0,002 0,008 0,028 0,082 0,210 0,478 0,698

Tabela 5 - Distribuição binomial: probabilidades para x sucessos em n observações

BIOESTATISTICA_Vol_01.indb 367 25/06/12 17:14

Page 368: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental368

P

n x 0,050 0,100 0,200 0,300 0,400 0,500 0,600 0,700 0,800 0,900 0,950

8 0 0,663 0,430 0,168 0,058 0,017 0,004 0,001

1 0,279 0,383 0,336 0,198 0,090 0,031 0,008 0,001

2 0,051 0,149 0,294 0,296 0,209 0,109 0,041 0,010 0,001

3 0,005 0,033 0,147 0,254 0,279 0,219 0,124 0,047 0,009

4 0,005 0,046 0,136 0,232 0,273 0,232 0,136 0,046 0,005

5 0,009 0,047 0,124 0,219 0,279 0,254 0,147 0,033 0,005

6 0,001 0,010 0,041 0,109 0,209 0,296 0,294 0,149 0,051

7 0,001 0,008 0,031 0,090 0,198 0,336 0,383 0,279

8 0,001 0,004 0,017 0,058 0,168 0,430 0,663

9 0 0,630 0,387 0,134 0,040 0,010 0,002

1 0,299 0,387 0,302 0,156 0,060 0,018 0,004

2 0,063 0,172 0,302 0,267 0,161 0,070 0,021 0,004

3 0,008 0,045 0,176 0,267 0,251 0,164 0,074 0,021 0,003

4 0,001 0,007 0,066 0,172 0,251 0,246 0,167 0,074 0,017 0,001

5 0,001 0,017 0,074 0,167 0,246 0,251 0,172 0,066 0,007 0,001

6 0,003 0,021 0,074 0,164 0,251 0,267 0,176 0,045 0,008

7 0,004 0,021 0,070 0,161 0,267 0,302 0,172 0,063

8 0,004 0,018 0,060 0,156 0,302 0,387 0,299

9 0,002 0,010 0,040 0,134 0,387 0,630

10 0 0,599 0,349 0,107 0,028 0,006 0,001

1 0,315 0,387 0,268 0,121 0,040 0,010 0,002

2 0,075 0,194 0,302 0,233 0,121 0,044 0,011 0,001

3 0,010 0,057 0,201 0,267 0,215 0,117 0,042 0,009 0,001

4 0,001 0,011 0,088 0,200 0,251 0,205 0,111 0,037 0,006

5 0,001 0,026 0,103 0,201 0,246 0,201 0,103 0,026 0,001

6 0,006 0,037 0,111 0,205 0,251 0,200 0,088 0,011 0,001

7 0,001 0,009 0,042 0,117 0,215 0,267 0,201 0,057 0,010

8 0,001 0,011 0,044 0,121 0,233 0,302 0,194 0,075

9 0,002 0,010 0,040 0,121 0,268 0,387 0,315

10 0,001 0,006 0,028 0,107 0,349 0,599

11 0 0,569 0,314 0,086 0,020 0,004

1 0,329 0,384 0,236 0,093 0,027 0,005 0,001

2 0,087 0,213 0,295 0,200 0,089 0,027 0,005 0,001

Tabela 5 - Distribuição binomial: probabilidades para x sucessos em n observações (continuação)

BIOESTATISTICA_Vol_01.indb 368 25/06/12 17:14

Page 369: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 369

P

n x 0,050 0,100 0,200 0,300 0,400 0,500 0,600 0,700 0,800 0,900 0,950

11 3 0,014 0,071 0,221 0,257 0,177 0,081 0,023 0,004

4 0,001 0,016 0,111 0,220 0,236 0,161 0,070 0,017 0,002

5 0,002 0,039 0,132 0,221 0,226 0,147 0,057 0,010

6 0,010 0,057 0,147 0,226 0,221 0,132 0,039 0,002

7 0,002 0,017 0,070 0,161 0,236 0,220 0,111 0,016 0,001

8 0,004 0,023 0,081 0,177 0,257 0,221 0,071 0,014

9 0,001 0,005 0,027 0,089 0,200 0,295 0,213 0,087

10 0,001 0,005 0,027 0,093 0,236 0,384 0,329

11 0,004 0,020 0,086 0,314 0,569

12 0 0,540 0,282 0,069 0,014 0,002

1 0,341 0,377 0,206 0,071 0,017 0,003

2 0,099 0,230 0,283 0,168 0,064 0,016 0,002

3 0,017 0,085 0,236 0,240 0,142 0,054 0,012 0,001

4 0,002 0,021 0,133 0,231 0,213 0,121 0,042 0,008 0,001

5 0,004 0,053 0,158 0,227 0,193 0,101 0,029 0,003

6 0,016 0,079 0,177 0,226 0,177 0,079 0,016

7 0,003 0,029 0,101 0,193 0,227 0,158 0,053 0,004

8 0,001 0,008 0,042 0,121 0,213 0,231 0,133 0,021 0,002

9 0,001 0,012 0,054 0,142 0,240 0,236 0,085 0,017

10 0,002 0,016 0,064 0,168 0,283 0,230 0,099

11 0,003 0,017 0,071 0,206 0,377 0,341

12 0,002 0,014 0,069 0,282 0,540

16 0 0,440 0,185 0,028 0,003

1 0,371 0,329 0,113 0,023 0,003

2 0,146 0,275 0,211 0,073 0,015 0,002

3 0,036 0,142 0,246 0,146 0,047 0,009 0,001

4 0,006 0,051 0,200 0,204 0,101 0,028 0,004

5 0,001 0,014 0,120 0,210 0,162 0,067 0,014 0,001

6 0,003 0,055 0,165 0,198 0,122 0,039 0,006

7 0,020 0,101 0,189 0,175 0,084 0,019 0,001

8 0,006 0,049 0,142 0,196 0,142 0,049 0,006

9 0,001 0,019 0,084 0,175 0,189 0,101 0,020

10 0,006 0,039 0,122 0,198 0,165 0,055 0,003

11 0,001 0,014 0,067 0,162 0,210 0,120 0,014 0,001

Tabela 5 - Distribuição binomial: probabilidades para x sucessos em n observações (continuação)

BIOESTATISTICA_Vol_01.indb 369 25/06/12 17:14

Page 370: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental370

P

n x 0,050 0,100 0,200 0,300 0,400 0,500 0,600 0,700 0,800 0,900 0,950

16 12 0,004 0,028 0,101 0,204 0,200 0,051 0,006

13 0,001 0,009 0,047 0,146 0,246 0,142 0,036

14 0,002 0,015 0,073 0,211 0,275 0,146

15 0,003 0,023 0,113 0,329 0,371

16 0,003 0,028 0,185 0,440

20 0 0,358 0,122 0,012 0,001

1 0,377 0,270 0,058 0,007

2 0,189 0,285 0,137 0,028 0,003

3 0,060 0,190 0,205 0,072 0,012 0,001

4 0,013 0,090 0,218 0,130 0,035 0,005

5 0,002 0,032 0,175 0,179 0,075 0,015 0,001

6 0,009 0,109 0,192 0,124 0,037 0,005

7 0,002 0,055 0,164 0,166 0,074 0,015 0,001

8 0,022 0,114 0,180 0,120 0,035 0,004

9 0,007 0,065 0,160 0,160 0,071 0,012

10 0,002 0,031 0,117 0,176 0,117 0,031 0,002

11 0,012 0,071 0,160 0,160 0,065 0,007

12 0,004 0,035 0,120 0,180 0,114 0,022

13 0,001 0,015 0,074 0,166 0,164 0,055 0,002

14 0,005 0,037 0,124 0,192 0,109 0,009

15 0,001 0,015 0,075 0,179 0,175 0,032 0,002

16 0,005 0,035 0,130 0,218 0,090 0,013

17 0,001 0,012 0,072 0,205 0,190 0,060

18 0,003 0,028 0,137 0,285 0,189

19 0,007 0,058 0,270 0,377

20 0,001 0,012 0,122 0,358

Tabela 5 - Distribuição binomial: probabilidades para x sucessos em n observações (continuação)

BIOESTATISTICA_Vol_01.indb 370 25/06/12 17:14

Page 371: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 371

α

gl 0,20 0,10 0,05 0,02 0,01 0,001

1 1,64 2,71 3,84 5,41 6,63 10,83

2 3,22 4,61 5,99 7,82 9,21 13,82

3 4,64 6,25 7,81 9,84 11,34 16,27

4 5,99 7,78 9,49 11,67 13,28 18,47

5 7,29 9,24 11,07 13,39 15,09 20,51

6 8,56 10,64 12,59 15,03 16,81 22,46

7 9,80 12,02 14,07 16,62 18,48 24,32

8 11,03 13,36 15,51 18,17 20,09 26,12

9 12,24 14,68 16,92 19,68 21,67 27,88

10 13,44 15,99 18,31 21,16 23,21 29,59

11 14,63 17,28 19,68 22,62 24,73 31,26

12 15,81 18,55 21,03 24,05 26,22 32,91

13 16,98 19,81 22,36 25,47 27,69 34,53

14 18,15 21,06 23,68 26,87 29,14 36,12

15 19,31 22,31 25,00 28,26 30,58 37,70

16 20,47 23,54 26,30 29,63 32,00 39,25

17 21,61 24,77 27,59 31,00 33,41 40,79

18 22,76 25,99 28,87 32,35 34,81 42,31

19 23,90 27,20 30,14 33,69 36,19 43,82

20 25,04 28,41 31,41 35,02 37,57 45,31

21 26,17 29,62 32,67 36,34 38,93 46,80

22 27,30 30,81 33,92 37,66 40,29 48,27

23 28,43 32,01 35,17 38,97 41,64 49,73

24 29,55 33,20 36,42 40,27 42,98 51,18

25 30,68 34,38 37,65 41,57 44,31 52,62

26 31,79 35,56 38,89 42,86 45,64 54,05

27 32,91 36,74 40,11 44,14 46,96 55,48

28 34,03 37,92 41,34 45,42 48,28 56,89

29 35,14 39,09 42,56 46,69 49,59 58,30

30 36,25 40,26 43,77 47,96 50,89 59,70

Tabela 6 - Valores críticos da distribuição qui-quadrado (χ2 )

BIOESTATISTICA_Vol_01.indb 371 25/06/12 17:14

Page 372: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental372

gl k: 2 3 4 5 6 7 8 9 10

1 17,97 26,98 32,82 37,08 40,41 43,12 45,40 47,36 49,07

2 6,085 8,331 9,798 10,88 11,74 12,44 13,03 13,54 13,99

3 4,501 5,910 6,825 7,502 8,037 8,478 8,853 9,177 9,462

4 3,927 5,040 5,757 6,287 6,707 7,053 7,347 7,602 7,826

5 3,635 4,602 5,218 5,673 6,033 6,330 6,582 6,802 6,995

6 3,461 4,339 4,896 5,305 5,628 5,895 6,122 6,319 6,493

7 3,344 4,165 4,681 5,060 5,359 5,606 5,815 5,998 6,158

8 3,261 4,041 4,529 4,886 5,167 5,399 5,597 5,767 5,918

9 3,199 3,949 4,415 4,756 5,024 5,244 5,432 5,595 5,739

10 3,151 3,877 4,327 4,654 4,912 5,124 5,305 5,461 5,599

11 3,113 3,820 4,256 4,574 4,823 5,028 5,202 5,353 5,487

12 3,082 3,773 4,199 4,508 4,751 4,950 5,119 5,265 5,395

13 3,055 3,735 4,151 4,453 4,690 4,885 5,049 5,192 5,318

14 3,033 3,702 4,111 4,407 4,639 4,829 4,990 5,131 5,254

15 3,014 3,674 4,076 4,367 4,595 4,782 4,940 5,077 5,198

16 2,998 3,649 4,046 4,333 4,557 4,741 4,897 5,031 5,150

17 2,984 3,628 4,020 4,303 4,524 4,705 4,858 4,991 5,108

18 2,971 3,609 3,997 4,277 4,495 4,673 4,824 4,956 5,071

19 2,960 3,593 3,977 4,253 4,469 4,645 4,794 4,924 5,038

20 2,950 3,578 3,958 4,232 4,445 4,620 4,768 4,896 5,008

24 2,919 3,532 3,901 4,166 4,373 4,541 4,684 4,807 4,915

30 2,888 3,486 3,845 4,102 4,302 4,464 4,602 4,720 4,824

40 2,858 3,442 3,791 4,039 4,232 4,389 4,521 4,635 4,735

60 2,829 3,399 3,737 3,977 4,163 4,314 4,441 4,550 4,646

120 2,800 3,356 3,685 3,917 4,096 4,241 4,363 4,468 4,560

Infinito 2,772 3,314 3,633 3,858 4,030 4,170 4,286 4,387 4,474

Tabela 7 - Valores críticos da distribuição q para α = 0,05

BIOESTATISTICA_Vol_01.indb 372 25/06/12 17:14

Page 373: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 373

gl k: 11 12 13 14 15 16 17 18 19

1 50,59 51,96 53,20 54,33 55,36 56,32 57,22 58,04 58,83

2 14,39 14,75 15,08 15,38 15,65 15,91 16,14 16,37 16,57

3 9,717 9,946 10,15 10,35 10,53 10,69 10,84 10,98 11,11

4 8,027 8,208 8,373 8,525 8,664 8,794 8,914 9,028 9,134

5 7,168 7,324 7,466 7,596 7,717 7,828 7,932 8,030 8,122

6 6,649 6,789 6,917 7,034 7,143 7,244 7,338 7,426 7,508

7 6,302 6,431 6,550 6,658 6,759 6,852 6,939 7,020 7,097

8 6,054 6,175 6,287 6,389 6,483 6,571 6,653 6,729 6,802

9 5,867 5,983 6,089 6,186 6,276 6,359 6,437 6,510 6,579

10 5,722 5,833 5,935 6,028 6,114 6,194 6,269 6,339 6,405

11 5,605 5,713 5,811 5,901 5,984 6,062 6,134 6,202 6,265

12 5,511 5,615 5,710 5,798 5,878 5,953 6,023 6,089 6,151

13 5,431 5,533 5,625 5,711 5,789 5,862 5,931 5,995 6,055

14 5,364 5,463 5,554 5,637 5,714 5,786 5,852 5,915 5,974

15 5,306 5,404 5,493 5,574 5,649 5,720 5,785 5,846 5,904

16 5,256 5,352 5,439 5,520 5,593 5,662 5,727 5,786 5,843

17 5,212 5,307 5,392 5,471 5,544 5,612 5,675 5,734 5,790

18 5,174 5,267 5,352 5,429 5,501 5,568 5,630 5,688 5,743

19 5,140 5,231 5,315 5,391 5,462 5,528 5,589 5,647 5,701

20 5,108 5,199 5,282 5,357 5,427 5,493 5,553 5,610 5,663

24 5,012 5,099 5,179 5,251 5,319 5,381 5,439 5,494 5,545

30 4,917 5,001 5,077 5,147 5,211 5,271 5,327 5,379 5,429

40 4,824 4,904 4,977 5,044 5,106 5,163 5,216 5,266 5,313

60 4,732 4,808 4,878 4,942 5,001 5,056 5,107 5,154 5,199

120 4,641 4,714 4,781 4,842 4,898 4,950 4,998 5,044 5,086

Infinito 4,552 4,622 4,685 4,743 4,796 4,845 4,891 4,934 4,974

Tabela 7 - Valores críticos da distribuição q para α = 0,05

BIOESTATISTICA_Vol_01.indb 373 25/06/12 17:14

Page 374: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental374

gl k: 20 22 24 26 28 30 32 34 36

1 59,56 60,91 62,12 63,22 64,23 65,15 66,01 66,81 67,56

2 16,77 17,13 17,45 17,75 18,02 18,27 18,50 18,72 18,92

3 11,24 11,47 11,68 11,87 12,05 12,21 12,36 12,50 12,63

4 9,233 9,418 9,584 9,736 9,875 10,00 10,12 10,23 10,34

5 8,208 8,368 8,512 8,643 8,764 8,875 8,979 9,075 9,165

6 7,587 7,730 7,861 7,979 8,088 8,189 8,283 8,370 8,452

7 7,170 7,303 7,423 7,533 7,634 7,728 7,814 7,895 7,972

8 6,870 6,995 7,109 7,212 7,307 7,395 7,477 7,554 7,625

9 6,644 6,763 6,871 6,970 7,061 7,145 7,222 7,295 7,363

10 6,467 6,582 6,686 6,781 6,868 6,948 7,023 7,093 7,159

11 6,326 6,436 6,536 6,628 6,712 6,790 6,863 6,930 6,994

12 6,209 6,317 6,414 6,503 6,585 6,660 6,731 6,796 6,858

13 6,112 6,217 6,312 6,398 6,478 6,551 6,620 6,684 6,744

14 6,029 6,132 6,224 6,309 6,387 6,459 6,526 6,588 6,647

15 5,958 6,059 6,149 6,233 6,309 6,379 6,445 6,506 6,564

16 5,897 5,995 6,084 6,166 6,241 6,310 6,374 6,434 6,491

17 5,842 5,940 6,027 6,107 6,181 6,249 6,313 6,372 6,427

18 5,794 5,890 5,977 6,055 6,128 6,195 6,258 6,316 6,371

19 5,752 5,846 5,932 6,009 6,081 6,147 6,209 6,267 6,321

20 5,714 5,807 5,891 5,968 6,039 6,104 6,165 6,222 6,275

24 5,594 5,683 5,764 5,838 5,906 5,968 6,027 6,081 6,132

30 5,475 5,561 5,638 5,709 5,774 5,833 5,889 5,941 5,990

40 5,358 5,439 5,513 5,581 5,642 5,700 5,753 5,803 5,849

60 5,241 5,319 5,389 5,453 5,512 5,566 5,617 5,664 5,708

120 5,126 5,200 5,266 5,327 5,382 5,434 5,481 5,526 5,568

Infinito 5,012 5,081 5,144 5,201 5,253 5,301 5,346 5,388 5,427

Tabela 7 - Valores críticos da distribuição q para α = 0,05 (continuação)

BIOESTATISTICA_Vol_01.indb 374 25/06/12 17:14

Page 375: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 375

gl k: 38 40 50 60 70 80 90 100

1 68,26 68,92 71,73 73,97 75,82 77,40 78,77 79,98

2 19,11 19,28 20,05 20,66 21,16 21,59 21,96 22,29

3 12,75 12,87 13,36 13,76 14,08 14,36 14,61 14,82

4 10,44 10,53 10,93 11,24 11,51 11,73 11,92 12,09

5 9,250 9,330 9,674 9,949 10,18 10,38 10,54 10,69

6 8,529 8,601 8,913 9,163 9,370 9,548 9,702 9,839

7 8,043 8,110 8,400 8,632 8,824 8,989 9,133 9,261

8 7,693 7,756 8,029 8,248 8,430 8,586 8,722 8,843

9 7,428 7,488 7,749 7,958 8,132 8,281 8,410 8,526

10 7,220 7,279 7,529 7,730 7,897 8,041 8,166 8,276

11 7,053 7,110 7,352 7,546 7,708 7,847 7,968 8,075

12 6,916 6,970 7,205 7,394 7,552 7,687 7,804 7,909

13 6,800 6,854 7,083 7,267 7,421 7,552 7,667 7,769

14 6,702 6,754 6,979 7,159 7,309 7,438 7,550 7,650

15 6,618 6,669 6,888 7,065 7,212 7,339 7,449 7,546

16 6,544 6,594 6,810 6,984 7,128 7,252 7,360 7,457

17 6,479 6,529 6,741 6,912 7,054 7,176 7,283 7,377

18 6,422 6,471 6,680 6,848 6,989 7,109 7,213 7,307

19 6,371 6,419 6,626 6,792 6,930 7,048 7,152 7,244

20 6,325 6,373 6,576 6,740 6,877 6,994 7,097 7,187

24 6,181 6,226 6,421 6,579 6,710 6,822 6,920 7,008

30 6,037 6,080 6,267 6,417 6,543 6,650 6,744 6,827

40 5,893 5,934 6,112 6,255 6,375 6,477 6,566 6,645

60 5,750 5,789 5,958 6,093 6,206 6,303 6,387 6,462

120 5,607 5,644 5,802 5,929 6,035 6,126 6,205 6,275

Infinito 5,463 5,498 5,646 5,764 5,863 5,947 6,020 6,085

Tabela 7 - Valores críticos da distribuição q para α = 0,05 (continuação)

BIOESTATISTICA_Vol_01.indb 375 25/06/12 17:14

Page 376: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

BIOESTATISTICA_Vol_01.indb 376 25/06/12 17:14

Page 377: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 377

n2

n1

9 10 11 12 13 14 15 16 17 18 19 20

1

2 0 0 0 1 1 1 1 1 2 2 2 2

3 2 3 3 4 4 5 5 6 6 7 7 8

4 4 5 6 7 8 9 10 11 11 12 13 13

5 7 8 9 11 12 13 14 15 17 18 19 20

6 10 11 13 14 16 17 19 21 22 24 25 27

7 12 14 16 18 20 22 24 26 28 30 32 34

8 15 17 19 22 24 26 29 31 34 36 38 41

9 17 20 23 26 28 31 34 37 39 42 45 48

10 20 23 26 29 33 36 39 42 45 48 52 55

11 23 26 30 33 37 40 44 47 51 55 58 62

12 26 29 33 37 41 45 49 53 57 61 65 69

13 28 33 37 41 45 50 54 59 63 67 72 76

14 31 36 40 45 50 55 59 64 67 74 78 83

15 34 39 44 49 54 59 64 70 75 80 85 90

16 37 42 47 53 59 64 70 75 81 86 92 98

17 39 45 51 57 63 67 75 81 87 93 99 105

18 42 48 55 61 67 74 80 86 93 99 106 112

19 45 52 58 65 72 78 85 92 99 106 113 119

20 48 55 62 69 76 83 90 98 105 112 119 127

Tabela 8 - Valores críticos da distribuição U de Mann-Whitney, para testes unilaterais

com α = 0,025 e bilaterais com α = 0,05

BIOESTATISTICA_Vol_01.indb 377 25/06/12 17:14

Page 378: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

BIOESTATISTICA_Vol_01.indb 378 25/06/12 17:14

Page 379: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 379

nα Bilateral: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,001

α Unilateral: 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,0005

4 2 0

5 4 2 0

6 6 3 2 0

7 9 5 3 2 0

8 12 8 5 3 1 0

9 16 10 8 5 3 1 0

10 20 14 10 8 5 3 1

11 24 17 13 10 7 5 3 0

12 29 21 17 13 9 7 5 1

13 35 26 21 17 12 9 7 2

14 40 31 25 21 15 12 9 4

15 47 36 30 25 19 15 12 6

16 54 42 35 29 23 19 15 8

17 61 48 41 34 27 23 19 11

18 69 55 47 40 32 27 23 14

19 77 62 53 46 37 32 27 18

20 86 69 60 52 43 37 32 21

21 95 77 67 58 49 42 37 25

22 104 86 75 65 55 48 42 30

23 114 94 83 73 62 54 48 35

24 125 104 91 81 69 61 54 40

25 136 113 100 89 76 68 60 45

26 148 124 110 98 84 75 67 51

27 160 134 119 107 92 83 74 57

28 172 145 130 116 101 91 82 64

29 185 157 140 126 110 100 90 71

30 198 169 151 137 120 109 98 78

Tabela 9 - Valores críticos da distribuição T de Wilcoxon

BIOESTATISTICA_Vol_01.indb 379 25/06/12 17:14

Page 380: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental380

Tabela 9 - Valores críticos da distribuição T de Wilcoxon (continuação)

nα Bilateral: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,001

α Unilateral: 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,0005

31 212 181 163 147 130 118 107 86

32 226 194 175 159 140 128 116 94

33 241 207 187 170 151 138 126 102

34 257 221 200 182 162 148 136 111

35 272 235 213 195 173 159 146 120

36 289 250 227 208 185 171 157 130

37 305 265 241 221 198 182 168 140

38 323 281 256 235 211 194 180 150

39 340 297 271 249 224 207 192 161

40 358 313 286 264 238 220 204 172

41 377 330 302 279 252 233 217 183

42 396 348 319 294 266 247 230 195

43 416 365 336 310 281 261 244 207

44 436 384 353 327 296 276 258 220

45 456 402 371 343 312 291 272 233

46 477 422 389 361 328 307 287 246

47 499 441 407 378 345 322 302 260

48 521 462 426 396 362 339 318 274

49 543 482 446 415 379 355 334 289

50 566 503 466 434 397 373 350 304

51 590 525 486 453 416 390 367 319

52 613 547 507 473 434 408 384 335

53 638 569 529 494 454 427 402 351

54 668 592 550 514 473 445 420 368

55 688 615 573 536 493 465 438 385

56 714 639 595 557 514 484 457 402

57 740 664 618 579 535 504 477 420

58 767 688 642 602 556 525 497 438

BIOESTATISTICA_Vol_01.indb 380 25/06/12 17:14

Page 381: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 381

nα Bilateral: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,001

α Unilateral: 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,0005

59 794 714 666 625 578 546 517 457

60 822 739 690 648 600 567 537 476

61 850 765 715 672 623 598 558 495

62 879 792 741 697 646 611 580 515

63 908 819 767 721 669 634 602 535

64 938 847 793 747 693 657 624 556

65 968 875 820 772 718 681 647 577

66 998 903 847 798 742 705 670 599

67 1029 932 875 825 768 729 694 621

68 1061 962 903 852 793 754 718 643

69 1093 992 931 879 819 779 742 666

70 1126 1022 960 907 846 805 767 689

71 1159 1053 990 936 873 831 792 712

72 1192 1084 1020 964 901 858 818 736

73 1226 1116 1050 994 928 884 844 761

74 1261 1148 1081 1023 957 912 871 786

75 1296 1181 1112 1053 986 940 898 811

76 1331 1214 1144 1084 1015 968 925 836

77 1367 1247 1176 1115 1044 997 953 862

78 1403 1282 1209 1147 1075 1026 981 889

79 1440 1316 1242 1179 1105 1056 1010 916

80 1478 1351 1276 1211 1136 1086 1039 943

81 1516 1387 1310 1244 1168 1116 1069 971

82 1554 1423 1345 1277 1200 1147 1099 999

83 1593 1459 1380 1311 1232 1178 1129 1028

84 1632 1496 1415 1345 1265 1210 1160 1057

85 1672 1533 1451 1380 1298 1242 1191 1086

86 1712 1571 1487 1415 1332 1275 1223 1116

87 1753 1609 1524 1451 1366 1308 1255 1146

88 1794 1648 1561 1487 1400 1342 1288 1177

Tabela 9 - Valores críticos da distribuição T de Wilcoxon (continuação)

BIOESTATISTICA_Vol_01.indb 381 25/06/12 17:14

Page 382: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental382

Tabela 9 - Valores críticos da distribuição T de Wilcoxon (continuação)

nα Bilateral: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,001

α Unilateral: 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,0005

89 1836 1688 1599 1523 1435 1376 1321 1208

90 1878 1727 1638 1560 1471 1410 1355 1240

91 1921 1767 1676 1597 1507 1445 1389 1271

92 1964 1808 1715 1635 1543 1480 1423 1304

93 2008 1849 1755 1674 1580 1516 1458 1337

94 2052 1891 1795 1712 1617 1552 1493 1370

95 2097 1933 1836 1752 1655 1589 1529 1404

96 2142 1976 1877 1791 1693 1626 1565 1438

97 2187 2019 1918 1832 1731 1664 1601 1472

98 2233 2062 1960 1872 1770 1702 1638 1507

99 2280 2106 2003 1913 1810 1740 1676 1543

100 2327 2151 2045 1955 1850 1779 1714 1578

BIOESTATISTICA_Vol_01.indb 382 25/06/12 17:14

Page 383: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 383

n1 n2 n3 a: 0,10 0,05 0,02 0,01 0,005 0,002 0,001

2 2 2 4,571

3 2 1 4,286

3 2 2 4,500 4,714

3 3 1 4,571 5,143

3 3 2 4,556 5,361 6,250

3 3 3 4,622 5,600 6,489 (7,200) 7,200

4 2 1 4,500

4 2 2 4,458 5,333 6,000

4 3 1 4,056 5,208

4 3 2 4,511 5,444 6,144 6,444 7,000

4 3 3 4,709 5,791 6,564 6,745 7,318 8,018

4 4 1 4,167 4,967 (6,667) 6,667

4 4 2 4,555 5,455 6,600 7,036 7,282 7,855

4 4 3 4,545 5,598 6,712 7,144 7,598 8,227 8,909

4 4 4 4,654 5,692 6,962 7,654 8,000 8,654 9,269

5 2 1 4,200 5,000

5 2 2 4,373 5,160 6,000 6,533

5 3 1 4,018 4,960 6,044

5 3 2 4,651 5,251 6,124 6,909 7,182

5 3 3 4,533 5,648 6,533 7,079 7,636 8,048 8,727

5 4 1 3,987 4,985 6,431 6,955 7,364

5 4 2 4,541 5,273 6,505 7,205 7,573 8,114 8,591

5 4 3 4,549 5,656 6,676 7,445 7,927 8,481 8,795

5 4 4 4,619 5,657 6,953 7,760 8,189 8,868 9,168

5 5 1 4,109 5,127 6,145 7,309 8,182

5 5 2 4,623 5,338 6,446 7,338 8,131 6,446 7,338

5 5 3 4,545 5,705 6,866 7,578 8,316 8,809 9,521

5 5 4 4,523 5,666 7,000 7,823 8,523 9,163 9,606

5 5 5 4,940 5,780 7,220 8,000 8,780 9,620 9,920

6 1 1 ---

6 2 1 4,200 4,822

6 2 2 4,545 5,345 6,182 6,982

6 3 1 3,909 4,855 6,236

6 3 2 4,682 5,348 6,227 6,970 7,515 8,182

6 3 3 4,538 5,615 6,590 7,410 7,872 8,628 9,346

Tabela 10 - Valores críticos da distribuição H de Kruskal-Wallis

BIOESTATISTICA_Vol_01.indb 383 25/06/12 17:14

Page 384: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental384

Tabela 10 - Valores críticos da distribuição H de Kruskal-Wallis (continuação)

n1 n2 n3 a: 0,10 0,05 0,02 0,01 0,005 0,002 0,001

6 4 1 4,038 4,947 6,174 7,106 7,614

6 4 2 4,494 5,340 6,571 7,340 7,846 8,494 8,827

6 4 3 4,604 5,610 6,725 7,500 8,033 8,918 9,170

6 4 4 4,595 5,681 6,900 7,795 8,381 9,167 9,861

6 5 1 4,128 4,990 6,138 7,182 8,077 8,515

6 5 2 4,596 5,338 6,585 7,376 8,196 8,967 9,189

6 5 3 4,535 5,602 6,829 7,590 8,314 9,150 9,669

6 5 4 4,522 5,661 7,018 7,936 8,643 9,458 9,960

6 5 5 4,547 5,729 7,110 8,028 8,859 9,771 10,271

6 6 1 4,000 4,945 6,286 7,121 8,165 9,077 9,692

6 6 2 4,438 5,410 6,667 7,467 8,210 9,219 9,752

6 6 3 4,558 5,625 6,900 7,725 8,458 9,458 10,150

6 6 4 4,548 5,724 7,107 8,000 8,754 9,662 10,342

6 6 5 4,542 5,765 7,152 8,124 8,987 9,948 10,524

6 6 6 4,643 5,801 7,240 8,222 9,170 10,187 10,889

7 7 7 4,594 5,819 7,332 8,378 9,373 10,516 11,310

8 8 8 4,595 5,805 7,355 8,465 9,495 10,805 11,705

2 2 1 1 ---

2 2 2 1 5,357 5,679

2 2 2 2 5,667 6,167 (6,667) 6,667

3 1 1 1 ---

3 2 1 1 5,143

3 2 2 1 5,556 5,833 6,500

3 2 2 2 5,544 6,333 6,978 7,133 7,533

3 3 1 1 5,333 6,333

3 3 2 1 5,689 6,244 6,689 7,200 7,400

3 3 2 2 5,745 6,527 7,182 7,636 7,873 8,018 8,455

3 3 3 1 5,655 6,600 7,109 7,400 8,055 8,345

3 3 3 2 5,879 6,727 7,636 8,105 8,379 8,803 9,030

3 3 3 3 6,026 7,000 7,872 8,538 8,897 9,462 9,513

4 1 1 1

4 2 1 1 5,250 5,833

4 2 2 1 5,533 6,133 6,667 7,000

4 2 2 2 5,755 6,545 7,091 7,391 7,964 8,291

4 3 1 1 5,067 6,178 6,711 7,067

BIOESTATISTICA_Vol_01.indb 384 25/06/12 17:14

Page 385: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 385

n1 n2 n3 α: 0,10 0,05 0,02 0,01 0,005 0,002 0,001

4 3 2 1 5,591 6,309 7,018 7,455 7,773 8,182

4 3 2 2 5,750 6,621 7,530 7,871 8,273 8,689 8,909

4 3 3 1 5,589 6,545 7,485 7,758 8,212 8,697 9,182

4 3 3 2 5,872 6,795 7,763 8,333 8,718 9,167 9,455

4 3 3 3 6,016 6,984 7,995 8,659 9,253 9,709 10,016

4 4 1 1 5,182 5,945 7,091 7,909 7,909

4 4 2 1 5,568 6,386 7,364 7,886 8,341 8,591 8,909

4 4 2 2 5,808 6,731 7,750 8,346 8,692 9,269 9,462

4 4 3 1 5,692 6,635 7,660 8,231 8,583 9,038 9,327

4 4 3 2 5,901 6,874 7,951 8,621 9,165 9,615 9,945

4 4 3 3 6,019 7,038 8,181 8,876 9,495 10,105 10,467

4 4 4 1 5,564 6,725 7,879 8,588 9,000 9,478 9,758

4 4 4 2 5,914 6,957 8,157 8,871 9,486 10,043 10,429

4 4 4 3 6,042 7,142 8,350 9,075 9,742 10,542 10,929

4 4 4 4 6,088 7,235 8,515 9,287 9,971 10,809 11,338

2 1 1 1 1 ---

2 2 1 1 1 5,786

2 2 2 1 1 6,250 6,750

2 2 2 2 1 6,600 7,133 (7,533) 7,533

2 2 2 2 2 6,982 7,418 8,073 8,291 (8,727) 8,727

3 1 1 1 1 ---

3 2 1 1 1 6,139 6,583

3 2 2 1 1 6,511 6,800 7,400 7,600

3 2 2 2 1 6,709 7,309 7,836 8,127 8,327 8,618

3 2 2 2 2 6,955 7,682 8,303 8,682 8,985 9,273 9,364

3 3 1 1 1 6,311 7,111 7,467

3 3 2 1 1 6,600 7,200 7,892 8,073 8,345

3 3 2 2 1 6,788 7,591 8,258 8,576 8,924 9,167 9,303

3 3 2 2 2 7,026 7,910 8,667 9,115 9,474 9,769 10,026

3 3 3 1 1 6,788 6,576 8,242 8,424 8,848 (9,455) 9,455

3 3 3 2 1 6,910 7,769 8,590 9,051 9,410 9,769 9,974

3 3 3 2 2 7,121 8,044 9,011 9,505 9,890 10,330 10,637

3 3 3 3 1 7,077 8,000 8,879 9,451 9,846 10,286 10,549

3 3 3 3 2 7,210 8,200 9,267 9,876 10,333 10,838 11,171

3 3 3 3 3 7,333 8,333 9,467 10,200 10,733 10,267 11,667

Tabela 10 - Valores críticos da distribuição H de Kruskal-Wallis (continuação)

BIOESTATISTICA_Vol_01.indb 385 25/06/12 17:14

Page 386: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

BIOESTATISTICA_Vol_01.indb 386 25/06/12 17:14

Page 387: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 387

Tabela 11 - Valores críticos da distribuição Q para testes de comparações múltiplas

não-paramétricas

k α: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001

2 0,674 1,282 1,645 1,960 2,327 2,576 2,807 3,091 3,291

3 1,383 1,834 2,128 2,394 2,713 2,936 3,144 3,403 3,588

4 1,732 2,128 2,394 2,639 2,936 3,144 3,342 3,588 3,765

5 1,960 2,327 2,576 2,807 3,091 3,291 3,481 3,719 3,891

6 2,128 2,475 2,713 2,936 3,209 3,403 3,588 3,820 3,988

7 2,261 2,593 2,823 3,038 3,304 3,494 3,675 3,902 4,067

8 2,369 2,690 2,914 3,124 3,384 3,570 3,748 3,972 4,134

9 2,461 2,773 2,992 3,197 3,453 3,635 3,810 4,031 4,191

10 2,540 2,845 3,059 3,261 3,512 3,692 3,865 4,083 4,241

11 2,609 2,908 3,119 3,317 3,565 3,743 3,914 4,129 4,286

12 2,671 2,965 3,172 3,368 3,613 3,789 3,957 4,171 4,326

13 2,726 3,016 3,220 3,414 3,656 3,830 3,997 4,209 4,363

14 2,777 3,062 3,264 3,456 3,695 3,868 4,034 4,244 4,397

15 2,823 3,105 3,304 3,494 3,731 3,902 4,067 4,276 4,428

16 2,866 3,144 3,342 3,529 3,765 3,935 4,098 4,305 4,456

17 2,905 3,181 3,376 3,562 3,796 3,965 4,127 4,333 4,483

18 2,942 3,215 3,409 3,593 3,825 3,993 4,154 4,359 4,508

19 2,976, 3,246 3,439 3,622 3,852 4,019 4,179 4,383 4,532

20 3,008 3,276 3,467 3,649 3,878 4,044 4,203 4,406 4,554

21 3,038 3,304 3,494 3,675 3,902 4,067 4,226 4,428 4,575

22 3,067 3,331 3,519 3,699 3,925 4,089 4,247 4,448 4,595

23 3,094 3,356 3,543 3,722 3,947 4,110 4,268 4,468 4,614

24 3,120 3,380 3,566 3,744 3,968 4,130 4,287 4,486 4,632

25 3,144 3,403 3,588 3,765 3,988 4,149 4,305 4,504 4,649

BIOESTATISTICA_Vol_01.indb 387 25/06/12 17:14

Page 388: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

BIOESTATISTICA_Vol_01.indb 388 25/06/12 17:14

Page 389: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 389

Tabela 12 - Valores críticos para o coeficiente de correlação de Spearman (rS) para postos

nα Bilateral: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001

a Unilateral: 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,001 0,0005

4 0,600 1,000 1,0005 0,500 0,800 0,900 1,000 1,0006 0,371 0,657 0,829 0,886 0,943 1,000 1,0007 0,321 0,571 0,714 0,786 0,893 0,929 0,964 1,000 1,0008 0,310 0,524 0,643 0,738 0,833 0,881 0,905 0,952 0,9769 0,267 0,483 0,600 0,700 0,783 0,833 0,867 0,917 0,933

10 0,248 0,455 0,564 0,648 0,745 0,794 0,830 0,879 0,903

11 0,236 0,427 0,536 0,618 0,709 0,755 0,800 0,845 0,87312 0,217 0,406 0,503 0,587 0,678 0,727 0,769 0,818 0,84613 0,209 0,385 0,484 0,560 0,648 0,703 0,747 0,791 0,82414 0,200 0,367 0,464 0,538 0,626 0,679 0,723 0,771 0,80215 0,189 0,354 0,446 0,521 0,604 0,654 0,700 0,750 0,77916 0,182 0,341 0,429 0,503 0,582 0,635 0,679 0,729 0,76217 0,176 0,328 0,414 0,485 0,566 0,615 0,662 0,713 0,74818 0,170 0,317 0,401 0,472 0,550 0,600 0,643 0,695 0,72819 0,165 0,309 0,391 0,460 0,535 0,584 0,628 0,677 0,71220 0,161 0,299 0,380 0,447 0,520 0,570 0,612 0,662 0,696

21 0,J56 0,292 0,370 0,435 0,508 0,556 0,599 0,648 0,68122 0,1’52 0,284 0,361 0,425 0,496 0,544 0,586 0,634 0,66723 0,148 0,278 0,353 0,415 0,486 0,532 0,573 0,622 0,65424 0,144 0,271 0,344 0,406 0,476 0,521 0,562 0,610 0,64225 0,142 0,265 0,337 0,398 0,466 0,511 0,551 0,598 0,63026 0,138 0,259 0,331 0,390 0,457 0,501 0,541 0,587 0,61927 0,136 0,255 0,324 0,382 0,448 0,491 0,531 0,577 0,60828 0,133 0,250 0,317 0,375 0,440 0,483 0,522 0,567 0,59829 0,130 0,245 0,312 0,368 0,433 0,4 75 0,513 0,558 0,58930 0,128 0,240 0,306 0,362 0,425 0,467 0,504 0,549 0,580

31 0,126 0,236 0,301 0,356 0,418 0,459 0,496 0,541 0,57132 0,124 0,232 0,296 0,350 0,412 0,452 0,489 0,533 0,56333 0,121 0,229 0,291 0,345 0,405 0,446 0,482 0,525 0,55434 0,120 0,225 0,287 0,340 0,399 0,439 0,475 0,517 0,54735 0,118 0,222 0,283 0,335 0,394 0,433 0,468 0,510 0,53936 0,116 0,219 0,279 0,330 0,388 0,427 0,462 0,504 0,533

BIOESTATISTICA_Vol_01.indb 389 25/06/12 17:14

Page 390: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental390

Tabela 12 - Valores críticos para o coeficiente de correlação de Spearman (rS) para postos –

(continuação)

nα Bilateral: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001

a Unilateral: 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,001 0,0005

37 0,114 0,216 0,275 0,325 0,383 0,421 0,456 0,497 0,52638 0,113 0,212 0,271 0,321 0,378 0,415 0,450 0,491 0,51939 0,111 0,210 0,267 0,317 0,373 0,410 0,444 0,485 0,51340 0,110 0,207 0,264 0,313 0,368 0,405 0,439 0,479 0,507

41 0,108 0,204 0,261 0,309 0,364 0,400 0,433 0,473 0,50142 0,1 07 0,202 0,257 0,305 0,359 0,395 0,428 0,468 0,49543 0,105 0,199 0,254 0,301 0,355 0,391 0,423 0,463 0,49044 0,104 0,197 0,251 0,298 0,351 0,386 0,419 0,458 0,48445 0,103 0,194 0,248 0,294 0,347 0,382 0,414 0,453 0,47946 0,102 0,192 0,246 0,291 0,343 0,378 0,410 0,448 0,47447 0,101 0,190 0,243 0,288 0,340 0,374 0,405 0,443 0,46948 0,100 0,188 0,240 0,285 0,336 0,370 0,401 0,439 0,46549 0,098 0,186 0,238 0,282 0,333 0,366 0,397 0,434 0,46050 0,097 0,184 0,235 0,279 0,329 0,363 0,393 0,430 0,456

51 0,096 0,182 0,233 0,276 0,326 0,359 0,390 0,426 0,45152 0,095 0,180 0,231 0,274 0,323 0,356 0,386 0,422 0,44753 0,095 0,179 0,228 0,271 0,320 0,352 0,382 0,418 0,44354 0,094 0,177 0,226 0,268 0,317 0,349 0,379 0,414 0,43955 0,093 0,175 0,224 0,266 0,314 0,346 0,375 0,411 0,43556 0,092 0,174 0,222 0,264 0,311 0,343 0,372 0,407 0,43257 0,091 0,172 0,220 0,261 0,308 0,340 0,369 0,404 0,42858 0,090 0,171 0,218 0,259 0,306, 0,337 0,366 0,400 0,42459 0,089 0,169 0,216 0,257 0,303 0,334 0,363 0,397 0,42160 0,089 0,168 0,214 0,255 0,300 0,331 0,360 0,394 0,418

61 0,088 0,166 0,213 0,252 0,298 0,329 0,357 0,391 0,41462 0,087 0,165 0,211 0,250 0,296 0,326 0,354 0,388 0,41163 0,086 0,163 0,209 0,248 0,293 0,323 0,351 0,385 0,40864 0,086 0,162 0,207 0,246 0,291 0,321 0,348 0,382 0,40565 0,085 0,161 0,206 0,244 0,289 0,318 0,346 0,379 0,40266 0,084 0,160 0,204 0,243 0,287 0,316 0,343 0,376 0,39967 0,084 0,158 0,203 0,241 0,284 0,314 0,341 0,373 0,39668 0,083 0,157 0,201 0,239 0,282 0,311 0,338 0,370 0,39369 0,082 0,156 0,200 0,237 0,280 0,309 0,336 0,368 0,390

BIOESTATISTICA_Vol_01.indb 390 25/06/12 17:14

Page 391: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 391

nα Bilateral: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001

α Unilateral: 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,001 0,0005

70 0,082 0,155 0,198 0,235 0,278 0,307 0,333 0,365 0,388

71 0,081 0,154 0,197 0,234 0,276 0,305 0,331 0,363 0,38572 0,081 0,153 0,195 0,232 0,274 0,303 0,329 0,360 0,38273 0,080 0,152 0,194 0,230 0,272 0,301 0,327 0,358 0,38074 0,080 0,151 0,193 0,229 0,271 0,299 0,324 0,355 0,37775 0,079 0,150 0,191 0,227 0,269 0,297 0,322 0,353 0,37576 0,078 0,149 0,190 0,226 0,267 0,295 0,320 0,351 0,37277 0,078 0,148 0,189 0,224 0,265 0,293 0,318 0,349 0,37078 0,077 0,147 0,188 0,223 0,264 0,291 0,316 0,346 0,36879 0,077 0,146 0,186 0,221 0,262 0,289 0,314 0,344 0,36580 0,076 0,145 0,185 0,220 0,260 0,287 0,312 0,342 0,363

81 0,076 0,144 0,184 0,219 0,259 0,285 0,310 0,340 0,36182 0,075 0,143 0,183 0,217 0,257 0,284 0,308 0,338 0,35983 0,075 0,142 0,182 0,216 0,255 0,282 0,306 0,336 0,35784 0,074 0,141 0,181 0,215 0,254 0,280 0,305 0,334 0,35585 0,074 0,140 0,180 0,213 0,252 0,279 0,303 0,332 0,35386 0,074 0,139 0,179 0,212 0,251 0,277 0,301 0,330 0,35187 0,073 0,139 0,177 0,211 0,250 0,276 0,299 0,328 0,34988 0,073 0,138 0,176 0,210 0,248 0,274 0,298 0,327 0,34789 0,072 0,137 0,175 0,209 0,247 0,272 0,296 0,325 0,34590 0,072 0,136 0,174 0,207 0,245 0,271 0,294 0,323 0,343

91 0,072 0,135 0,173 0,206 0,244 0,269 0,293 0,321 0,34192 0,071 0,135 0,173 0,205 0,243 0,268 0,291 0,319 0,33993 0,071 0,134 0,172 0,204 0,241 0,267 0,290 0,318 0,33894 0,070 0,133 0,171 0,203 0,240 0,265 0,288 0,316 0,33695 0,070 0,133 0,170 0,202 0,239 0,264 0,287 0,314 0,33496 0,070 0,132 0,169 0,201 0,238 0,262 0,285 0,313 0,33297 0,069 0,131 0,168 0,200 0,236 0,261 0,284 0,311 0,33198 0,069 0,130 0,167 0,199 0,235 0,260 0,282 0,310 0,32999 0,068 0,130 0,166 0,198 0,234 0,258 0,281 0,308 0,327

100 0,068 0,129 0,165 0,197 0,233 0,257 0,279 0,307 0,326

Tabela 12 - Valores críticos para o coeficiente de correlação de Spearman (rS) para postos –

(continuação)

BIOESTATISTICA_Vol_01.indb 391 25/06/12 17:14

Page 392: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

BIOESTATISTICA_Vol_01.indb 392 25/06/12 17:14

Page 393: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 393

Tabela 13 - Valores críticos para a distribuição de Friedman ( χr

2 )

a b

(n) (M)* α: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001

3 2 3,000 4,000

3 3 2,667 4,667 (6,000) 6,000

3 4 2,000 4,500 6,000 6,500 (8,000) (8,000) 8,000

3 5 2,800 3,600 5,200 6,400 (8,400) 8,400 (10,000) (10,000) 10,000

3 6 2,330 4,000 5,330 7,000 8,330 9,000 (10,330) 10,330 12,000

3 7 2,000 3,714 5,429 7,143 8,000 8,857 10,286 11,143 12,286

3 8 2,250 4,000 5,2S0 6,250 7,750 9,000 9,750 12,000 12,250

3 9 2,000 3,556 5,556 6,222 8,000 9,556 10,667 11,556 12,667

3 10 1,800 3,800 5,000 6,200 7,800 9,600 10,400 12,200 12,600

3 11 4,636 3,818 4,909 6,545 7,818 9,455 10,364 11,636 13,273

3 12 1,500 3,500 5,167 6,167 8,000 9,500 10,167 12,167 12,500

3 13 1,846 3,846 4,769 6,000 8,000 9,385 10,308 11,538 12,923

3 14 1,714 3,571 5,143 6,143 8,143 9,000 10,429 12,000 13,286

3 15 1,733 3,600 4,933 6,400 8,133 8,933 10,000 12,133 12,933

4 2 3,600 5,400 (6,000) 6,000

4 3 3,400 5,400 6,600 7,400 8,200 (9,000) (9,000) 9,000

4 4 3,000 4,800 6,300 7,800 8,400 9,600 (10,200) 10,200 11,1 00

4 5 3,000 5,160 6,360 7,800 9,240 9,960 10,920 11,640 12,600

4 6 3,000 4,800 6,400 7,600 9,400 10,200 11,400 12,200 12,800

4 7 2,829 4,886 6,429 7,800 9,343 10371 11,400 12,771 13,800

4 8 2,550 4,800 6,300 7,650 9,450 10,350 11,850 12,900 13,800

4 9 6,467 7,800 9,133 10,867 12,067 14,467

4 10 6,360 7,800 9,120 10,800 12,000 14,640

4 11 6,382 7,909 9,327 11,073 12,273 14,891

4 12 6,400 7,900 9,200 11,100 12,300 15,000

4 13 6,415 7,985 7,369 11,123 12,323 15,277

4 14 6,343 7,886 9,343 11,143 12,514 15,257

4 15 6,440 8,040 9,400 11,240 12,520 15,400

BIOESTATISTICA_Vol_01.indb 393 25/06/12 17:14

Page 394: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental394

Tabela 13 - Valores críticos para a distribuição de Friedman ( χr

2 ) (continuação)

a b

5 2 7,200 7,600 8,000 8,000

5 3 7,467 8,533 9,600 10,133 10,667 11,467

5 4 7,600 8,800 9,800 11,200 12,000 13,200

5 5 7,680 8,960 10,240 11,680 12,480 14,400

5 6 7,733 9,067 10,400 11,867 13,067 15,200

5 7 7,771 9,143 10,514 12,114 13,257 15,657

5 8 7,800 9,300 10,600 12,300 13,500 16,000

5 9 7,733 9,244 10,667 12,444 13,689 16,356

5 10 7,76 9,280 10,720 12,480 13,840 16,480

6 2 8,286 9,143 9,429 9,714 10,000

6 3 8,714 9,857 10,810 11,762 12,524 13,286

6 4 9,000 10,286 11,429 12,714 13,511 15,286

6 5 9,000 10,486 11,743 13,229 14,2S7 16,429

6 6 9,048 10,571 12,000 13,619 14,762 17,048

6 7 9,122 10,674 12,061 13,857 15,000 17,612

6 8 9,143 10,714 12,214 14,000 15,286 18,000

6 9 9,127 10,778 12,302 14,143 15,476 18,270

6 10 9,143 10,800 12,343 14,299 15,600 18,514

Para o coeficiente de concordância de Kendall (W), grafadas entre parênteses.

BIOESTATISTICA_Vol_01.indb 394 25/06/12 17:14

Page 395: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 395

α αn 0,20 0,10 0,05 0,02 0,01 n 0,20 0,10 0,05 0,02 0,01

1 0,900 0,95 0,975 0,990 0,995 21 0,226 0,259 0,287 0,321 0,344

2 0,684 0,776 0,842 0,900 0,929 22 0,221 0,253 0,281 0,314 0,337

3 0,565 0,636 0,708 0,785 0,829 23 0,216 0,247 0,275 0,307 0,330

4 0,493 0,565 0,624 0,689 0,734 24 0,212 0,242 0,269 0,301 0,323

5 0,447 0,509 0,563 0,627 0,669 25 0,208 0,238 0,264 0,295 0,317

6 0,410 0,468 0,519 0,577 0,617 26 0,204 0,233 0,259 0,290 0,311

7 0,381 0,436 0,483 0,538 0,576 27 0,200 0,229 0,254 0,284 0,305

8 0,358 0,410 0,454 0,407 0,542 28 0,197 0,225 0,250 0,279 0,300

9 0,339 0,387 0,430 0,480 0,513 29 0,193 0,221 0,246 0,275 0,295

10 0,323 0,369 0,409 0,457 0,489 30 0,190 0,218 0,242 0,270 0,290

11 0,308 0,352 0,391 0,437 0,468 31 0,187 0,214 0,238 0,266 0,285

12 0,296 0,338 0,375 0,419 0,449 32 0,184 0,211 0,234 0,262 0,181

13 0,285 0,325 0,361 0,404 0,432 33 0,182 0,208 0,231 0,258 0,277

14 0,275 0,314 0,349 0,390 0,418 34 0,179 0,205 0,227 0,254 0,273

15 0,266 0,304 0,338 0,377 0,404 35 0,177 0,202 0,224 0,251 0,269

16 0,258 0,295 0,327 0,366 0,392 36 0,174 0,199 0,221 0,247 0,265

17 0,250 0,286 0,318 0,355 0,381 37 0,172 0,196 0,218 0,244 0,262

18 0,244 0,279 0,309 0,346 0,371 38 0,170 0,194 0,215 0,241 0,258

19 0,237 0,271 0,301 0,337 0,361 39 0,168 0,191 0,213 0,238 0,255

20 0,232 0,265 0,294 0,329 0,352 40 0,165 0,189 0,210 0,235 0,252

Os valores tabelados correspondem aos pontos Dn;α, tais que:

P(Dn ≥ Dn;α ) = α.

Para n > 40, os valores críticos de Dn podem ser aproximados pelas seguintes expressões:

α

0,20 0,10 0,05 0,02 0,01

1 07,

n

1 22,

n

1 36,

n

1 52,

n

1 63,

n

Tabela 14 - Valores críticos para a distribuição de Kolmogorov-Smirnov (D)

BIOESTATISTICA_Vol_01.indb 395 25/06/12 17:14

Page 396: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

BIOESTATISTICA_Vol_01.indb 396 25/06/12 17:14

Page 397: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 397

nk = 1 k = 2 k = 3 k = 4 k = 5

dL du dL du dL du dL du dL du

15 1,08 1,36 0,95 1,54 0,82 1,75 0,69 1,97 0,56 2,21

16 1,10 1,37 0,98 1,54 0,86 1,73 0,74 1,93 0,62 2,15

17 1,13 1,38 1,02 1,54 0,90 1,71 0,78 1,90 0,67 2,10

18 1,16 1,39 1,05 1,53 0,93 1,69 0,92 I,R7 0,71 2,06

19 1,18 1,40 1,08 1,53 0,97 1,68 0,86 1,85 0,75 2,02

20 1,20 1,41 1,10 1,54 1,00 1,68 0,90 1,83 0,79 1,99

21 1,22 1,42 1,13 1,54 1,03 1,67 0,93 1,81 0,83 1,96

22 1,24 1,43 l,l5 1,54 1,05 1,66 0,96 1,80 0,96 1,94

23 1,26 1,44 1,17 1,54 1,08 1,66 0,99 1,79 0,90 1,92

24 1,27 1,45 1,19 1,55 1,10 1,66 1,01 1,18 0,93 1,90

25 1,29 1,45 1,21 1,55 1,12 1,66 1,04 1,77 0,95 1,89

26 1,30 1,46 1,22 1,55 1,]4 1,65 1,06 1,76 0,98 1,88

27 1,32 1,47 1,24 1,56 1,16 1,65 1,08 1,16 1,01 t86

28 1,33 1,48 1,26 1,56 1,18 1,65 1,10 1,75 1,03 1,85

29 1,34 1,48 1,27 1,56 1,20 1,65 1,12 1,74 1,05 1,84

30 1,35 1,49 1,28 1,57 1,21 1,65 1,14 1,74 1,07 1,83

31 1,16 1,50 1,30 1,51 1,23 1,65 1,16 1,74 1,09 1,83

32 1,37 1,50 1,31 1,57 1,24 1,65 1,18 1,73 1,11 1,82

33 1,38 1,51 1,32 1,58 1,26 1,65 1,19 1,73 1,13 1,81

34 1,39 1,51 1,33 1,58 1,27 1,65 1,21 1,73 l,t5 1,81

35 1,40 1,52 1,34 1,58 1,28 1,65 1,22 1,73 1,16 1,80

36 1,41 1,52 1,35 1,59 1,29 1,65 1,24 1,73 1,18 1,80

37 1,42 1,53 1,36 1,59 1,31 1,66 1,25 1,72 1,19 1,80

38 1,43 1,54 1,37 1,59 1,32 1,66 1,26 1,72 1,21 1,79

39 1,43 1,54 1,38 1,60 1,33 1,66 1,27 1,72 1,22 1,79

40 1,44 1,54 1,39 1,60 1,34 1,66 1,29 1,72 1,23 1,79

Tabela 15.1 - Valores críticos para o teste de Durbin-Watson, com α = 0,05

BIOESTATISTICA_Vol_01.indb 397 25/06/12 17:14

Page 398: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental398

Tabela 15.1 - Valores críticos para o teste de Durbin-Watson, com α = 0,05 (continuação)

nk = 1 k = 2 k = 3 k = 4 k = 5

dL du dL du dL du dL, du dL du

45 1,48 1,51 1,43 1,62 1,38 1,67 1,34 1,72 1,29 1,78

50 1,50 1,59 1,46 1,63 1,42 1,67 1,38 1,72 1,34 1,77

55 1,53 1,60 1,49 1,64 1,45 1,68 1,41 1,72 1,38 1,77

60 1,55 1,62 1,51 1,65 1,48 1,69 1,44 1,73 1,41 1,77

65 1,57 1,63 1,54 1,66 1,50 1,70 1,47 1,73 1,44 1,77

70 1,58 1,64 1,55 1,67 1,52 1,10 1,49 1,74 1,46 1,77

75 1,60 1,65 1,57 1,68 1,54 1,71 1,51 1,74 1,49 1,77

80 1,61 1,66 1,59 1,69 1,56 1,72 1,53 1,74 1,51 1,77

85 1,62 1,67 1,60 1,70 1,57 1,12 1,55 1,75 1,52 1,77

90 1,63 1,68 1,61 1,70 1,59 1,73 1,57 1,75 1,54 1,78

95 1,64 1,69 162 1,71 1,60 1,73 1,58 1,75 1,56 1,78

100 1,65 1,69 1,63 1,72 1,61 1,74 1,59 1,76 1,57 1,78

BIOESTATISTICA_Vol_01.indb 398 25/06/12 17:14

Page 399: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 399

nk = 1 k = 2 k = 3 k = 4 k = 5

dL du dL du dL du dL, du dL du

15 0,81 1,07 0,70 1,25 0,59 1,46 0,49 1,70 0,39 1,96

16 0,84 1,09 0,74 1,25 0,63 1,44 0,53 l,66 0,44 1,90

17 0,87 1,10 0,77 1,25 0,67 1,43 0,57 1,30 0,48 1,85

18 0,90 1,12 0,80 1,26 0,71 1,42 0,61 1,60 0,52 1,80

19 0,93 1,13 0,83 1,26 0,74 1,41 0,65 1,58 0,56 1,77

20 0,95 1,15 0,86 1,27 0,77 1,41 0,68 1,57 0,60 1,74

21 0,97 1,16 0,89 1,27 0,80 1,41 0,72 1,55 0,63 1,71

22 1,00 1,17 0,91 1,28 0,83 1,40 0,75 1,54 0,66 1,69

23 1,02 1,19 0,94 1,29 0,86 1,40 0,77 1,53 0,70 1,67

24 1,04 1,20 0,96 1,30 0,88 1,41 0,80 1,53 0,72 1,66

25 1,05 1,21 0,98 1,30 0,90 1,41 0,83 1,52 0,75 1,65

26 1,07 1,22 1,00 1,31 0,93 1,41 0,85 1,52 0,78 1,64

27 1,09 1,23 1,02 1,32 0,95 1,41 0,88 1,51 0,81 1,63

28 1,10 1,24 1,04 1,32 0,97 1,41 0,90 1,51 0,83 1,62

29 1,12 1,25 1,05 1,33 0,99 1,42 0,92 1,51 0,85 1,61

30 1,13 1,26 1,07 1,34 1,01 1,42 0,94 1,51 0,88 1,61

31 1,15 1,27 1,08 1,34 1,02 1,42 0,96 1,51 0,90 1,60

32 1,16 1,28 1,10 1,35 1,04 1,43 0,98 1,51 0,92 1,60

33 1,17 1,29 1,11 1,36 1,05 1,43 1,00 1,51 0,94 1,59

34 1,18 1,30 1,13 1,36 1,07 1,43 1,01 1,51 0,95 1,59

35 l,19 1,31 1,14 1,27 1,08 1,44 1,03 1,51 0,97 1,59

36 1,21 1,32 1,15 1,38 1,10 1,44 1,04 1,51 0,99 1,59

37 1,22 1,32 1,16 1,38 1,11 1,45 1,06 1,51 1,00 1,59

38 1,23 1,33 1,18 1,39 1,12 1,45 1,07 1,52 1,02 1,58

39 1,24 1,34 1,19 1,39 1,14 1,45 1,09 1,52 1,03 1,58

40 1,25 1,34 1,20 1,40 1,15 1,46 l,l0 1,52 1,05 1,58

Tabela 15.2 - Valores críticos para o teste de Durbin-Watson, com α = 0,01

BIOESTATISTICA_Vol_01.indb 399 25/06/12 17:14

Page 400: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental400

Tabela 15.2 - Valores críticos para o teste de Durbin-Watson, com α = 0,01 (continuação)

nk = 1 k = 2 k = 3 k = 4 k = 5

dL du dL du dL du dL, du dL du

45 1,29 1,38 1,24 1,42 1,20 1,48 1,16 1,53 1,11 1,58

50 1,32 1,40 1,28 1,45 1,24 1,49 1,20 1,54 1,16 1,59

55 1,36 1,43 1,32 1,47 1,28 1,51 1,25 1,55 1,21 1,59

60 1,38 1,45 1,35 1,48 1,32 1,52 1,28 1,56 1,25 1,60

65 1,41 1,47 1,38 1,50 1,35 1,53 1,31 1,57 1,28 1,61

70 1,43 1,49 1,40 1,52 1,37 1,55 1,34 1,58 1,31 1,61

75 1,45 1,50 1,42 1,53 1,39 1,56 1,37 1,59 1,34 1,62

80 1,47 1,52 1,44 1,54 1,42 1,57 139 1,60 1,36 1,62

8S 1,48 1,53 1,46 1,55 1,43 1,58 1,41 1,60 1,39 1,63

90 1,50 1,54 1,47 1,56 1,45 1,59 1,43 1,61 1,41 1,64

95 1,51 155 1,49 1,57 1,47 1,60 1,45 1,62 1,42 1,64

100 1,52 1,56 1,50 1,58 1,48 1,60 1,46 1,63 1,44 1,65

BIOESTATISTICA_Vol_01.indb 400 25/06/12 17:14

Page 401: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 401

i N : 2 3 4 5 6 7 8 9 10

1 0,7071 0,7071 0,6872 0,6646 0,6431 0,6233 0,6052 0,5888 0,5739

2 0,0000 0,1677 0,2413 0,2806 0,3031 0,3164 0,3244 0,3291

3 0,0000 0,0875 0,1401 0,1743 0,1976 0,2141

4 0,0000 0,0561 0,0947 0,1224

5 0,0000 0,0399

i N: 11 12 13 14 15 16 17 18 19 20

1 0,5601 0,5475 0,5359 0,5251 0,5150 0,5056 0,4968 0,4886 0,4808 0,4734

2 0,3315 0,3325 0,3325 0,3318 0,3306 0,3290 0,3273 0,3253 0,3232 0,3211

3 0,2260 0,2347 0,2412 0,2460 0,2495 0,2521 0,2540 0,2553 0,2561 0,2565

4 0,1429 0,1586 0,1707 0,1802 0,1878 0,1939 0,1988 0,2027 0,2059 0,2085

5 0,0695 0,0922 0,1099 0,1240 0,1353 0,1447 0,1524 0,1587 0,1641 0,1686

6 0,0000 0,0303 0,0539 0,0727 0,0880 0,1005 0,1109 0,1197 0,1271 0,1334

7 0,0000 0,0240 0,0433 0,0593 0,0725 0,0837 0,0932 0,1013

8 0,0000 0,0196 0,0359 0,0496 0,0612 0,0711

9 0,0000 0,0163 0,0303 0,0422

10 0,0000 0,0140

Tabela 16.1 - Valores dos coeficientes α N-i+1 para o teste de normalidade W de Shapiro-Wilk

BIOESTATISTICA_Vol_01.indb 401 25/06/12 17:14

Page 402: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

BIOESTATISTICA_Vol_01.indb 402 25/06/12 17:14

Page 403: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 403

NNível de significância α

0,01 0,02 0,05 0,10 0,50 0,90 0,95 0,98 0,99

3 0,753 0,756 0,767 0,789 0,959 0,998 0,999 1,000 1,000

4 0,0687 0,707 0,748 0,792 0,935 0,987 0,992 0,996 0,997

5 0,686 0,715 0,762 0,806 0,927 0,979 0,986 0,991 0,993

6 0,713 0,743 0,788 0,826 0,927 0,974 0,981 0,986 0,989

7 0,730 0,760 0,803 0,838 0,928 0,972 0,979 0,985 0,988

8 0,749 0,778 0,818 0,851 0.932 0,972 0,978 0,984 0,987

9 0,764 0,791 0,829 0,859 0,935 0,972 0,978 0,984 0,986

10 0,781 0,806 0,842 0,869 0,938 0,972 0,978 0,983 0,986

11 0,792 0,817 0,850 0,876 0,940 0,973 0,979 0,984 0,986

12 0,805 0,828 0,859 0,883 0,943 0,973 0,979 0,984 0,986

13 0,814 0,837 0,866 0,889 0,945 0,974 0,979 0,984 0,986

14 0,825 0,846 0,874 0,895 0,947 0,975 0,980 0,984 0,986

15 0,835 0,855 0,881 0,901 0,950 0,975 0,980 0,984 0,987

16 0,844 0,863 0,887 0,906 0,952 0,976 0,981 0,985 0,987

17 0,851 0,869 0,892 0,910 0,954 0,977 0,981 0,985 0,987

18 0,858 0,874 0,897 0,914 0,956 0,978 0,982 0,986 0,988

19 0,863 0,879 0,901 0,917 0,957 0,978 0,982 0,986 0,988

20 0,868 0,884 0,905 0,920 0,959 0,979 0,983 0,986 0,988

21 0,873 0,888 0,908 0,923 0,960 0,980 0,983 0,987 0,989

22 0,878 0,892 0,911 0,926 0,961 0,980 0.984 0,987 0,989

23 0,881 0,895 0,914 0,928 0,962 0,981 0,984 0,987 0,989

24 0,884 0,898 0,916 0,930 0,963 0,981 0,984 0,987 0,989

25 0,888 0,901 0,918 0,931 0,964 0,981 0,985 0,988 0,989

26 0,891 0,904 0,920 0,933 0,965 0,982 0,985 0,988 0,989

27 0,894 0,906 0,923 0,935 0,965 0,982 0,985 0,988 0,990

28 0,996 0,908 0,924 0,936 0,966 0,982 0,985 0,988 0,990

29 0,898 0,910 0,926 0,937 0,966 0,982 0,985 0,988 0,990

30 0,900 0,912 0,927 0,939 0,967 0,983 0,985 0,988 0,900

Tabela 16.2 – Valores críticos da estatística W de Shapiro-Wilk

BIOESTATISTICA_Vol_01.indb 403 25/06/12 17:14

Page 404: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

BIOESTATISTICA_Vol_01.indb 404 25/06/12 17:14

Page 405: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tabelas 405

14835 07362 26733 66337 20020 46848 24360 67813 17531 9616084156 22328 08704 06439 64789 19606 74597 42899 36235 9108907439 84935 67799 78493 03976 72783 31131 60452 23680 8821260562 06499 56274 89528 77248 82823 29149 02415 46849 3437292554 02182 58212 23811 74399 01856 50828 05868 60178 3612057154 33430 44547 19479 28029 98735 02523 07352 26115 0578433592 35545 09878 39291 05498 20618 13325 88848 05151 1029863113 59196 90890 52945 95027 82655 76150 00102 23247 3813553456 15261 00582 37612 11971 92844 44112 48161 15426 2670489202 77388 51468 91049 19894 02188 13318 22280 34959 5524588891 23578 84958 96820 99600 94748 42738 57576 79063 0776584885 80345 96016 01251 09348 28560 11147 01657 00755 4364238697 69389 98345 73048 29507 18526 67736 56657 49748 0216039871 02677 13729 60302 49365 36310 29226 52028 93731 5836533006 74668 41831 49768 95000 21495 32144 09647 64404 3625707154 82834 40799 10422 81214 26325 65495 48346 27304 7626631432 17859 22968 94194 06884 34888 65166 25467 35774 6105656960 26638 36632 91651 29180 98155 01805 51464 49138 0571002355 56388 09067 75695 25493 97169 22686 21475 31110 5304582103 63195 65527 66243 96807 69165 95289 62930 66343 8371150825 82955 24147 75012 20103 60267 04051 11654 81456 0292003628 55427 72771 11270 13391 42267 25646 96957 39640 3433415891 95262 89450 10087 92371 99885 94941 46284 77397 4010050811 44401 92573 84821 49314 34342 01290 91163 37248 3504159943 24172 16959 76008 04121 99199 55271 38518 07155 9752845342 34103 48817 53536 03630 80439 17091 77911 87900 9103474881 27536 54074 82623 64322 32241 66784 14590 17966 7218777329 75480 19058 91100 21175 87860 98479 87996 39068 1434835196 84012 03780 47762 94498 89812 71238 54070 43360 6139584371 38352 85742 01610 41863 59977 58513 79876 87152 5024922980 08123 98993 35609 45406 57914 96884 23851 65979 0390358486 17927 91107 83002 90223 04731 88063 95720 91892 0124661376 95034 53865 29670 13302 67790 92887 69725 98265 9045923756 35575 07730 38317 40512 95941 66943 68526 24235 3860904044 43464 90762 94781 68427 50021 82905 33939 41037 5441760047 50681 64384 42320 46016 51491 23656 55597 47347 1886383531 86235 40884 45400 96397 37285 06290 04315 05773 1862106544 92307 69731 53410 63161 31227 10973 87011 59483 0937049791 25181 29805 45135 94955 77642 45637 28200 77295 4080021295 61442 44858 73413 19594 59741 39278 78953 24769 77854

Tabela 17 - Números aleatórios

BIOESTATISTICA_Vol_01.indb 405 25/06/12 17:14

Page 406: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

BIOESTATISTICA_Vol_01.indb 406 25/06/12 17:14

Page 407: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

ADES, A. E.; HIGGINS. J. P. T. The Interpretation of Random-Effects Meta-Analysis in Decision Models. Medical Decision Making, v. 12, p. 646-654, 2005.

ARMITAGE, P.; BERRY, G. The planning statistical investigations. In: ______ Statistical methods in medical research. 2. ed. Oxford, Blackwell, 1987.

ASSOCIAÇÃO BRASILEIRA DE NORMAS TÉCNICAS. NBR 10520: informação e docu-mentação: apresentação de citações em documentos. Rio de Janeiro, 2002.

BANERJEE, M. et al. “Beyond Kappa: A Review of Interrater Agreement Measures” The Canadian Journal of Statistics, vol. 27, n. 1, p. 3-23, 1999.

BEGHETTO, M. G.; ASSIS, M. C. S; LUFT, V.C.; Mello, E. D. Precisão e acurácia na afe-rição do peso corporal em adultos hospitalizados. Rev Assoc Med Bras, v. 52, n. 1, p. 23-7, 2006.

BEIGUELMAN, B. Curso prático de bioestatística. 5. ed. Ribeirão Preto: FUNPEC-Editora, 2002.

BLAND, J. M.; ALTMAN, D. G. Measurement error and correlation coefficients. BMJ, v. 313, p. 41-2, 1996.

BLAND, J. M.; ALTMAN, D. G. Measuring agreement in method comparison studies. Statistical Methods in Medical Research. Stat Methods Med Res, v. 8, n. 2, p.135-60, 1999.

BLAND, J. M.; ALTMAN, D. G. Statistical method for assessing agreement between two methods of clinical measurement. The Lancet, v. 1, n. 8476, p. 307-10, 1986.

Referências Bibliográficas

BIOESTATISTICA_Vol_01.indb 407 25/06/12 17:14

Page 408: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental408

BUSSAB, W. O.; MORETTIN, P. Estatística básica. 4 ed. São Paulo, Atual, 1987.

BUSTAMENTE-TEIXEIRA, M. T.; FAERSTEIN, E. LATORRE, M. R. Técnicas de análise de sobrevida. Cadernos de Saúde Publica, Rio de Janeiro, v. 18, n. 3, p. 579-594, 2002.

CALLEGARI-JACQUES, S. Bioestatística - princípios e aplicações. 1 ed. Porto Alegre: Artmed Editora, 2003.

CHOEN, J. A coefficient of agreement for nominal scales. Educ Psychol Meas, v. 20, p. 37-46, 1960.

DAWSON, B.; TRAPP, R. G. Bioestatística básica e clínica. 3 ed. Rio de Janeiro, RJ: McGraw-Hill Interamericana do Brasil Ltda., 2003.

DERSIMONIAN, R.; LAIRD, N. Meta-analysis in Clinical Trials. Controlled Clinical Trials, v. 7, p. 177-188, 1986.

DOWNING, D.; CLARK, J. Estatística Aplicada. 1 ed. São Paulo, SP: Editora Saraiva, 2000.

DUPONT, W. D. Power and sample size calculations. Controlled Clinical Trials, v. 11, p. 116-128, 1990.

FERREIRA, A.B.H. Novo Dicionário Aurélio em CD-ROM. Versão 5.0. Curitiba, PR: Editora Positivo, 2005

FLEISS, J. L. Statistical methods for rates and proportions. New York: John Wiley, 1981. p. 212-236.

FLEISS, J. L.; COHEN, J. “The equivalence of weighted kappa and the intraclass cor-relation coefficient as measures of reliability”. Educational and Psychological Measurement, v. 33, p. 613—619, 1973.

FLEISS, J. L.; GROSS, A. J. Meta-analysis in epidemiology, with special reference to studies of the association between exposure to environmental tobacco smoke and lung cancer: A critique. J Clin Epidemiol, v. 44, p. 127-39, 1991.

FLETCHER, R. H.; FLETCHER S. W.; WAGNER E. H. Epidemiologia Clínica: Elementos Essenciais. 3 ed. Porto Alegre, RS: Artes Médicas, 1996.

FLETCHER, R. H.; FLETCHER S. W.; WAGNER, E. H. Epidemiologia Clínica: Bases Científicas da Conduta Médica. 1 ed. Porto Alegre: Artes Médicas, 1989.

GAVAGHAN, D. J.; MOORE, A. R.; MCQAY, H. J. An evaluation of homogeneity tests in meta-analysis in pain using simulations of patient data. Pain, v. 85, p. 415-24, 2000.

BIOESTATISTICA_Vol_01.indb 408 25/06/12 17:14

Page 409: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tamanho da amostra e randomização 409

GREENLAND, S. A simple method to calculate the confidence interval of a stan-dardized mortality ratio. American Journal of Epidemiology, v. 133, n. 2, p. 212-213, 1990.

GREENLAND, S.; ROBINS, J. M. Estimation of common effect parameter from sparse follow up data. Biometrics, v. 41, p. 55-68, 1985.

GREENLAND, S.; SALVAN, A. Bias in the one-step method for pooling study results. Statistics in Medicine, v. 9, p. 247-252, 1990.

HEDGES, L. V.; PIGOTT, T. D. The power of statistical tests in meta-analysis, Psychological Methods, v. 6, p. 203-217, 2001.

HIGGINS, J. P. T.; THOMPSON, S. G. Quantifying heterogeneity in a meta-analysis. Statistics in Medicine, v. 21, p. 1539-1558, 2002.

HIGGINS, J. P. T.; THOMPSON, S. G.; DEEKS, J. J.; et al. Measuring inconsistency in meta-analyses. British Medical Journal, v. 327, p. 557-560, 2003.

HOUWELINGEN, H. C. V.; ARENDS, L. R.; STIJNEN, T. Advanced methods in meta--analysis: multivariate approach and meta-regression. Stat Med, v. 21, p. 589-624, 2002.

HULLEY, S. B.; CUMMINGS, S. R.; BROWNER, W. S. et al. Delineando a pesquisa clí-nica – uma abordagem epidemiológica. 2 ed. Porto Alegre, RS: Artmed Editora, 2001.

IBGE: Normas de apresentação tabular. 3. ed. Rio de Janeiro, 1993.

JEKEL, J. F.; ELMORE, J. G.; KATZ, D. L. Epidemiologia, Bioestatística e medicina pre-ventiva. 2 ed. Porto Alegre, RS: Artmed: Editora, 2004.

KAPLAN, E. L.; MEIER, P. Non parametric estimation from incomplete observation. Journal of the American Statistics Association, v. 53, p. 457-481, 1958.

KIRKWOOD, B. R. Essentials of medical statistics. Oxford: Blackwell, 1988.

LACATOS, E. M.; MARCONE, M. A. Metodologia Científica. 2 ed. São Paulo: Atlas, 1991.

LEMESHOW, S.; HOSMER, DAVID. Adequacy of sample size in health studies. Chichester, John Wiley, 1990.

LEVY, P.; LEMESHOW, S. Sampling for health professionals. Belmont, LLP, 1980.

LEWIS, S.; CLARKE, M. Forest plots: trying to see the wood and the trees. BMJ, v. 322, p.1479-80, 2001.

LOVATTO, P.A. et al. Meta-análise em pesquisas científicas: enfoque em metodolo-gias. R Bras Zootec, v. 36, supl. 2008, p. 285-294, 2007.

BIOESTATISTICA_Vol_01.indb 409 25/06/12 17:14

Page 410: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental410

LWANGA, S. K.; LEMESHOW, S. Sample size determination in health studies: a prac-tical manual. Geneva, World Health Organization, 1991.

MARCANTONIO, A. T.; SANTOS, M. M.; LEHFELD, N. A. Elaboração e divulgação do trabalho científico. São Paulo: Atlas, 1993.

MEDRONHO, R. A.; CARVALHO, D. M.; BLOCH, K. V.; LUIZ, R. R. et al. Epidemiologia. 1 ed. São Paulo, SP: Editora Atheneu, 2005.

MOTTA, V. T.; WAGNER, M. B. Bioestatística. 1 ed. Caxias do Sul, RG: Robe Editorial, 2003.

NETER, J.; WASSERMAN, W.; KUTNER, M. H. Planning sample sizes, nonprametric tests, and random ANOVA model. In: _____ Applied linear statistical models: regression, analysis of variance and experimental designs. 3. ed. Boston, Irwin, 1990. p. 633-42.

NETO, B. B.; SCARMINO, I. S.; BRUNS, R. E. Como fazer experimento. 3 ed. Campinas , São Paulo: Editora da Unicamp, 2007.

NETO, B. B.; SCARMINO, I. S.; BRUNS, R. E. Como fazer experimento. 2 ed. Campinas , São Paulo: Editora da Unicamp, 2007.

OLIVEIRA, S. L. Tratado de metodologia científica: Projetos de pesquisas, TGI, TCC, monografias, dissertações e teses. São Paulo: Pioneira, 1997.

PEREIRA, M. G. Epidemiologia, Teoria e Prática. 1 ed. Rio de Janeiro, RJ: Guanabara Koogan, 1995.

RODRIGUES, M. I.; IEMMA, A. F. Planejamento de esperimentos e otimização de pro-cessos. 1 ed. Campinas, São Paulo: Casa do Pão Editora, 2005.

ROTHMAN, K. J. Modern Epidemiology. Boston, Little Brown, 1986. p.23-34.

SACKETT, D. L. Bias in analytic research. J Chron Dis, v. 32, p. 51-63, 1979.

SEVERINO, A. J. Metodologia do trabalho científico. 20 ed. São Paulo: Cortez, 1996.

SIEGEL, S. Estatística Não Paramétrica. São Paulo: 1 ed. Editora McGraw-Hill do Brasil Ltda., 1975.

SIEGEL, S.; CASTELLAN, N. Nonparametric Statistics for the Behavioral Sciences. 2. ed. New York: McGraw-Hill, 1988. p. 284-285.

SILVA, C. R. O. Metodologia e organização do projeto de pesquisa. 1 ed. Fortaleza, CE: Centro Federal de Educação Tecnológica do Ceará, 2004.

SILVA, E. L.; MENEZES, E. M. Metodologia da pesquisa e elaboração de dissertação. 3 ed. Florianópolis, SC: Universidade Federal de Santa Catarina, 2001.

BIOESTATISTICA_Vol_01.indb 410 25/06/12 17:14

Page 411: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

tamanho da amostra e randomização 411

SIM, J.; WRIGHT, C. C. The Kappa Statistic in Reliability Studies: Use, Interpretation, and Sample Size Requirements. Physical Therapy, v. 85, p. 257-268, 2005.

SNEDECOR, G. W.; COCHRAN, W. G. Statistical methods. 6th ed. Iowa: Iowa State University Press, 1967. 505 p.

STEEL, R. G. D, TORRIE, J. H. Principles and procedures of statistics. 2nd ed. New York: Mc Graw-Hill, 1980. 633 p.

STEVENSON, W. J. Estatística Aplicada à Administração.1 ed. São Paulo, SP: Editora Harper & Row do Brasil Ltda., 1981.

TRIOLA, M. F. Introdução à Estatística. 7 ed. Rio de Janeiro, RJ: Livros Técnicos e Científicos Editora S.A., 1999.

VELÁSQUEZ-MELÉNDEZ, G.; PIMENTA, A. M.; KAC G. Epidemiologia do sobrepeso e da obesidade e seus fatores determinantes em Belo Horizonte (MG), Brasil: estudo transversal de base populacional. Rev Panam Salud Publica, v. 16, n. 5, p. 308-14, 2004.

VIEIRA, S. Metodologia científica para a área de saúde. São Paulo, Sarvier, 1984. p. 77-82.

BIOESTATISTICA_Vol_01.indb 411 25/06/12 17:14

Page 412: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental412

BIOESTATISTICA_Vol_01.indb 412 25/06/12 17:14

Page 413: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Índice Remissivo 413

Índice Remissivo

AAcurácia 170Acurácia e precisão 133, 170Alocação estratificada 165Alocação sistemática 164Amostra 132

aleatória estratificada 136aleatória simples 135aleatória sistemática 137de conveniência 138por conglomerado 137por cota 138representativa da população 140

Amostragem 131com reposição 160probabilística 134sem reposição 161

Amostras não-probabilísticas 138probabilísticas 134

Amplitude do intervalo de classe 204interquartílica 277total 254

Análise de sensibilidade 106aplicação da curva normal 302da distribuição binomial 306do viés de publicação 105e discussão dos resultados 51e interpretação dos dados 169

Apresentação gráfica 168tabular 168

Arredondamento de dado numérico 216Associação espúria 174, 192Atributo 187

BBase populacional 132Bias 173CCabeçalho 215Cálculo

cálculo do “n” amostral para estudos analíticos 152de amplitude interquartílica 282de n para comparar duas proporções amostrais 154de n para comparar uma proporção amostral com uma proporção popula-cional 156de n para estimar a média da popu-lação 149de n para estimar o coeficiente de cor-relação 151de n para estimar uma proporção na população 152de n para o teste t de Student considerando os erros alfa e beta 152de uma área situada entre dois valores de x 303de uma área situada entre µ e x 302do efeito-sumário 114do intervalo de confiança para diferença entre duas proporções 315do intervalo de confiança para propor-ções 312do “n” amostral para estudos descri-tivos 149do “n” para populações limitadas(finitas)

BIOESTATISTICA_Vol_01.indb 413 25/06/12 17:14

Page 414: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental414

157do “n” para uma amostra aleatória simples 157do “n” para uma proporção popula-cional conhecida 159dos valores de x que limitam uma área conhecida 305

Cálculos para o tamanho da amostra 141Características da curva normal 299Cartograma 218Caso 187Cegamento 93Centil 278Chamada 216Ciência aplicada 28

natural 28pura 28social 28

Ciências 27ambientais 29da saúde 28holísticas 29naturais 28sociais 29

Classe 202Classificação

das variáveis 188dos estudos de pesquisa 63

Coeficientede assimetria de Pearson 273de curtose 274de variação 271percentílico de curtose 274

Coleta de dados 49Coluna indicadora 213Conceitos estatísticos 185Condições diferentes de aferição 181Confiabilidade 171Confundimento 176Conhecimento científico 31Construindo

uma distribuição de frequência 204um gráfico box plot 283

Contagem da frequência 206

Controles históricos 98Correlação de Pearson 225Curva

leptocúrtica 275mesocúrtica 274normal padronizada (reduzida) 297platicúrtica 301

DDados 197

brutos 198numéricos 215primários 169secundários 169

Decil 277Decisões estatísticas 319Delineamento do estudo 142Desvio médio absoluto 255Desvio padrão 261

para dados agrupados em classes 263para tabela de grupamento simples 262versus amplitude 268versus unidade padrão normalizada 269

Desvios significantes 289Detectando valores outliers 284Determinação

do intervalo de classe 205do número de classes 205dos limites de classe 205dos objetivos 48

Diagrama 218de dispersão 224de pareto 228de Tukey 282

Diferença estimada entre os grupos 144Distribuição

amostral das Médias 288amostral das médias versus significân-cia estatística 288amostral de proporções 309assimétrica 250binomial (ensaios de Bernoulli) 306binomial versus distribuição normal 309

BIOESTATISTICA_Vol_01.indb 414 25/06/12 17:14

Page 415: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Índice Remissivo 415

de frequências 197de poisson 315normal (gaussiana) 296qualitativa 201quantitativa 201simétrica 250

Distribuição de Probabilidades 295EEfeito

aprendizado 96carryover 97do tratamento 108específico 108Hawthorne 96, 109modificador 177placebo 108

Efeito-sumário 114Elaboração do projeto de pesquisa 48Elementos da distribuição de frequência 209Ensaios

clínicos controlados 85clínicos controlados e randomizados 86clínicos não-controlados 99clínicos não-randomizados 91de Bernoulli 306

Entendendo a variância 259Erro

aleatório 175alfa 144, 329amostral 139beta 144, 329falso negativo 329falso positivo 329não amostral 139não-diferencial 175padrão da média 287sistemático (Bias) 173tipo I 329tipo II 329

Errosna coleta de dados 173no processo de amostragem 139

Escolhado grupo controle 90do teste estatístico 341

Estatísticade Kappa 171descritiva 183inferencial 186

Estereograma 218Estimação de parâmetros 320Estimativa 187

de erro 133pontual 321por intervalo 321

Estimativas 133estimativa-sumário 105Estratégias para melhorar a coleta de dados 178Estrutura da pesquisa 38Estudo

caso-controle 70caso-controle aninhado 81caso-coorte 81cego 92de coorte (cohort) 75de corte transversal 65duplo-cego 93Estudo de caso 64triplo-cego 95

Estudosautocontrolados 95com cegamento 92com controles externos 98cruzados (cross-over) 96de meta-análise 99experimentais 85

Etapasde um teste de hipóteses estatísticas 337para a meta-análise 102

Execução operacional do projeto 49Experimento

binomial 306científico 33

FFonte 216Fontes de variação 180Fórmula

de Sturges 206

BIOESTATISTICA_Vol_01.indb 415 25/06/12 17:14

Page 416: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental416

geral para medidas separatrizes 279Framinghan Heart Study 54Frequência 200

acumulada absoluta 211acumulada relativa 211relativa simples 210simples absoluta 204

Fundamentos do teste de hipótese 326GGráfico

Box Plot 282de Bland-Altman 171de caule e folha (steam-and-leaf) 223de colunas com barra de erros 227de colunas justapostas 230de colunas superpostas 231de distribuição conjunta 224de linha (curva) 233de pizza 232de setores 232forest plot 125

Gráficospara dados qualitativos 226para dados quantitativos 219

Graus de liberdade 260Grupo

controle 86experimental 86

HHipótese 34

alternativa 324nula 324

Hipóteses estatísticas 324Histograma de frequências 219Homogeneidade 133IIdentificação dos estudos 102Inferência estatística 320Interação 177Interpretando o desvio padrão 264Intervalo

de classe 203de confiança 289

L

Limiteinferior 203superior 203

Limites de classe 203MMascaramento 180Média

aritmética 243geométrica 252harmônica 252para dados agrupados em tabelas de frequência 246para dados em grupamentos simples 246ponderada para dados não agrupados 245simples para dados não agrupados 244

Mediana 240para dados agrupados em tabelas de frequência 241para dados não agrupados 241

Medidasde assimetria 273de curtose 274de dispersão 236de posição 276de tendência central 237do tamanho do efeito do tratamento 108para cálculo do efeito-sumário 114

Meta-análise 99qualitativa 100quantitativa 100

Métodocientífico 33da diferença 33dedutivo 32de Woolf 112experimental 33gráfico alternativo 242indutivo 32observacional 33

Métodosde amostragem 134

BIOESTATISTICA_Vol_01.indb 416 25/06/12 17:14

Page 417: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Índice Remissivo 417

de randomização 160diferentes de aferição 181estatísticos para a meta-análise 108

Moda 237bruta 238de Czuber 239de King 239de Pearson 240

Modelosde efeito aleatório 124de efeito fixo 124

Moldura 215NNível

alfa 330de confiança 290de significância 289

Normas para apresentação tabular de dados 214Nota

específica 216geral 216

OObjetivo

da amostra 142da coleta de dados 167da randomização 160organização de dados 167

Observação 187Odds ratio 109

de Peto 111meta-analítico de Mantel-Haenszel 118meta-analítico de Peto 117

ogiva 222de Galton 222

Organizaçãode dados estatísticos 197do material coletado 50

PParâmetro 187

da distribuição binomial 308da distribuição de frequências 235

Partes da tabela 214Percentil 278Peso de cada estudo 114

de Peto 116Pesquisa

analítica 57básica 52bibliográfica 59de campo 60descritiva 57documental 59experimental 54explicativa 58exploratória 58fundamental 52laboratorial 59longitudinal 60observacional 54prospectiva 60qualitativa 55quantitativa 56retrospectiva 60tecnológica 53transversal 60

Poder do teste 334Polígono

de frequência 220de frequência acumulada 222

Ponto médio 210População 131

alvo 68ilimitada 132limitada 132

postulado 34precisão 133Primeiro coeficiente de assimetria de Pear-son 273Primeiro quartil 276princípio de Pareto 229Propriedades da média aritmética 247QQuartil 276Questão da pesquisa 40, 41RRandomização 131, 160, 162

para amostra aleatória simples 162Razão de chance 70Recrutamento 140

BIOESTATISTICA_Vol_01.indb 417 25/06/12 17:14

Page 418: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental418

Reduçãoabsoluta de risco 114relativa de risco 113

Regiãode não-significância 289de significância 289

Regressão linear 225Relação geral das medidas separatrizes 279Relatório final e divulgação dos resultados 51Representação gráfica 218

meta-analítica 125Reprodutibilidade 171Revisão da literatura 45Risk ratio 112

meta-analítico de Mantel-Haenszel 120Rol 200SSegundo coeficiente de assimetria de Pear-son 273Segundo quartil 276Seleção

dos estudos 104dos participantes 88

Sériecronológica 198de casos 64específica 198estatística 198geográfica 198

sinergismo 177, 178soma total dos quadrados 249TTabela

da distribuição binomial 309de frequência 200de grupamento para variáveis cat-egóricas 213de grupamento por intervalo de classe 208de grupamento simples 212de números aleatórios 135normal padrão 298

Tamanho

da amostra 131da diferença 143da população 143

Teoremade Chebyshev 265do limite central 288

Terceiro quartil 276Tese 34Teste

bicaudal 334de hipótese estatística 332de homogeneidade 121de homogeneidade de Cochran 122de significância entre as proporções de duas amostras independentes 313de significância para uma proporção 311Q 122unicaudal 334

Tipode delineamento 64de pesquisa 52de variável 142

Tiposde análises estatísticas 340de dados quanto à origem 168de erro na verificação de hipóteses 329de hipóteses estatísticas 324de meta-análise 105de pesquisa científica 52de randomização 160de tabela de distribuição de frequência 212

Título 215VValor

outlier 284P 330z 269

valor crítico amostral 331estimado para erro alfa 142

Valoresoutliers potenciais 286outliers verdadeiros 286

BIOESTATISTICA_Vol_01.indb 418 25/06/12 17:14

Page 419: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Índice Remissivo 419

Vantagens do uso da média aritmética 249variabilidade amostral 139Variações biológicas 180Variância 256

das proporções esperadas 145Variáveis 188

contínuas 188dependentes 194dicotômicas 190discretas 189independentes 193nominais 190ordinais 190preditoras 193qualitativas 189quantitativas 188randômicas binomiais 306variáveis-resposta 194

Variável 142confundidora 176

Viésde aferição 174de medição 174de memória 175de recordação 175de seleção 174

WWashout 91, 97ZZona de rejeição 335

BIOESTATISTICA_Vol_01.indb 419 25/06/12 17:14

Page 420: BIOESTATÍSTICA · 2018-08-09 · Membro da Associação Brasileira de Educação Médica (ABEM). Membro da Associação Brasileira de Médicos Escritores (SOBRAMES). BIOESTATÍSTICA

Bioestatística aplicada à pesquisa experimental420

BIOESTATISTICA_Vol_01.indb 420 25/06/12 17:14