estatistica: uma ferramenta interdisciplinar
DESCRIPTION
A palavra “estatística” provém do latim “status”, que significa “estado”. A suautilização na antiguidade envolvia compilações de dados e gráficos que descreviamvários aspectos de um estado ou país (TRIOLA, 1999; ZAR, 1996). Entretanto,Costa (1992) afirma que há indícios da estatística por volta de 3000 anos A.C. naBabilônia, China e Egito. Mas essas primeiras abordagens estavam ligadasexclusivamente a interesses governamentais em busca da otimização dos processosde coleta de impostos.TRANSCRIPT
PABLO DAMIAN BORGES GUILHERME
ESTATISTICA: UMA FERRAMENTA INTERDISCIPLINAR
Trabalho de Conclusão de Curso, apresentado como requisite para a conclusão do curso de Licenciatura Plena em Matemática, da Faculdade Estadual de Filosofia, Ciências e Letras de Paranaguá Professora Orientadora: Dra. Yara Aparecida Garcia Tavares
PARANAGUÁ
- 2008 -
FACULDADE ESTADUAL DE FILOSOFIA, CIÊNCIAS E LETRAS DE PARANAGUÁ
ESTATÍSTICA: UMA FERRAMENTA INTERDISCIPLINAR
Pablo Damian Borges Guilherme
PARANAGUÁ - 2008 -
DEDICATÓRIA Aos meus únicos pais, minha única avó, meus únicos irmãos, meu único amor e minha única filha. Aos meus únicos amigos. Sempre e aleatoriamente.
AGRADECIMENTOS A todos os meus guias e orientadores: Científicos, Amigos, Financeiros, Amores e a Família.
EPIGRAFE
É fato conhecido que há um número infinito de mundo, simplesmente porque há um espaço infinito para que esses mundos existam. Todavia, nem todos são habitados. Assim, deve haver um número finito de mundos habitados. Qualquer número finito dividido por infinito é tão perto de zero que não faz diferença, de forma que a população de todos os planetas do Universo pode ser considerada igual a zero. Disso podemos deduzir que a população de todo o Universo também é zero, e que quaisquer pessoas que você possa encontrar de vez em quando são meramente produtos de uma imaginação perturbada.
Douglas Adams, 1980
SUMÁRIO
SUMÁRIO vi LISTA DE FIGURAS vii 1. INTRODUÇÃO 1 2. FUNDAMENTAÇÃO TEÓRICA 5 2.1. ESTATÍSTICA DESCRITIVA 5 2.1.1. Medidas de Tendência Central 5 2.1.2. Medidas de Dispersão e Variabilidade 6 2.1.3. Índices 7 2.2. ANÁLISES DE CORRELAÇÃO 102.2.1. Testes Paramétricos 102.2.2. Testes Não-Paramétricos 122.3. ANÁLISES DE REGRESSÃO 132.3.1. Regressão Linear Simples 132.3.2. Regressão múltipla 142.4. EXPERIMENTOS MULTINOMIAIS E TABELAS DE CONTINGÊNCIA 152.4.1. Aderência (Qui-Quadrado) 152.4.2. Tabelas de contingência (independência e homogeneidade) 172.5. ANÁLISE DE VARIÂNCIA 183. METODOLOGIA 214. RESULTADOS 224.1. ARTIGOS DE 2006 224.2. ARTIGOS DE 2007 235. CONSIDERAÇÕES FINAIS 256. REFERÊNCIAS BIBLIOGRÁFICAS 267. ANEXOS 298. APÊNDICE 35
vi
LISTA DE FIGURAS
FIGURA 1 - PROPORÇÃO DOS ARTIGOS QUE ENVOLVEM TRABALHOS NUMÉRICOS E ESTATÍSTICOS EM UMA DÉCADA DE PUBLICAÇÕES NO PERIÓDICO THE AMERICAN NATURALIST (SOKAL E ROHLF, 1995)
3
FIGURA 2 - PADRÕES DE DISTRIBUIÇÃO: “A” (AO ACASO OU ALEATÓRIA), “B” (AGRUPADA OU CONTAGIOSA) E “C” (UNIFORME OU REGULAR)
10
FIGURA 3 – DIAGRAMA DE DISPERSÃO (CORRELAÇÃO POSITIVA) 11
FIGURA 4 – DIAGRAMA DE DISPERSÃO (CORRELAÇÃO NEGATIVA) 12
FIGURA 5 – DIAGRAMA DE DISPERSÃO (DADOS NÃO CORRELACIONADOS)
12
FIGURA 6 – GRÁFICO DA DISTRIBUIÇÃO DO TESTE F - ADAPTADO DE TRIOLA (1999)
17
vii
1
1. INTRODUÇÃO
A palavra “estatística” provém do latim “status”, que significa “estado”. A sua
utilização na antiguidade envolvia compilações de dados e gráficos que descreviam
vários aspectos de um estado ou país (TRIOLA, 1999; ZAR, 1996). Entretanto,
Costa (1992) afirma que há indícios da estatística por volta de 3000 anos A.C. na
Babilônia, China e Egito. Mas essas primeiras abordagens estavam ligadas
exclusivamente a interesses governamentais em busca da otimização dos processos
de coleta de impostos. A própria bíblia nos fala do “censo” e por assim dizer da
estatística primitiva, como no Livro Quarto do Velho Testamento.
E falou o Senhor a Moisés no deserto do Sinai, no tabernáculo de aliança, no segundo ano depois da saída dos filhos de Israel do Egito, no primeiro dia do segundo mês e lhe disse: Tomai a rol todo o corpo dos filhos de Israel, por famílias, por casas e por cabeças, contando todos os varões, desde vinte anos, e para cima, e todos os homens fortes de Israel vós os contareis pelas suas turmas, tu e Aarão. (BÍBLIA, 1974, p.99)
Contudo há outros estudiosos que defendem a surgimento da estatística em
um tempo remoto da história, como Melão Jr. (S.D.) que argumenta sobre a
aplicação da estatística nos meados de 3,5 milhões A.C., quando organismos
primitivos começaram a desenvolver critérios quanto a sua sobrevivência
(relacionando a fatores evolutivos).
Sokal e Rohlf (1995) postulam a origem da estatística moderna a partir do
século XVII, quando foi derivada em duas vertentes: uma relacionada às ciências
políticas desenvolvendo a descrição quantitativa de vários aspectos governamentais,
como os publicados por John Graunt e William Petty que continham informes
estatísticos sobre nascimentos e mortes na cidade de Londres. Esses trabalhos
originaram estudos sobre natalidade e taxas de morbidade, tamanho de populações,
rendas e taxas de desemprego (TRIOLA, 1999).
Por outro lado a segunda linha da estatística moderna enfocou a teoria
matemática das probabilidades relacionado às chances de jogadas em diferentes
2
tempos, envolvendo muitos matemáticos renomados: Blaise Pascal, Pierre de
Fermat, Jacques Bernoulli e Abraham de Moivre.
O estimulo subseqüente, veio de outro campo da ciência: a Astronomia,
onde pequenas observações do espaço devem gerar teorias coerentes. Pierre-
Simon de Laplace, Carl Friedrich Gauss e Adolphe Quetelet, famosos astrônomos e
matemáticos do século XVIII, contribuíram de forma magnífica para a estatística
moderna, como por exemplo, como no desenvolvimento do método dos mínimos
quadrados (SOKAL e ROHLF, 1995).
Apesar da palavra “estatística” já aparecer nas enciclopédias a partir do final
do século XVIII, foi somente na Inglaterra, no início do século XX que, o verdadeiro
senso do uso desta ferramenta se relacionou a trabalhos desenvolvidos sobre
problemas agronômicos (GONÇALVES, 1998).
O primo de Charles Darwin, Francis Galton, fez muitos avanços estatísticos
no século XIX em relação à biometria (onde é considerado o “pai” dessa área). As
publicações de seu primo acerca da teoria da evolução teriam algumas
inadequações matemáticas, o que levou a tentar resolver problemas relativos à
hereditariedade. Este autor contribuiu principalmente com a metodologia estatística
de análises de variações biológicas. Nesse mesmo século, Florence Nightingale
funda a Enfermagem moderna utilizando-se dos artefatos estatísticos para melhorar
as condições médicas durante a Primeira Grande Guerra.
Contudo, a estatística somente adquire o status de campo da Ciência,
quando se inicia o desenvolvimento do cálculo das probabilidades, que viria a
fornecer a linguagem e o aparelho conceitual, permitindo a formulação de
conclusões com base em regras indutivas.
Atualmente, pode-se dizer que a Estatística tem por definição uma coleção
de métodos para planejar experimentos, obter dados e organizá-los, resumi-los,
analisá-los, interpretá-los e deles extrair conclusões. Segundo Levin (1978), a
Estatística é um conjunto de técnicas para a tomada de decisões que auxiliam os
pesquisadores na tarefa de fazerem inferências de amostras para populações e, a
partir daí, nos testes das hipóteses levantadas a natureza da realidade.
3
Uma análise feita por Sokal e Rohlf (1995) nos volumes da revista The
American Naturalist referente a onze anos de trabalhos científicos (1890 a 1990)
demonstrou um dramático aumento nos trabalhos que envolvem de alguma forma
dados numéricos, provando a eficiência dessas ferramentas (Fig. 1).
FIGURA 1 - PROPORÇÃO DOS ARTIGOS QUE ENVOLVEM TRABALHOS NUMERICOS E ESTATISTICOS EM UMA DECADA DE PUBLICAÇÕES NO PERIÓDICO THE AMERICAN NATURALIST (SOKAL E ROHLF, 1995)
Segundo Triola (1999) as aplicações da Estatística se desenvolveram de tal
forma que, praticamente todo campo de estudo se beneficia da utilização de
métodos estatísticos. Desta forma foi criada uma verdadeira revolução matemática,
no modo de pensar em todas as áreas do conhecimento. Atualmente, devido a sua
grande utilidade e potencial, a Estatística tem se tornado uma ferramenta
imprescindível dos pesquisadores propiciando além da interdisciplinaridade, a sua
obrigatoriedade na maioria dos cursos superiores de graduação e pós-graduação.
Na Ciência formulam-se hipóteses que expliquem a natureza da realidade.
Freqüentemente os métodos estatísticos são utilizados no teste sistemático de
hipóteses, ou seja, na argumentação daquelas que pareçam verdadeiras, lógicas ou
evidentes (LEVIN, 1978). A Estatística pode ainda ser muito útil quando o propósito
do pesquisador é generalizar suas descobertas a partir de amostras pequenas para
populações maiores – com um alto grau de confiança.
4
Um exemplo de aplicabilidade da ferramenta estatística pode ser constatado
na área das Ciências Biológicas, estando fortemente relacionada, por exemplo, nas
subáreas da Zoologia e Ecologia onde a Estatística (denominada no âmbito dessas
ciências como “Bioestatística”) é utilizada principalmente em trabalhos onde não é
possível obter-se dados de uma espécie ou população inteira.
O objetivo geral do presente estudo foi analisar um determinado número de
trabalhos científicos de uma segunda área do conhecimento, as Ciências Biológicas
especificamente a subárea de Zoologia, pela disponibilidade ao acesso a obras
referenciadas (Laboratório de Biologia Marinha/Departamento de Ciências
Biológicas/FAFIPAR) a fim de ser determinar quais as principais ferramentas
estatísticas utilizadas pelos pesquisadores dessa área e os motivos pelos quais
foram feitas tais escolhas.
5
2. FUNDAMENTAÇÃO TEÓRICA
2.1. ESTATÍSTICA DESCRITIVA
2.1.1. Medidas de Tendência Central
2.1.1.1. Média Aritmética ( )
A média é um conceito básico da matemática significando a soma dos
termos dividido pelo número deles. Apesar de simples é bastante importante, pois
será a base para cálculos mais complexos (CASTANHEIRA, 2005; ZAR, 1996). Os
valores típicos tendem a se localizar em um ponto central (média), dentro de um
conjunto de dados ordenados segundo suas grandezas (SPIEGEL, 1985).
Para dados não agrupados, utiliza-se:
∑
Onde: ∑ ó
ú (1)
Para dados agrupados, em distribuição de freqüências:
∑ .
Onde: é
∑ . ó
üê ú
(2)
2.1.1.2. Mediana (M)
Outra importante medida de tendência central que em termos gerais,
significa o valor mediano de um conjunto de dados quando arranjados ou
organizados em forma ascendente ou descendente (McCLAVE e DIETRICH II,
1985). Zar (1996) define a mediana para variáveis discretas com impar, através da
formula:
6
Onde:
? ú
(3)
Porém, quando esses dados se apresentam com variáveis discretas e um
par, a mediana é a média entre os dois valores localizados no meio dos dados.
2.1.2. Medidas de Dispersão e Variabilidade
2.1.2.1. Amplitude
A amplitude total de um conjunto de números é a diferença entre os
extremos de uma distribuição de dados (SPIEGEL, 1985; ZAR, 1996).
Onde:
ú ú
(4)
2.1.2.2. Desvio médio
Às vezes necessário conhecer o quanto os dados se afastam ou aproximam
em relação à média; assim é conveniente analisar a dispersão de cada um dos
valores (TRIOLA, 1999). Calcula-se o desvio médio para dados não agrupados,
através da formula:
| |.
Onde:
| | ó çã é
üê ú
(5)
Para os dados agrupados em classes ou intervalos, substitui-se o da
fórmula, pelo ponto médio de cada intervalo.
.
Onde:
ú é
üê é
(6)
7
Depois de estabelecer o valor médio de cada intervalo, aplica-se a fórmula
do desvio médio.
2.1.2.3. Variância ( )
O desvio médio absoluto é uma ótima medida de dispersão, isso por que
permite a real inferência sobre a distância média de cada variável em relação à
média. Contudo, para outros propósitos, é necessário elevar ao quadrado cada um
desses desvios e tomar a média de todos os quadrados adquiridos (TRIOLA, 1999).
A fórmula geral para a variância é:
Onde:
é (7)
2.1.2.4. Desvio padrão ( )
Apesar de a variância ser uma medida de dispersão fácil de trabalhar, é
considerado de difícil interpretação. Parte desse problema se deve a questão das
unidades serem expressas pelo quadrado desta (CASTANHEIRA, 2005). Para
facilitar o entendimento, faz-se a raiz quadrada da variância, chamada de desvio-
padrão.
Onde: â
(8)
2.1.2.5. Coeficiente de variação ( )
Caso se queira ter uma idéia de quanto à dispersão se afasta do valor da
média, pode-ser calcular o coeficiente de variação, que é dado em porcentagem:
. 100 Onde:
ã é
(9)
2.1.3. Índices
Para variáveis discretas (como em escalas nominais) é invocado o conceito
de diversidade, que nada mais é do que a distribuição das observações através de
8
categorias. As observações são distribuídas eventualmente através da eleição de
categorias, que assim tornam-se comparáveis entre si. Por exemplo, uma alta
diversidade num conjunto de dados com muitas observações e uma baixa
diversidade, onde foram feitas poucas observações, ainda que abundantes (ZAR,
1996).
2.1.3.1 Índice de Simpson (D)
Uma medida extraída a partir da abundância padrão (número de
observações) e da riqueza (número total de categorias em uma unidade amostral) de
uma população é o índice de diversidade de Simpson (BEGON et al, 2006). Esse
índice é calculado para cada categoria a proporção de observações que contribui
para o total da amostras. O índice é descrito através da fórmula:
1
∑ Onde:
ú çõ çã
(10)
2.1.3.2. Equitabilidade (E)
Pode ser quantificada entre 0 e 1 e expressa pela razão entre o índice de
Simpson (D) e uma proporção de máximo valor possível expressa por ou
(BEGON et al, 2006).
1
∑1
Onde: ú çõ
çã (11)
2.1.3.3. Índice de Diversidade de Shannon (H)
Outro índice que é freqüentemente usado, com propriedades
essencialmente similares ao índice de similaridade de Simpson (D).
9
Onde:
ú çõ çã
(12)
2.1.3.4. Índice de equitabilidade de Pielou ou Diversidade Relativa (J)
Pode ser quantificada entre 0 e 1 e expressa pela razão entre o índice de
diversidade de Shannon (H) e uma proporção de máximo valor possível expressa
por (BEGON et al, 2006).
∑
ln
Onde: ú çõ
çã (13)
2.1.3.5. Índice de Morisita (IM)
Esse índice é utilizado principalmente para medir a dispersão dos dados no
padrão de distribuição.
∑ ∑∑ ∑
Onde:
ú ó ú í
(14)
Sendo que esse pode apresentar valor de 1, 2 ou 3 representando
respectivamente distribuições ao acaso ou aleatória (Fig. 2a), agrupada ou
contagiosa (Fig. 2b) e uniforme ou regular (Fig. 2c).
10
(a) (b) (c)
FIGURA 2 - PADRÕES DE DISTRIBUIÇÃO: “a” (AO ACASO OU ALEATÓRIA), “b” (AGRUPADA OU CONTAGIOSA) E “c” (UNIFORME OU REGULAR)
2.2. ANÁLISES DE CORRELAÇÃO
Segundo Ayres e Ayres Jr. (2007), as análises de correlação proporcionam
um meio de verificar o grau de associação entre duas ou mais variáveis, através de
testes paramétricos e não-paramétricos:
2.2.1. Testes Paramétricos
2.2.1.1. Correlação Linear de Pearson (r)
Conceitua-se como correlação o grau de relação entre as variáveis testadas,
que procura determinar quão bem uma equação linear descreve ou explica a relação
entre as variáveis (SPIEGEL, 1977); ou uma técnica estatística que é usada para
medir e descrever a relação entre duas variáveis. (GRAVETTER e WALLNAU, 1995;
CANGELOSI, 1976).
Segundo Beiguelman (2002) o coeficiente de correlação complementa a
análise da reta (regressão) estimando o quanto da variação total é comum aos
elementos que constituem os pares analisados.
A correlação linear é também denominada coeficiente de correlação
momento-produto de Pearson, em homenagem a Karl Pearson que o estabeleceu e
definida pela fórmula:
11
∑ ∑ ∑
∑ ∑ ∑ ∑
Onde:
çã
(15)
Quando plotados os dados emparelhados (x e y) num gráfico forma-se um
diagrama de dispersão. Através desse gráfico é possível formular conclusões sobre
as variáveis testadas; contudo torna-se uma forma subjetiva, porque se baseia
puramente na percepção do autor. A correlação pode apresentar três diferentes
características em relação entre as variáveis x e y (GRAVETTER e WALLNAU,
1995), a saber:
1 - Direção de relação: podem ser classificada em duas categorias básicas:
positiva e negativa:
• Positiva: as duas variáveis tendem para a mesma direção, quando x cresce a
variável y também. (Fig. 3)
• Negativa: duas variáveis tendem em direções opostas, quando x cresce a
variável y decresce. (Fig. 4)
FIGURA 3 – DIAGRAMA DE DISPERSÃO
(CORRELAÇÃO POSITIVA)
12
FIGURA 4 – DIAGRAMA DE DISPERSÃO
(CORRELAÇÃO NEGATIVA)
2 - Forma da relação: baseado na forma em que os pontos se apresentam
no gráfico, em forma linear ou não linear (podendo ter inúmeras formas).
3 - Grau de relação: Demonstra o quando a relação entre x e y está
associada variando de -1 a +1, indicando, uma correlação negativa (r < 0), positiva (r
> 0) ou quando não há correlação (r = 0) (Fig. 5).
FIGURA 5 – DIAGRAMA DE DISPERSÃO (DADOS NÃO
CORRELACIONADOS)
2.2.2. Testes Não-Paramétricos
2.2.2.1. Correlação de Spearman (ρ)
O coeficiente ρ de Spearman mede a intensidade da relação entre variáveis
ordinais (McCLAVE e DIETRICH II, 1985). Utiliza-se em vez do valor observado,
apenas a ordem das observações. Deste modo, este coeficiente não é sensível a
13
assimetrias na distribuição, não exigindo, portanto que os dados provenham de duas
populações normais. Uma fórmula fácil para calcular o coeficiente ρ de Spearman
(não aconselhável para muito grandes) é dada por:
16 ∑
Onde: n número de pares xi, yi
– ç
(16)
O coeficiente de Spearman varia entre -1 e 1. Quanto mais próximo estiver
destes extremos, maior será a associação entre as variáveis (LUDWIG e
REYNOLDS, 1988). O sinal negativo da correlação significa que as variáveis variam
em sentido contrário, isto é, as categorias mais elevadas de uma variável estão
associadas a categorias mais baixas da outra variável.
2.3. ANÁLISES DE REGRESSÃO
A Regressão é análise que prediz o futuro (dados desconhecidos), baseado
em dados recolhidos a partir do passado (dados conhecidos), determina a equação
matemática para ser usada a fim de descobrir o que vai acontecer, dentro de um
determinado intervalo de probabilidade (GRIFFITH, 2007).
2.3.1. Regressão Linear Simples
Método de modelagem da afinidade entre duas variáveis (McCLAVE e
DIETRICH II, 1985) e também chamado de regressão, utilizado para estimar uma
relação que possa existir em determinada população. Da mesma forma como
usamos a média para resumir uma variável aleatória, a regressão é usada para
resumir a estimativa linear entre duas variáveis aleatórias (LAPPONI, 1997). De
acordo com Beiguelman (2002) o termo regressão utilizado pelos estatísticos nada
mais é do que a função para os matemáticos, ou seja, quando y depende de x. Triola
(1999) considera a regressão uma descrição da relação entre duas variáveis através
da plotagem dos dados, assim determinando a equação da reta que melhor os
representa.
14
A equação da regressão linear é uma formula algébrica pela qual se
determina o valor de y através de uma formula geral (ZAR, 1996):
Onde: á
á
(17)
Conforme descrito por Triola (1999) os dados devem estar emparelhados,
para facilitar os cálculos da equação da regressão. O gráfico formado através da
equação de regressão é chamado de reta de regressão (ou reta de melhor ajuste, ou
reta de mínimos quadrados).
∑ ∑ ∑
∑ ∑ Onde: ∑ çã á
(18)
Onde:
é á á
(19)
O arredondamento desses parâmetros complementares deve ser feito de
modo geral, com valores para três algarismos significativos.
2.3.2. Regressão múltipla ( )
Assim como a regressão simples, a regressão múltipla ou coeficiente de
determinação ajustado é utilizado para investigar se uma variável quantitativa está
correlacionada a outras sendo a única diferença, a concomitância entre duas ou
mais variáveis. Para Beiguelman (2002), a regressão múltipla segue uma fórmula
geral:
15
…
Onde: á
ú á
ã
(20)
Contudo, o calculo da regressão múltipla, exige processos trabalhosos
dependendo da quantidade de variáveis testadas; um dos resultados dessa análise é
a equação da regressão múltipla, que expressará o relacionamento linear entre a
variável dependente e as demais independentes.
ã
(21)
O coeficiente de determinação múltipla ( ), que determina a medida de
aderência para cada equação de regressão aos dados amostrais, pode ser ajustado
(devido uma falha quanto à adição de variáveis) através da equação proposta por
Triola (1999):
11
1 1
Onde:
á
² ã
(22)
Esse ajuste é perfeito quando a correlação entre os dados e a equação é
1, mas consideram-se os valores próximos como ótimos ajustes do coeficiente,
enquanto mais próximo do zero estiver mais fraco será o ajuste.
2.4. EXPERIMENTOS MULTINOMIAIS E TABELAS DE CONTINGÊNCIA
2.4.1. Aderência ou Qui-Quadrado ( )
Atribui-se ao início do século XX o desenvolvimento do teste estatístico qui-
quadrado por Karl Pearson (1857-1936) que, em resumo, mede a significância de
diferenças que ocorrem entre grupos. Beiguelman (2002) argumenta que nas
16
Ciências Biológicas e da Saúde é necessário muitas vezes verificar se uma
freqüência, de determinado acontecimento observado, se desvia significativamente
ou não da freqüência com que é esperado segundo alguma teoria; ou seja, mede-se
a discrepância existente entre as freqüências dos dados observados e esperados.
O teste Pearson’s qui-quadrado é um procedimento estatístico com
resultado avaliado na distribuição qui-quadrado. É um teste com hipóteses nulas, as
freqüências relativas de ocorrência são eventos observados através de uma
distribuição de freqüência específica. Os eventos são considerados por serem
independentes e por ter a mesma distribuição, e os resultados devem ter eventos
mutuamente exclusivos (PIRHAJI et al, 2008).
Assim o qui-quadrado é um teste não paramétrico (por que não depende
dos parâmetros populacionais) e pode ser determinado pelo somatório dos desvios
ao quadrado dividido pelos valores esperados, expressada por:
Onde:
üê üê
(23)
Segundo teorias ou conhecimentos pretéritos, estabelece-se o valor
esperado (e), enquanto que o valor observado (o) é geralmente coletado ou
experimentado. Quando 0, os dados observados e esperados concordam
exatamente; 0 isso não ocorre. Assim quanto maior o valor do qui-quadrado,
maior é a discrepância entre as freqüências. Esse teste mostra-se unilateral à direita,
por que o valor crítico e a região crítica estão situados na extrema direita da
distribuição (Fig. 6).
17
O conceito do grau de liberdade do (GL) pode ser expresso, segundo
Beiguelman (2002), como o número de classes de resultados menos o número de
informações da amostra que são necessárias ao cálculo dos valores esperados
nessas classes.
Através da tabela de distribuições de qui-quadrado (Apêndice 1) é possível
constatar a probabilidade correspondente ao valor encontrado e os graus de
liberdade estabelecidos.
2.4.2. Tabelas de contingência (independência e homogeneidade)
As tabelas de contingência são uns dos itens mais utilizados, por sua
facilidade em mostrar o resultado das pesquisas, nada mais é do que uma tabela em
que as freqüências correspondem a duas variáveis (uma categoriza as linhas e outra
as colunas). Existem dois tipos de teste relacionados a tabelas de contingência
(TRIOLA, 1999):
1- Teste de independência, que analisa a hipótese nula de que a variável
“linha” e a variável “coluna” são independentes ou não relacionadas. A fórmula para
o teste de independência é a mesma do qui-quadrado (vide fórmula 23) mudando
apenas a obtenção do grau de liberdade:
FIGURA 6 – GRÁFICO DA DISTRIBUIÇÃO DO TESTE F -
ADAPTADO DE TRIOLA (1999)
… Não Rejeitar
… Rejeitar
18
1 1 Onde:
(24)
E a freqüência esperada:
üê
(25)
2- Teste de homogeneidade, que avalia a afirmação de que diferentes
populações apresentam as mesmas proporções de determinadas características;
utiliza dados amostrais extraídos de diferentes populações, envolvendo escolhas
aleatórias feitas de modo que ou os totais de linhas, ou os totais de colunas sejam
predeterminados.
2.5. ANÁLISE DE VARIÂNCIA
A designação ANOVA deriva da expressão inglesa Analysis Of Variance,
denominando-se teste F em homenagem a R. A. Fisher (1924). É utilizado para
comparar mais de duas amostras cujos dados devem ser mensurados em escala
intervalar ou de razões (AYRES e AYRES JR, 2007; GRAVETTER e WALLNAU,
1995).
Gonçalves (1998) define ainda a ANOVA como uma decomposição da
variância total de um conjunto em variâncias parciais, correspondentes a fontes de
variação diferentes e determinadas. Posteriormente as variância serão comparadas
entre si (pelo teste F) que assim gerará uma significância estatística para diferenças
entre e com os grupos estabelecendo-se probabilidades entre 0,05, 0,001 ou menos
(GIRALDO et al, 2008).
Em suma, a análise compara a magnitude das variações de mais de duas
amostras, decompondo a variância total em duas partes:
a) Entre as amostras, constituindo o chamado quadrado médio dos tratamentos.
19
b) Dentre cada tratamento, compondo o denominado quadrado médio do erro
experimental
O teste F nada mais é do que a razão entre esses quadrados médios,
podendo ser feita através de testes paramétricos ou não-paramétricos.
Quando as amostras são reunidas é obtida a variância total, simbolizada por
. Considerando-se que a soma dos quadrados tem – 1 , a variância total é
descrita por:
∑ ∑
1
∑
1
Onde: ú
ú é
(26)
Com a suposição de que as populações tenham todas as mesmas
variâncias ( ), estima-se o seu valor comum utilizando duas abordagens diferentes
(BEIGUELMAN, 2002):
• Variância entre amostras: baseia-se na variabilidade entre as médias
amostrais é simbolizada por esse parâmetro mede a variação entre todas
as amostras reunidas. Assim a variação observada no total das médias seria:
∑
1
Onde: ú ú é
(27)
• Variância dentro das amostras: baseia-se na variabilidade entre as variâncias
amostrais é simbolizada por e mede a variação dentro das amostras
reunidas, através da fórmula:
20
∑ ∑
1
∑ ∑
Onde: ú ú é
(28)
O valor da fórmula geral da variância é tanto menor quanto mais
semelhantes forem às médias amostrais e o inverso ocorre quando as médias
forem diferentes entre si. A razão entre as variâncias origina o valor F, que é
verificado na tabela de F (Apêndice 2), ao nível de 5%.
Onde:
(29)
Quando o valor de F se aproxima de 1 assume-se que não há diferenças
significativas entre as medias amostrais; contudo se o valor de F é excessivamente
grande, é rejeitado a afirmação de igualdade das médias.
21
3. METODOLOGIA
Para a busca de trabalhos científicos da subárea de Zoologia foram
utilizadas as publicações trimestrais da Revista Brasileira de Zoologia (RBZ)
referentes aos anos de 2006 (151 artigos publicados) e 2007 (20 artigos publicados)
disponíveis no acervo particular do Laboratório de Biologia Marinha do
Departamento de Ciências Biológicas da FAFIPAR.
Nos exemplares da RBZ - edição 2006 foram avaliados todos os artigos
publicados naquele ano, enquanto que nos de 2007 foram escolhidos apenas os que
apresentavam algum tratamento matemático e/ou estatístico dos dados
apresentados e especificamente aqueles com ênfase em aspectos de cunho
ecológico (Zoologia Aplicada). Nesses trabalhos foram ainda pormenorizados os
objetivos e as metodologias utilizadas na tentativa de justificar os tratamentos
estatísticos escolhidos e quais os fatores levaram os pesquisadores a escolhê-los
(ANEXO 1).
22
4. RESULTADOS 4.1. ARTIGOS DE 2006
Dos cento e cinqüenta e um (151) artigos analisados do periódico Revista
Brasileira de Zoologia (2006) foi constatado que setenta e dois (72) não fizeram uso
de alguma ferramenta matemática, sendo estes trabalhos referentes à temática
“taxonomia” que se caracteriza pela descrição de espécies e revisão de gêneros.
Nos restantes 52,3% artigos (79) foram observados diferentes ferramentas
estatísticas, relativas à: análises de variância (ANOVA), índices de diversidade,
estatística descritiva, análises de correlação e análises multivariadas (Tabela 1;
Figura 7).
TABELA 1 - PRINCIPAIS ANÁLISES ESTATISTICAS UTILIZADAS NOS ARTIGOS PUBLICADOS NA REVISTA BRASILEIRA DE ZOOLOGIA NO ANO DE 2006
Ferramenta Quantidade Freqüência
Análise de Variância 22 14,6%
Índices de Diversidade 22 14,6%
Estatística Descritiva 21 13,9%
Análises de Correlações 15 9,9%
Análises Multivariadas 11 7,3%
23
FIGURA 7 – GRÀFICO EM PERCENTAGEM DAS PRINCIPAIS ANÁLISES ESTATÍSTICAS UTILIZADAS NOS ARTIGOS PUBLICADOS NA REVISTA BRASILEIRA DE ZOOLOGIA NO ANO DE 2006
4.2 ARTIGOS DE 2007
Nos 20 artigos do ano de 2007 foram utilizadas ao todo 40 ferramentas
estatísticas em média 2 tratamentos por trabalho. Dezoito (18) análises foram
utilizadas apenas uma vez; 17 foram observadas de duas a cinco vezes e 5
ocorreram de seis a oito vezes. As ferramentas análise de variância (ANOVA), índice
de diversidade de Shannon, o teste Qui-Quadrado e o Índice de Morisita foram as
mais utilizadas, representando 30% ou mais do total de trabalhos observados
(Tabela 2).
Interessante notar que o número de vezes em que os testes de similaridade
e t-student foram observados (ambos 20%) esteve associado ao uso dos índices de
diversidade e ANOVA por serem utilizadas nos artigos como ferramentas
preliminares dessas análises.
Análise de Variância
24%
Índices de Diversidade
24%
Estatística Descritiva
23%
Análises de Correlações
17%
Análises Multivariadas
12%
24
TABELA 2 – FERRAMENTAS ESTATÍSTICAS UTILIZADOS NOS ARTIGOS SELECIONADOS DA REVISTA BRASILEIRA DE ZOOLOGIA DE 2007
Ferramentas Repetições Freqüência por Trabalhos
ANOVA 8 40% Índice Diversidade Shannon 6 30% Qui-Quadrado 6 30% Índice de Morisita 6 30% Correlação Linear de Pearson 5 25% Similaridade Jaccard 4 20% Teste T-student 4 20% Método Jackknife 3 15% Teste de Tuckey 3 15% Analise de Componentes Principais (PCA) 2 10% Diversidade beta-2 2 10% Diversidade de Margalef 2 10% Diversidade de Simpson 2 10% Dominância de Berger-Parcker 2 10% Índice de Equitabilidade de Pielou 2 10% Regressão Múltipla Multivariada 2 10% Similaridade Qualitativa de Sorensen 2 10% Teste de Kolmogorov-Smirnov 2 10% Teste de Kruskal-Wallis 2 10% Teste de Mann-Whitney U 2 10% Analise de Agrupamento- UPGMA 2 10% Analise de Correspondência Canônica 2 10% Classificação Hierárquica Não-Ponderada 1 5% Coeficiente de Concordância de Kendall 1 5% Correção de Continuidade de Yates 1 5% Escalonamento Multidimensional (NMDS) 1 5% Estimativa de Kaplan-Meier 1 5% Índice “incidence-based coverage estimator” 1 5% Matriz de Similaridade no Dendrograma 1 5% Média de Willians 1 5% Método Student-Newman-Keuls 1 5% Regressão Linear 1 5% Regressão Linear Múltipla 1 5% Shapiro-Wilk 1 5% Similaridade Geral de Gower 1 5% Teste de Bartlell 1 5% Teste de Freedman 1 5% Teste de Levene 1 5% Teste de Mantel 1 5% Teste de Spearman 1 5%
25
5. CONSIDERAÇÕES FINAIS
A ferramenta estatística foi amplamente utilizada por mais da metade dos
artigos científicos avaliados (52,3%) em um ano de publicações cientificas da sub-
área Zoologia. Dentre os tratamentos matemáticos dos dados observados
destacaram-se as análises que comparam categorias temporais e espaciais (Análise
da Variância), os que testam a distribuição das observações através de categorias
(Índices de Ecológicos) e a Estatística Descritiva.
Nos 47,7% trabalhos restantes que não empregaram nenhum método
estatístico avaliou-se que os objetivos estão relacionados com a temática
Taxonomia, que trata de descrever/ordenar hierarquias zoológicas e compreender os
processos responsáveis pela geração dessas categorias, ou seja, trata-se de
trabalhos onde não há a necessidade do uso de ferramentas estatísticas, pois
avaliam características físicas dos objetos (dados) em questão e as descrevem.
Numa avaliação mais detalhada dos artigos que sempre utilizam métodos
estatísticos observou-se que esses em média, utilizam 2 tratamentos estatísticos,
numa escala de 1 a 8 ferramentas por artigo. Foi observado ainda nesses trabalhos
o emprego de 40 ferramentas estatísticas diferentes e uma tendência de que certas
análises são mais comumente utilizadas (análise de variância - ANOVA, índice de
diversidade de Shannon, teste Qui-Quadrado e o Índice de Morisita) do que outras.
Além disso, a necessidade do uso de análises preliminares e/ou
pressupostos matemáticos levaram a associação de algumas análises estatísticas o
que ocasionou elevados valores de freqüência. Esse fato pode demonstrar a
preocupação dos pesquisadores em validar seus resultados por mais de um método
de análise, visto que a maioria dos artigos observados trata-se de avaliações com
alto grau de confiança.
No presente estudo confirma-se que a utilização da Estatística na área de
Ciências Biológicas atende aos objetivos de grande parte dos estudos científicos que
tem por definição resumir, analisar e interpretar dados e deles extrair generalizações
sobre a natureza da realidade.
26
6. REFERÊNCIAS BIBLIOGRÁFICAS
6.1 LIVROS BEGON, M.; TOWNSEND, C. R.; HARPER, J. L. ECOLOGY: From Individuals to Ecosystems 4 ed. Malden: Blackwell Publishing Ltd, 2006. BEIGUELMAN, B. Curso Prático de Bioestatítica 5ed. Ribeirão Preto: FUNPEC, 2002. BÍBLIA. Português. Bíblia Sagrada. Reed. Versão de Antônio Pereira de Figueiredo. Rio de Janeiro: Encyclopaedia Britannica, 1974. CANGELOSI, V., Taylor, P., Rice, P. Basic Statistics a Real World Approach New York: West Publishing Co, 1976. CASTANHEIRA, N. P. Estatística Aplicada a Todos os Níveis 2ed. Curitiba: Ibpex, 2005. COSTA, S. F. Introdução ilustrada à estatística 2 ed. Harbra: São Paulo, 1992. GRAVETTER, F. J. e WALLNAU, L. B. Essential of Statistics for the behavioral sciences 2ed. St. Paul: West Publishing Company, 1995. GRIFFITH, A. SPSS® For Dummies® Indianapolis: Wiley Publishing, Inc., 2007. LAPPONI, J. C. Estatística usando Excel 5 e 7. São Paulo: Lapponi Treinamentos e Editora, 1997. LEVIN, J. Estatística Aplicada a Ciências Humanas São Paulo: Editora Harper & Row do Brasil, 1978. LUDWIG, J. A. e REYNOLDS, J. F. Statistical Ecology: A primer on methods and computing New York: John Wiley & Sons, Inc, 1988. McCLAVE, J. T. e DIETRICH II, F. H. Statistics 3 ed. New Jersey: Macmillan, 1985. SIEGEL, M. R. Estatística 2 ed. São Paulo: Mc Graw-Hill, 1985. SOKAL, R. R. e ROHLF, F. J. Biometry 3 ed. New York: W.H. Freeman and Company, 1995. TRIOLA, M. F. Introdução à Estatística 7 ed. Rio de Janeiro: LTC, 1999. ZAR, J. H. Biosatistical Analysis 3 ed. New Jersey: Prentice-Hall Inc., 1996.
27
6.2. PUBLICAÇÕES PERIÓDICAS GIRALDO, M. A.; D. Bosch; M. Madden; L. Usery; C. Kvien Landscape complexity and soil moisture variation in south Georgia, USA, for remote sensing applications Journal of Hydrology n.357 16p. 2008 PIRHAJI, L.; M. Kargar; A. Sheari; H. Poormohammadi; M. Sadeghi; H. Pezeshk; C. Eslahchi - The performances of the chi-square test and complexity measures for signal recognition in biological sequences Journal of Theoretical Biology n. 251 8p. 2008 6.3. DOCUMENTOS ELETRÔNICOS AYRES, M., AYRES-JR., M. BioEstat 2.0: Aplicações estatísticas nas áreas das ciências biológicas e médicas. Manaus, Sociedade Civil Mamirauá, MCT – CNPq 2007. GONÇALVES, C. A. Introdução à Bioestatística Brasília: UNB, 1998. Apostila Digitada. MELÃO JR, H. Estatística Robusta aplicada no Mercado. Disponível em: http://www.sigmasociety.com Acesso em: 02 fev. 2008 6.4. OBRAS CONSULTADAS ADAMS, D. O Restaurante no Fim do Universo 5 ed. Rio de Janeiro: Sextante, 2004 REVISTA BRASILEIRA DE ZOOLOGIA, Curitiba, 23 (1): 1-310, março 2006 REVISTA BRASILEIRA DE ZOOLOGIA, Curitiba, 23 (2): 311-591, junho 2006 REVISTA BRASILEIRA DE ZOOLOGIA, Curitiba, 23 (3): 593-900, setembro 2006 REVISTA BRASILEIRA DE ZOOLOGIA, Curitiba, 23 (4): 901-1289, dezembro 2006 REVISTA BRASILEIRA DE ZOOLOGIA, Curitiba, 24 (1): 1-263, março 2007 REVISTA BRASILEIRA DE ZOOLOGIA, Curitiba, 24 (2): 265-522, junho 2006 REVISTA BRASILEIRA DE ZOOLOGIA, Curitiba, 24 (3): 523-853, setembro 2006 REVISTA BRASILEIRA DE ZOOLOGIA, Curitiba, 24 (4): 855-1191, dezembro 2006 TREVISAN, N. A.; KEMPA, S.R.; GUTIERREZ, L. Manual de Normas Técnicas Para Elaboração do Trabalho de Conclusão de Curso – TCC Paranaguá: Faculdade Estadual de Filosofia, Ciências e Letras de Paranaguá, 2006. Apostila Digitada.
28
UNIVERSIDADE FEDERAL DO PARANÁ. Biblioteca Central. Normas para apresentação de documentos científicos. Curitiba, 2000. pt. 2: Teses, dissertações e trabalhos acadêmicos. UNIVERSIDADE FEDERAL DO PARANÁ. Biblioteca Central. Normas para apresentação de documentos científicos. Curitiba, 2000. pt. 6: Referências. UNIVERSIDADE FEDERAL DO PARANÁ. Biblioteca Central. Normas para apresentação de documentos científicos. Curitiba, 2000. pt. 8: Redação e Editoração.
29
ANEXO 1 – QUADRO 1 - ARTIGOS CIÊNTIFICOS PUBLICADOS NA RBZ/2007 ANÁLISADOS R
BZ
PAG
Titulo do Artigo Objetivo do Estudo Metodologia Amostral Ferramentas Estatísticas e Utilização
24-1
21
A malacofauna bentônica das represas do médio rio tiete e uma avaliação ecológica das espécies exóticas invasoras, Melanoides tubercalata (Muller) e Corbicula fluminea (Muller).
Composição das espécies Densidade Distribuição espacial Distribuição temporal em três diferentes represas
Cada represa tinham três transectos como seis amostras cada. Distribuídos de acordo como o gradiente de profundidade escalonado em intervalos de 2 a 4m. pH, condutividade elétrica, OD e temperatura, nitrogênio e fósforo total, granulometria e matéria orgânica.
1. Análise de Regressão Múltipla: correlação entre dados coletados
2. Análise da Variância Multivariada: comparação entre todos os dados coletados
3. Análise de Correspondência Canônica: comparação entre todos os dados coletados
24-1
52
Ecologia do forrageiro por Cyphomyrmex morschi em vegetação de restinga no sul do Brasil.
Matérias dos ninhos Variações sazonais no uso desses recursos Informações filogenéticas
Ninhos por estações, 10 minutos em cada, sempre de manha. Contagens de operarias que saíram e que voltaram e identificação do material trazido. Identificação do material foi feita em um herbário
1. Índice de Diversidade de Simpson: testar agregações por estações
2. Índice Morisita: comparação entre as estações e tempo
3. Teste T-student: testou os dados do índice de diversidade de Simpson
24-1
108
Diversidade de borboletas (Ledidoptera,Papilionoidea e Hesperioidea) em fragmentos de Floresta Estacional Decidual em Santa Maria, Rio Grande do Sul, Brasil.
Caracterizar a fauna de borboletas Listagens Riqueza Abundancia Diversidade Dominância Similaridade
Em três locais, amostragens bimestrais, esforço amostral de 3,5 horas-rede/local/ocasião ao longo das trilhas existentes, as borboletas visualizadas eram registradas em planilha ou capturadas. Foram analisados, numero de indivíduos, riqueza de espécies, freqüência relativa da espécie, numero de espécies exclusivas. Para a analise de abundancia
1. Índice de Diversidade de Shannon-Wiener: diversidade
2. Índice de Diversidade de Margalef: diversidade
3. Índice de Dominância de Simpson: diversidade
4. Índice de Dominância de Berger-Parker: diversidade
5. Índice de Morisita: similaridade dos índices de diversidade
6. Índice de Jaccard: similaridade dos índices de diversidade
24-1
121
Comunidade de aves no Parque Estadual da Fonte Grande, Vitória, Espírito Santo, Brasil.
Inventariar a comunidade de aves
Quinzenalmente, 450 horas de esforço amostral, visual, auditivo e captura. Freqüência de captura, freqüência de ocorrência, categorizar as espécies por sua ocorrência.
1. Riqueza Jackknife: diversidade 2. Teste T-student: testou os dados coletados 3. Qui - Quadrado: testar a diferentes
categorias
30
ANEXO 1 – QUADRO 1 - ARTIGOS CIÊNTIFICOS PUBLICADOS NA RBZ/2007 ANÁLISADOS (CONTINUAÇÃO)
RB
Z
PAG
Titulo do Artigo Objetivo do Estudo Metodologia Amostral Ferramentas Estatísticas e Utilização
24-1
157
Estrutura de populações de Rhodnius neglectus Lent e Psammolestes tertius Lent & Jurberg (Hemipter, Reduviidae) em ninhos de pássaros (Furnariidae) presentes na palmeira Mauritia flexuosa no Distrito Federal, Brasil
Analisar a infestação e estrutura etária da população, em quatro áreas e duas estações climáticas (seca e chuvosa).
Amostras em quatro veredas, palmeiras foram escaladas e coletadas todo material presente nas bainhas, ao todo 41 amostras, medido também a temperatura e umidade relativa do ar Indivíduos separados por sexo, foram analisados as fezes e a saliva pra observar a infecção com T. cruzi.
1. Qui - Quadrado: testar a diferentes categorias
2. ANOVA: detectar diferenças entre valores médios dos dados coletados
3. Teste T-student: comparação entre as médias
4. Teste de Mann-Whitney: comparação entre as médias
24-2
362
Análise comparativa da assembléia de aves em dois remanescentes florestais no interior do Estado de São Paulo, Brasil
Caracterizar a avifauna em dois fragmentos florestais, analisar e comparar a estrutura da comunidade por dados qualitativos, composição especifica e freqüência e analisar quantitativamente
Levantamento qualitativo, 10 visitas em cada área, cada visita tinha 8 horas. Levantamento quantitativo 100 pontos, por 10 minutos cada, utilizou-se trilhas já feitas
1. Índice de Diversidade Shannon-Wiener: diversidade
2. Índice de Similariedade de Sorensen: comparação entre locais
24-2
463
Distribuição espacial, sazonal e estrutura populacional do caranguejo Aratus pisonii (H. Milne Edwards) (Crustacea, Decapoda, Sesarmidae) do manguezal do Itacuruçá, Rio de Janeiro, Brasil
Avaliar a distribuição espaçial e sazonal bem como a estrutura populacional
Coletas mensais para a estrutura populacional, e sazonal sendo divididas em 0 45 e 90 metros Largura do cefalotórax, sexo,
1. Qui - Quadrado: testar a diferentes categorias
2. Teste T- student: comparação entre médias 3. ANOVA: detectar diferenças entre valores
médios dos dados coletados 4. Teste de Kolmogorov – Smirnov: verificam a
normalidade dos dados
31
ANEXO 1 – QUADRO 1 - ARTIGOS CIÊNTIFICOS PUBLICADOS NA RBZ/2007 ANÁLISADOS (CONTINUAÇÃO)
RB
Z
PAG
Titulo do Artigo Objetivo do Estudo Metodologia Amostral Ferramentas Estatísticas e Utilização
24-3
565
Variação temporal de larvas de Chironomidae (Diptera) no alto rio Paraguai (Cáceres, Mato Grosso, Brasil)
Avaliar a composição e estrutura das assembléias de Chironomidae e avaliar quais fatores abióticos influenciam a distribuição temporal
Coletas abióticas (ph, temperatura, condução elétrica, oxigênio dissolvido, transparência da água, profundidade, nitrogênio total, fósforo total, ortofosforo e sedimento) Coletas bióticas (sedimento foi triado)
1. Índice de Jackknife: Riqueza 2. PCA: testou as variáveis de tempo 3. Escalonamento Multidimensional não
métrico (NMDS): testou as densidades 4. Regressão múltipla multivariada: testou
todas as variáveis coletadas
24-3
635
Composição de espécies de Arctiidae (Insecta, Lepidóptera) em áreas de cerrado
Composição de espécies noturnas e analisar a relação entre o numero de fito fisionomias e a riqueza. Relação entre a diversidade beta e a distancia geométrica entre as áreas
Indivíduos, duas lâmpadas durante 30 minutos separados em 100 metros, foi visto o tipo de fisionomia (campo, cerrado sentido restrito, cerradão ou mata de galeria) e o estado de preservação da vegetação (pinus, gado ou retirada)
1. Índice de Jackknife: Riqueza 2. Regressão Linear: riqueza x forma 3. Teste de Mantel: diversidade x distancia 4. Diversidade Beta: diversidade 5. Classificação aglomerativa: diferenças
entre abundancia e forma
24-3
657
Diversidade biológica da comunidade de peixes no baixo rio das mortes, Mato Grosso, Brasil
Caracterizar a diversidade de peixes através da abundãncia de indivíduos, riqueza de espécies.
Capturas em seis trechos em períodos de seca e cheia
1. Índide de Diversidade de Shannon – Wiener: diversidade
2. Equitabilidade de Pielou: uniformidade dos dados de diversidade
24-4
873
Avifauna aquática do saco da fazenda (Itajaí, SC, Brasil): uma década de monitoramento
Abundância, riqueza e flutuações sazonais da comunidade de aves aquáticas por uma década
Mensalmente foram realizados 3 censos em um mesmo dia de jan/96 até dez/05. Identificação e contagem (foram classificados em três categorias por ocorrência, C D A)
1. Índide de Diversidade de Shannon – Wiener: diversidade
2. Equitabilidade de Pielou: uniformidade dos dados de diversidade ANOVA: detectar diferenças entre valores médios dos dados coletados
3. Teste Bartlell: homogeneidade da variância
4. Teste de Kolmorov-Smirnov: testou normalidade dos dados
5. Teste de Tuckey-Kramer: diferença entre as médias
32
ANEXO 1 – QUADRO 1 - ARTIGOS CIÊNTIFICOS PUBLICADOS NA RBZ/2007 ANÁLISADOS (CONTINUAÇÃO) R
BZ
PAG
Titulo do Artigo Objetivo do Estudo Metodologia Amostral Ferramentas Estatísticas e Utilização
24-4
1017
Condicionantes ambientais na distribuição e no período reprodutivo do Orthopristis ruber (Cuvier) (Teleostei, Haemulidae) na Baía de Sepetiba, Rio de Janeiro, Brasil
Carcaterizar a distribuição espaço-temporal desta espécie e o período reprodutivo, bem como avaliar possíveis associações com as variáveis ambientais
Arrasto de fundo com rede de portas, amostras triplicas em cada zona (interna, central e externa) em locais escolhidos aleatoriamente (30min). Temperatura, salinidade, transparência e profundidade alem dos dados pluviométricos.
1- ANOVA: detectar diferenças entre valores médios dos dados coletados
2- Teste de Tuckey: teste pressuposto ANOVA 3- Qui - Quadrado: testar a diferentes categorias 4- Correlação de Spearman: grau de relação entre
diferentes categorias de dados
24-4
1025
Riqueza e distribuição espaço-temporal de anuros em um remanescente de Floresta de Araucária no sudeste do Paraná
Riqueza de espécies, distribuição espacial e a ocorrência sazonal de adultos e girinos num fragmento de floresta
Foram realizadas 15 visitas mensais, com duração de quatro dias cada, no período de jan/02 e mar/03. Foram empregados 4 tipos de amostragem: levantamento da reprodução em seis corpos d’água / transecção por busca aural (som) / busca ativa (procura por 40 min por pessoa) e amostragem de girinos, realizada com puçá.
1- Regressão Linear Múltipla: detectar diferenças entre todas as variadas coletadas
2- Ìndice “incidence-based coverage estimator”: Estima a riqueza das espécies
3- Coeficiente de Afinidade de Jaccard: detectar diferenças entre local e o numero de espécies
4- Análise de Agrupamento pelo Método não Ponderada “UPGMA”: complementação das análises anteriores
5- Índice de Similaridade de Morisita: testa agregação dos locais
6- Matriz de Similaridade no Dendrograma: determina o erro 7- Mann – Whitney: diferenças entre as espécies 8- Teste de Kruskal – Wallis: diferenças entre
agrupamentos com mais de uma categoria
24-4
1063
Predação de ninhos de Trachemys dorbigni (Duméril & Bidron) (Testudines, Emydidae) no extremo sul do Brasil
Avaliar as taxas de predação dos ninhos, variações temporais destas taxas, identificar as espécies que atuam como predadoras dos ninhos e sua importância relativa e avaliar a influencia das dispersões dos ninhos sobre as taxas e o tempo até a predação.
Cinco expedições, com duração de cindo a 21 dias, totalizando 57 dias, todos os ninhos identificados foram marcados com estacas, alguns protegidos. O ninhos foram monitorados 3 vezes ao dia.
1- Qui - Quadrado: testar a diferentes categorias 2- Correção de Continuidade de Yates: compara as
proporções e taxas 3- Estimativa de Kaplan-Meier: relação do tempo e
ocorrências 4- Teste de Shapiro-Wilk: testa normalidade dos dados 5- ANOVA: detectar diferenças entre valores médios dos
dados coletados 6- Teste de Kruskal – Wallis: diferenças entre
agrupamentos com mais de uma categoria 7- Teste de Student – Newman – Keuls: comparação entre
tempo e ocorrência 8- Correlação de Spearman: grau de relação entre
diferentes categorias de dados 9- Correlação Linear de Pearson: correlação entre variáveis 10- Índice de Similaridade de Morisita: testa agregação dos
locais
33
ANEXO 1 – QUADRO 1 - ARTIGOS CIÊNTIFICOS PUBLICADOS NA RBZ/2007 ANÁLISADOS (CONTINUAÇÃO) R
BZ
PAG
Titulo do Artigo Objetivo do Estudo Metodologia Amostral Ferramentas Estatísticas e Utilização
24-4
1087
Composição e abundancia relativa dos mamíferos de médio e grande porte no Parque Estadual do Turvo, Rio Grande do Sul, Brasil
Analisar a composição da comunidade de mamíferos de médio e grande porte e obter dados sobre a abundancia relativa dessas espécies através da aplicação de diferentes métodos.
Armadilhas fotográficas, transectos de pegadas, visualizações,
1- ANOVA: detectar diferenças entre valores médios dos dados coletados
2- Índice de Similaridade de Morisita: testa agregação dos locais
3- Coeficiente de Afinidade de Jaccard: detectar diferenças entre local e o numero de espécies
25-1
10
Análise comparativa da alimentação de peixes (Teleostei) entre ambientes de marisma e de manguezal num estuário do sul do Brasil (Baía de Guaratuba, Paraná)
Analisar comparativamente a composição da dieta de peixes entre dois microhabitats de um estuário
Coletas bimestralmente entre ab/99 e fev/00 divididos em local 1 e local 2 (cabeceira e próximo ao mar), em cada local foram feitas 3 arrastos Foi também mesurado temperatura, salinidade e ph
1- Índice de Similaridade Geral de Gower: testar a diferença entre categorias
2- Qui - Quadrado: testar a diferença entre categorias 3- Análise de Agrupamento pelo Método não Ponderada
“UPGMA”: complementação das análises anteriores
25-1
40
Diversidade de Culicidae durante os periodos crepusculares em bioma de Floresta Atlantica e paridade de Anopheles cruzii (Diptera: Culicidae)
Avaliar a diversidade da fauna de culicidae, durante os períodos crepusculares, buscando associar a variação de abundancia das especies com os fatores climáticos, bem como obter parâmetros populacionais relacionados a paridade
Quinzenalmente, durante os períodos vespertinos e matutinos,
1- Media de Willians: relação entre variáveis 2- Índice de Similaridade Qualitativa de Sorensen: similaridade
entre períodos 3- Índice de Similaridade de Morisita: testa agregação dos
locais 4- Índice de Dominância de Berger – Parcker: relação entre
variáveis e o tempo 5- Índice de Diversidade de Margalef: Riqueza 6- Teste de Levene: diferença entre a abundancia em tempos
diferentes 7- ANOVA: detectar diferenças entre valores médios dos
dados coletados 8- Teste de Tuckey: teste posterior ao ANOVA, 9- Correlação Linear de Pearson: correlação entre variáveis
34
ANEXO 1 – QUADRO 1 - ARTIGOS CIÊNTIFICOS PUBLICADOS NA RBZ/2007 ANÁLISADOS (CONTINUAÇÃO)
RB
Z
PAG
Titulo do Artigo Objetivo do Estudo Metodologia Amostral Ferramentas Estatísticas e Utilização
25-1
49
Efeitos da sucessão florestal sobre a anurofauna (Amphibia: Anura) da Reserva Catuaba e seu entorno, Acre, Amazônia sul-ocidental
Verificar a abundância, riqueza e composição da anurofauna em ambientes de diferentes estágios sucessionais de cronoseqüência de uma floresta do Acre e seu entorno
12 parcelas
1- Correlação Linear de Pearson: correlação entre variáveis
2- Coeficiente de Concordância de Kendall: correlação entre riqueza e variáveis temporais
3- Coeficiente de Afinidade de Jaccard: detectar diferenças entre local e o numero de espécies
4- Análise de Agrupamento pelo Método não Ponderada “UPGMA”: complementação das análises anteriores
23-4
901
Distribuição e abundancia dos carangueijos Uca Leach (Crustacea, Decapoda, Ocypodidae) na Baía de Guaratuba, Paraná, Brasil
Propõe um estudo descritivo da ocorrência e da abundância das populações de Uca em solos localizados num gradiente de salinidade da água dentro da referida baia.
Fatores abióticos foram coletados mensalmente,luminosidade, temperatura do ar, e do solo (5,10,15,20) e a salinidade de água e também as condições climáticas E a coleta de material biológico
1- Teste de Freedman: significância na diferença das variáveis
23-4
1101
Influência da urbanização sobre as assembléias de peixes em três córregos de Maringá, Paraná
Avaliar os padrões espaciais na composição, estrutura e distribuição das assembléias ícitias e relacionar estes padrões com características físicas e químicas do ambiente em três córregos urbanos
1- Índice de Diversidade Shannon: diversidade 2- Índice de Diversidade Beta-2: diversidade entre as
categorias 3- Análise de correspondência com remoção do efeito arco
DCA: determinar os padrões das categorias 4- Análises de Componentes Principais PCA: relação entre
variáveis coletadas 5- Correlação Linear de Pearson: correlação entre
variáveis
35
APÊNDICE 1 – VALORES DE DISTRIBUIÇÃO DE QUI QUADRADO
GL\P 0,99 0,95 0,90 0,80 0,70 0,50 0,30 0,20 0,l0 0,05 0,02 0,0l 0,00l
0l ,0002 0,004 0,0l6 0,064 0,l48 0,455 l,074 l,642 2,706 3,84l 5,4l2 6,635 l0,827
02 0,020 0 l03 0,2ll 0,446 0,7l3 1,386 2,408 3,219 4,605 5,991 7,824 9,210 13,815
03 0,115 0,352 0,584 1,005 1,424 2,366 3,665 4,642 6,251 7,815 9,837 11,345 16,266
04 0,297 0,711 1,064 1,649 2,195 3,357 4,878 5,989 7,779 9,488 11,668 13,277 18,467
05 0,554 1,145 1,610 2,343 3,000 4,351 6,064 7,289 9,236 11,070 13,388 15,080 20,515
06 0,872 1,635 2,204 3,070 3,828 5,348 7,231 8,558 10,645 12,592 15,033 16,812 22,457
07 1,239 2,167 2,833 3,822 4,671 6,346 8,383 9,803 12,017 14,067 16,622 18,475 24,322
08 1,646 2,733 3,490 4,594 5,527 7,344 9,524 11,030 13,362 15,507 18,168 20,090 26,125
09 2,088 3,325 4,168 5,380 6,393 8,343 10,656 12,242 14,684 16,919 19,679 21,666 27,877
10 2,558 3,940 4,865 6,179 7,267 9,342 11,781 13,442 15,987 18,307 21,161 23,209 29,588
11 3,053 4,575 5,578 6,989 8,l48 l0,34l l2,899 l4,63l l7,275 l9,675 22,6l8 24,725 3l,264
l2 3,57l 5,226 6,304 7,807 9,034 ll,340 l4,0ll l5,8l2 l8,549 2l,026 24,054 26,2l7 32,909
13 4,l07 5,892 7,042 8,634 9,926 l2,340 l5,ll9 l6,985 l9,8l2 22,362 25,472 27,688 34,528
14 4,660 6,571 7,790 9,467 l0,821 l3,339 l6,222 l8,l5l 21,064 23,685 26,873 29,l4l 36,123
15 5,229 7,26l 8,547 l0,307 ll,721 l4,339 l7,322 l9,311 22,307 24,996 28,259 30,578 37,697
16 5,812 7,692 9,312 ll,l52 l2,624 l5,338 l8,4l8 20,465 23,542 26,296 29,633 32,000 39,252
17 6,408 8,672 l0,085 l2,002 l3,531 l6,338 l9,511 21,615 24,769 27,587 30 995 33,409 40,790
18 7,0l5 9,390 l0,865 l2,857 l4,440 l7,338 20,60l 22,760 25,989 28,869 32,346 34,805 42,312 19 7,633 l0,ll7 ll,651 l3,7l6 l5,532 l8,338 21,689 23,900 27,204 30,l44 33,687 36,l9l 43,820 20 8,260 l0,85l l2,443 l4,572 l6,266 l9,337 22,775 25,038 28,4l2 31,4l0 35,020 37,566 45,315
Adaptado de Beiguelman, 2002
36
APÊNDICE 2 - VALORES DE F (AO NÍVEL DE 5 %) – ANÁLISE DE VARIÂNCIA
GL 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞ 1 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 243,9 245,9 248,0 249,1 250,1 251,1 252,2 253,3 254,3 2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,45 19,45 19,46 19,47 19,48 19,49 19,50 3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,70 8,66 8,64 8,62 8,59 8,57 8,55 8,53 4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,86 5,80 5,77 5,75 5,72 5,69 5,66 5,63 5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,62 4,56 4,53 4,50 4,46 4,43 4,40 4,36 6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,94 3,87 3,84 3,81 3,77 3,74 3,70 3,67 7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,51 3,44 3,41 3,38 3,34 3,30 3,27 3,23 8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,22 3,15 3,12 3,08 3,04 3,01 2,97 2,93 9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,01 2,94 2,90 2,86 2,83 2,79 2,75 2,71 10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,85 2,77 2,74 2,70 2,66 2,62 2,58 2,54 11 4,84 3,98 2,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,79 2,72 2,65 2,61 2,57 2,53 2,49 2,45 2,40 12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,62 2,54 2,51 2,47 2,43 2,38 2,34 2,30 13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,53 2,46 2,42 2,38 2,34 2,30 2,25 2,21 14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,46 2,39 2,35 2,31 2,27 2,22 2,18 2,13 15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,40 2,23 2,29 2,25 2,20 2,16 2,11 2,07 16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,35 2,28 2,24 2,19 2,15 2,11 2,06 2,01 17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,38 2,31 2,23 2,19 2,15 2,10 2,06 2,01 1,96 18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,27 2,19 2,15 2,11 2,06 2,02 1,97 1,92 19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,31 2,23 2,16 2,11 2,07 2,03 1,98 1,93 1,88 20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20 2,12 2,08 2,04 1,99 1,95 1,90 1,84 21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,25 2,18 2,10 2,05 2,01 1,96 1,92 1,87 1,81 22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,23 2,15 2,07 2,03 1,98 1,94 1,89 1,84 1,78 23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,20 2,13 2,05 2,01 1,96 1,91 1,86 1,81 1,76 24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,18 2,11 2,03 1,98 1,94 1,89 1,84 1,79 1,73 25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,16 2,09 2,01 1,96 1,92 1,87 1,82 1,77 1,71 26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,15 2,07 1,99 1,95 1,90 1,85 1,80 1,75 1,69 27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,13 2,06 1,97 1,93 1,88 1,84 1,79 1,73 1,67 28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,12 2,04 1,96 1,91 1,87 1,82 1,77 1,71 1,65 29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,10 2,03 1,94 1,90 1,85 1,81 1,75 1,70 1,64 30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2,01 1,93 1,89 1,84 1,79 1,74 1,68 1,62 40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,00 1,92 1,84 1,79 1,74 1,69 1,64 1,58 1,51 60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,92 1,84 1,75 1,70 1,65 1,59 1,53 1,47 1,39 120 3,92 3.07 2,68 2,45 2,29 2,17 2,09 2,02 1,96 1,91 1,83 1,75 1,66 1,61 1,55 1,50 1,43 1,35 1,25 ∞ 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,75 1,67 1,57 1,52 1,46 1,39 1,32 1,22 1,00
Adaptado de Beiguelman, 2002
37