análise de variância (anova)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 ·...
TRANSCRIPT
![Page 1: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/1.jpg)
Análise de variância (ANOVA)Universidade Estadual de Santa Cruz
Ivan Bezerra Allaman
![Page 2: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/2.jpg)
CRONOGRAMA
1. História
2. Concepção da ideia
3. Formalização da ideia e o surgimento da distribuição F
4. Hipóteses e Organizando as ideias em uma tabela
5. Pressupostos
6. Exemplos
2/35
![Page 3: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/3.jpg)
História
![Page 4: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/4.jpg)
A análise de variância foi proposta pelo gênio Ronald Aylmer Fisher.·
4/35
![Page 5: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/5.jpg)
O primeiro relato da técnica foi em 1923.·
5/35
![Page 6: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/6.jpg)
A anova revolucionou a ciência do século XX e ainda continua soberana.
Um pouco diferente de como a conhecemos hoje, eis a primeira tabela da anova.
·
·
6/35
![Page 7: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/7.jpg)
Concepção da ideia
![Page 8: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/8.jpg)
Você consegue distinguir as causas devariabilidade entre os animais?
8/35
![Page 9: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/9.jpg)
Basicamente, é possível distinguirmos as seguintes variabilidades:·
9/35
![Page 10: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/10.jpg)
No entanto, como podemos julgar se as duas linhagens da figura anterior diferen quantoa uma determinada característica quantitativa?
Quando pensamos em comparar grupos quanto a características quantitativas nos vemà mente a média. Mas então qual é a relação entre a variabilidade exposta na figuraanterior com a média? De que maneira isto nos levará a conclusão de que os grupos(linhagens no nosso exemplo) são diferentes?
Vamos tentar chegar na resposta manipulando a simulação abaixo.
·
·
·
10/35
![Page 11: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/11.jpg)
Formalização da ideia e o surgimento dadistribuição F
![Page 12: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/12.jpg)
Formalização da ideia
Vimos na ferramenta virtual que para detectarmos diferenças médias entre váriosgrupos, teríamos que contrastar a variabilidade existente entre os grupos com avariabilidade dentro dos grupos.
·
12/35
![Page 13: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/13.jpg)
Como a variância é uma técnica que visa avaliar a distância média entre um valorobservado com a tendência central, Fisher vislumbrou em tal técnica um meio paracomparar se mais de dois grupos eram em média distintos ou não.
Então Fisher pensou: "A variância entre os grupos de fato me fornece uma medida doquanto as médias estão distantes entre si, pois avalia a soma dos desvios quadráticosem relação a uma média geral entre os grupos".
Logo Fisher concluiu: "Deste modo, basta avaliar a razão entre a variabilidade entre osgrupos e a variabilidade dentro dos grupos (do acaso). Se a variabilidade do acasosuperar a variabilidade entre os grupos, há uma grande chance dos grupos pertencerema uma mesma população".
·
·
·
13/35
![Page 14: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/14.jpg)
Fisher partiu da hipótese de que todos os tratamentos (grupos) eram provenientes deuma mesma população com distribuição normal de probabilidade com média evariância . Com isto em mente, enchergou como determinar as variabilidades entre edentro de tratamentos.
·μ
σ2
14/35
![Page 15: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/15.jpg)
15/35
![Page 16: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/16.jpg)
Surgimento da distribuição F
Tal chance (probabilidade) foi descrita formalmente por Fisher como distribuição deprobabilidade em 1924 em um congresso de matemática em Toronto,e publicado comoanais. Naquela ocasião, Fisher apresentou a estatística Z com a seguinte expressão:
·
z = ln12
s1
s2
Em 1932, Mahalanobis tabulou os quantis da razão entre as duas variâncias daquantidade anterior para 1% e 5%.
Em 1934, Snedecor citou a razão entre duas variâncias como a estatística F.
·
·
16/35
![Page 17: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/17.jpg)
Nota: se refere aos graus de liberdade associado a variância 1 e o graus de liberdadeassociado a variância 2.
Logo, a razão entre as duas variâncias deu origem a distribuição F de Snedecor, sendo Fem homenagem ao Fisher.
·
F =/gs2
1 l1
/gs22 l2
gl1 gl2
17/35
![Page 18: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/18.jpg)
Modelo estatístico, Hipóteses eOrganizando as ideias em uma tabela
![Page 19: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/19.jpg)
Modelo estatístico
em que:
Podemos representar os efeitos sobre uma variável resposta da seguinte forma:·
= μ + +yij τi εij
= é a observação da repetição j no tratamento i;
= é a média geral associada a todas as observações;
= é o efeito do tratamento i;
= é o erro associado a observação da repetição j no tratamento i;
· yij
· μ
· τi
tal efeito é medido como a substração da média do tratamento i pela média geral ().
-− μxi
· εij
19/35
![Page 20: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/20.jpg)
Hipóteses em uma ANOVA
com .
Como o interesse é comparar médias de grupos, as hipóteses são formuladas daseguinte maneira:
·
H0
H1
:
:
= = ⋯ =μ1 μ2 μk
≠μi μj
i ≠ j
20/35
![Page 21: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/21.jpg)
Organizando as ideias em uma tabela
A soma de quadrados total é particionado em dois: uma parte devido a fonte de variaçãoconhecida e a outra parte a fonte de variação desconhecida.
Matematicamente tem-se a seguinte relação da soma de quadrados:
·
·
SQtotal
( −∑i
∑j
yij y ..)2
=
=
S + SQentre Qdentro
( − + ( −∑i
ni y i. y ..)2 ∑
i
∑j
yij y i.)2
21/35
![Page 22: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/22.jpg)
Fontes de Variação Graus de Liberdade Soma de Quadrados Quadrado Médio F calculado
Entre k - 1
Dentro N - k
Total N - 1
Agora podemos organizar os cálculos na seguinte tabela:·
SQentre Q = S /glMentre QentreQMentre
QMdentro
SQdentro Q = S /glMdentro Qdentro
SQtotal
22/35
![Page 23: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/23.jpg)
Pressupostos
![Page 24: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/24.jpg)
O protocolo
São basicamente três os pressupostos que devem ser seguidos para que a análise devariância seja válida:
O erros são estimados a partir do modelo estatístico como:
·
Os erros devem ser independentes e identicamente distribuídos.
Os erros devem ter distribuição normal com média 0 e variância .
Os erros devem ser homocedásticos, ou seja, a dispersão dos erros deve sersemelhante entre os tratamentos. Isto é equivalente ao dizer que a variância dostratamentos deve ser semelhante entre si.
-
- σ2
-
·
= −εij yij (μ + )τi
y ij
24/35
![Page 25: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/25.jpg)
Avaliando a normalidade
No assunto regressão linear simples na disciplina de Nivelamento em estatísca, foiministrado com detalhes como fazer tal avaliação de modo manual e utilizando osoftware r. Portanto, tal cálculo será feito utilizando diretamente a função do software r.
·
25/35
![Page 26: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/26.jpg)
Exemplos do qqplot.·
26/35
![Page 27: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/27.jpg)
Avaliando a homocedasticidade
Também foi ministrado com detalhes no assunto de regressão linear simples nadisciplina de Nivelamento em estatísca.
·
27/35
![Page 28: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/28.jpg)
Quando há dúvidas quanto a homocedasticidade de variância dos tratamentos,podemos lançar mão do teste F-máximo de Hartley. Tal teste avalia a razão entre avariância máxima de um dado tratamento e a variância mínima de outro tratamento. Talrazão é testada por meio da estatística F com graus de liberdade no numerador edenominador iguais ao número de repetições menos 1 (r-1).
Portanto tem-se a seguinte estatística F.
·
·
=Fmáximo
/(r − 1)S2máximo
/(r − 1)S2mínimo
28/35
![Page 29: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/29.jpg)
Aplicação
1. Quatro linhagens de galinhas (A,B,C e D) foramcruzadas para obter outras quatro linhagens AB,AC, BC e BD. O peso dos ovos (g) das linhagenscruzadas seguem abaixo. Podemos afirmar que aslinhagens se diferem significativamente quantoao peso médio dos ovos? Considere uma .
AB AC BC BD
58 59 56 59
51 62 57 55
56 64 56 50
52 60 55 64
54 62 54 57
α = 0.03
29/35
![Page 30: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/30.jpg)
As hipóteses a serem testadas são:
Vamos determinar a soma de quadrados entre edentro de tratamentos.
: = = =H0 μAB μAC μBC μBD
: ≠ , com i ≠ jHa μi μj
SQentre
+(57 − 57.05 })2
SQdentro
=
=
=
=
5 ⋅ {(54.2 − 57.05 + (61.4 − 57.05 + ⋯ +)2 )2
145, 75
(58 − 54.2 + (51 − 54.2 + ⋯ + (57 − 57)2 )2 )2
159, 2
30/35
![Page 31: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/31.jpg)
Fontes deVariação
Graus deLiberdade
Soma deQuadrados
Quadrado Médio Fcalculado
Entre 4 - 1
Dentro 20 - 4
Total 20 - 1
Segue então a tabela da análise de variância.·
145, 75 Q = 145, 75/3Mentre = 4, 8848,58
9,95
159, 2 Q = 159, 2/16Mdentro
304, 95
Calculando o p-valor tem-se:·
pf(4.88, 3, 16, lower. tail = FALSE) = 0, 0135.
Logo, considerando o nível de significânciaadotado na pesquisa, rejeita-se H0 com 97% deconfiança.
·
31/35
![Page 32: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/32.jpg)
2. Considerando a aplicação 1, verifique se ospressupostos da análise de variância sãoválidos.
As médias dos tratamentos foram: AB = 54,2; AC =61,4; BC = 55,6; BD = 57.
A média geral foi de 57,05.
Logo o erro estimado da observação 1 notratamento 1 foi:
Os demais erros são estimados seguindo o mesmoraciocínio anterior.
= 58 − (57, 05 + (54, 2 − 57, 05)) = 3, 8ε 11
32/35
![Page 33: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/33.jpg)
Vamos verificar primeiro a normalidade doserros, por meio do gráfico qqplot e verificar seos pontos estão próximos da reta ao longo doeixo x.
Podemos concluir que o erro tem distribuiçãonormal.
33/35
![Page 34: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/34.jpg)
Para avaliar a homocedasticidade, basta elaborarum gráfico do erro em função dos valoresestimados.
Parece que há uma discrepância significativa entre a dispersão dos
erros de dois tratamentos. Nestes casos em que há dúvidas, podemos
lançar mão de um teste inferencial como o teste F-máximo de Hartley.
34/35
![Page 35: Análise de variância (ANOVA)nbcgib.uesc.br/.../est_experimental/intro_anova.pdf · 2018-08-17 · A anova revolucionou a ciência do século XX e ainda continua soberana. Um pouco](https://reader034.vdocuments.net/reader034/viewer/2022042022/5e790d1b1b016958c36db152/html5/thumbnails/35.jpg)
A variância dos tratamentos foram:
AB AC BC BD
8.2 3.8 1.3 26.5Calculando o F-máximo de Hartley tem-se:
Tem-se 5 repetições. Logo o graus de liberdade éigual a 4. Portanto, calculando o p-valor tem-se:
Logo, adotando um rejeita-se , ouseja, as variâncias são heterocedástica.
F-máximo = = 20, 3826, 5
1, 3
pf(20.38, 4, 4, lower.tail=FALSE) = 0.00636
α = 0, 01 H0
35/35