estatistica
DESCRIPTION
Seminário de estatisticaTRANSCRIPT
![Page 1: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/1.jpg)
Comparação de médias para mais de duas populações
ANÁLISE DE VARIÂNCIA
![Page 2: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/2.jpg)
• Conhecemos os testes de hipóteses para a média/proporção de uma população, para a diferença entre médias/proporções de duas populações e para a comparação de variâncias de duas populações.
• Agora, o procedimento de teste de hipóteses será utilizado para comparar as médias de mais de duas populações.
• A análise de variância ou ANOVA é um teste de hipóteses para médias de mais de duas populações.
![Page 3: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/3.jpg)
Aplicações:
– Comparar a eficiência de diversas marcas de remédios para o tratamento de uma mesma doença.
– Comparar o consumo em km/litro de um modelo de carro abastecido com combustíveis do mesmo tipo, porém de marcas diferentes.
– Comparar a eficiência de uma lavoura tratada com diferentes fertilizantes.
– Comparar o tempo de reação de uma pessoa em função do estímulo de luz de quatro cores diferentes.
![Page 4: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/4.jpg)
Exemplo:
Amostra 1 Amostra 2 Amostra 35 7 86 9 65 7 104 6 11
6 910
![Page 5: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/5.jpg)
Amostra 3Amostra 2Amostra 1
12
10
8
6
4
2
Dado
sBoxplot
![Page 6: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/6.jpg)
• A diferença entre as três médias é apenas conseqüência da variação amostral?
• A diferença entre as médias das amostras é conseqüência da variação amostral ou é uma evidência da diferença entre as médias das populações?
![Page 7: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/7.jpg)
• A variabilidade total das amostras pode ser dividida em duas partes:
– Variabilidade devido ao fato de que as populações são diferentes, denominada variabilidade entre (entre as populações).
• Quanto maior for a variabilidade entre, mais forte é a evidência de que as médias das populações são diferentes.
– Variabilidade devido à diferenças dentro de cada amostra, denominada variabilidade dentro.
• Quanto maior for a variabilidade dentro, maior será a dificuldade para concluir que as médias das populações são diferentes.
![Page 8: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/8.jpg)
• As populações têm a mesma variância.
• As amostras são retiradas de populações com distribuição normal.
• As amostras são independentes.
Exigências da Anova
![Page 9: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/9.jpg)
- O teste de hipóteses para comparação de k amostras é estabelecida da seguinte forma:
H1: Nem todas as populações têm a mesma média.
- A distribuição F conduzirá a decisão de aceitar o rejeitar a hipótese nula, comparando o valor da estatística de teste F
com o valor F tabelado correspondente ao nível de significância adotado.
kH ...: 210
2
2
d
e
ss
dentroVariância
entreVariânciaF
![Page 10: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/10.jpg)
• F grande (maior que o valor tabelado) indica que Variância entre > Variância dentro.
• Logo F grande é evidência contra a hipótese nula. Logo, se F > F tabelado rejeitamos a hipótese nula.
• F pequeno (menor que o valor tabelado) indica que Variância entre < Variância dentro.
• Logo F pequeno evidência a favor da hipótese nula. Logo, se F ≤ F tabelado não rejeitamos a hipótese nula.
![Page 11: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/11.jpg)
knSQD
kn
sns
TT
j
k
jj
d
2
12
)1(
nj: tamanho da j-ésima amostra.
k: número de amostras. s2
j: variância da j-ésima amostra.
nT: número total de dados.
SQD: Soma de Quadrados Dentro
Variância dentro
![Page 12: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/12.jpg)
11
)( 2
12
kSQE
k
xxns
j
k
jj
e
Variância entre
EntreQuadradosdeSomaSQE
amostraésimajdatamanhon
amostrasdenúmerok
geralmédiax
jgrupodomédiax
j
j
:
:
:
:
:
![Page 13: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/13.jpg)
Estatística F
QMDQME
nSQDkSQE
ss
dentroVariânciaentreVariância
FTd
e
1/
1/2
2
QME: Quadrado Médio EntreQMD: Quadrado Médio Dentro
![Page 14: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/14.jpg)
knSQT
kn
xxs
TT
i
n
iT
T
2
12)(
TotalQuadradosdeSomaSQT
dadosdetotalnúmeron
geralmédiax
T
:
:
:
Variância total
SQESQDxxSQT i
n
i
T
2
1
)(
![Page 15: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/15.jpg)
Fonte gl SQ QM F
Entre k-1 SQE QME=SQE/(k-1) QMEQMD
Dentro nT-k SQD QMD=SQD/(nT-1)
Total nT-1 SQT
Tabela de Análise de Variância (ANOVA)
![Page 16: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/16.jpg)
Exemplo:
Amostra 1 Amostra 2 Amostra 35 7 86 9 65 7 104 6 11
6 910
![Page 17: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/17.jpg)
Medida Amostra 1 Amostra 2 Amostra 3
Média 5 7 9
Variância 0,67 1,500 3,2
n 4 5 6
Resultados:
27,7315 xknT
![Page 18: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/18.jpg)
Fonte gl SQ QM F
Entre 2 38,93 38,93/2=19,47 19,47/2=9,73
Dentro 12 24,00 24,00/12=2,00
Total 14 62,93
Tabela de Análise de Variância (ANOVA)
![Page 19: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/19.jpg)
- F = 9,73 indica que a variação entre as amostras é 9 vezes maior que a variação dentro das amostras.
- Adotando 5% de significância:F tabelado com 2 gl no numerador e 12 gl no denominador F tabelado = 3,885
- F = 9,73 > F tabelado = 3,885.
- Conclusão: rejeitamos a hipótese nula ao nível de 5% de significância, ou seja, nem todas as populações tem a mesma média.
![Page 20: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/20.jpg)
- valor-p = P(F > 9,73) = 0,003
- Para α=0,05 (5% de significância): rejeitamos a hipótese nula.
- Para α=0,01 (1% de significância): rejeitamos a hipótese nula.
![Page 21: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/21.jpg)
Exercício
A anemia é uma doença que afeta muitas pessoas e que pode ter diversas origens. Pretendendo-se avaliar possíveis diferenças entre diferentes tratamentos para esta doença, planejou-se uma experiênciacom 120 indivíduos anêmicos, divididos aleatoriamente em três gruposde 40, aos quais se atribuiu cada um dos tratamentos.
O primeiro tratamento era constituído apenas por uma dieta rica emferro. O segundo tratamento combinava um suplemento de ferro com adieta do primeiro tratamento e o último acrescentava um complexo vitamínico. No sentido de avaliar possíveis diferenças entre os tratamentos, efetuou-se uma ANOVA com base nos valores de hemoglobina dos 120 indivíduos após um período de 3 meses de tratamento.
![Page 22: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/22.jpg)
a) Estabeleça as hipóteses de interesse.
b) Construa a tabela ANOVA sabendo que
SQD=121,4 SQT=122,9
c) Qual a conclusão ao nível de 5% de significância?
![Page 23: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/23.jpg)
Exercício
Um estudo foi realizado para verificar se o consumo médio de ummodelo de carro abastecido com combustíveis de marcas diferentesera o mesmo ou não.
30 carros foram abastecidos com o combustível da marca A, 50 carros com o combustível da marca B, 20 carros com o combustível da marca C e 37 carros com o combustível da marca D. O consumo foi medido em km por litro.
Os dados estão representados no boxplot abaixo.
![Page 24: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/24.jpg)
DCBA
15,0
12,5
10,0
7,5
5,0
Cons
umo
(km
por
litro
)Boxplot
![Page 25: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/25.jpg)
a) Estabeleça as hipóteses de interesse.
b) Construa a tabela ANOVA sabendo que
SQD=384,2 SQE=34,7
c) Qual a conclusão ao nível de 5% de significância?
d) O valor-p para este teste é 0,009. Qual a conclusão ao nível de 1% de significância?
![Page 26: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/26.jpg)
• Suponha que através da Anova para comparação de k médias concluímos que a hipótese nula deve ser rejeitada ao nível alfa de significância, ou seja, concluímos que nem todas as populações têm a mesma média.
• Neste caso devemos usar um dos testes de Comparações Múltiplas para identificar qual ou quais grupos tem médias diferentes das demais.
• Testes de Comparações Múltiplas: teste de Tukey e teste de Scheffé.
Comparações Múltiplas
![Page 27: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/27.jpg)
O teste consiste em calcular um valor (Dcrít), acima do qual, a diferença entre duas médias amostrais (em módulo) é significativamente diferente de zero.
Teste de Tukey
Utilizado quando se deseja comparar todos os pares de médias de k populações, adotando-se um único nível de confiança.
H0 :H1:
0i j 0i j i j
ji
knkcrit nn
QMDq
D T 112
,
onde representa o valor tabelado (da distribuição da amplitude
studentizada – “studentized range”) associado ao nível de significância
adotado.
knk Tq ,
![Page 28: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/28.jpg)
nT -k
k
Distribuição da Amplitude Studentizada
05,0, tabknvkr qqPT
![Page 29: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/29.jpg)
A B C D
12 14 19 24
18 12 17 30
13 21 Total
Total 30 39 57 54 180
Média 15 13 19 27 18
n 2 3 3 2 10
Exemplo: comparação de 4 médias
![Page 30: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/30.jpg)
Fonte de Variação SQ Graus de
Liberdade QM F Valor - p
Entre 258
Dentro 46
Total 304
ANOVA (Análise de Variância)
9
6
3
7,67
86 11,2 0,0072
Conclusão: rejeito H0 a 5%, ou seja, pelo menos uma média édiferente das demais.
![Page 31: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/31.jpg)
jijicrit
jiji
knkcrit
nnnnq
D
nnq
nnQMD
qD T
1167,7290,41167,7
2
1167,72
112
05,0
6,4
410,4,
Médias
B=13 A=15 C=19 D=27
![Page 32: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/32.jpg)
Comparando médias de B e A:
critDD
Conclusão: não rejeito a hipótese nula de igualdade de médias entre B e A.
13151927
iX
15 13 2D 4,90 1 17,67 8,76
3 22crítD
![Page 33: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/33.jpg)
Comparando médias de B e C:
critDD
Conclusão: não rejeito a hipótese nula de igualdade de médias entre B e C.
13151927
iX
19 13 6D 4,90 1 17,67 7,833 32crítD
![Page 34: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/34.jpg)
Comparando médias de B e D:
critDD
Conclusão: rejeito a hipótese nula de igualdade de médias entre B e D.
13151927
iX
27 13 14D 4,90 1 17,67 8,763 22crítD
![Page 35: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/35.jpg)
Comparando médias de A e C:
critDD
Conclusão: não rejeito a hipótese nula de igualdade de médias entre A e C.
13151927
iX
19 15 4D 83,731
3167,7
290,4
critD
![Page 36: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/36.jpg)
Comparando médias de A e D:
critDD
Conclusão: rejeito a hipótese nula de igualdade de médias entre A e D.
13151927
iX
27 15 12D 4,90 1 17,67 9,602 22crítD
![Page 37: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/37.jpg)
Comparando médias de C e D:
critDD
Conclusão: não rejeito a hipótese nula de igualdade de médias entre C e D.
13151927
iX
27 19 8D 4,90 1 17,67 8,763 22crítD
![Page 38: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/38.jpg)
ResultadoTeste de Tukey
B A C D
![Page 39: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/39.jpg)
Neste teste a hipótese nula é rejeitada se
Teste de Scheffé
H0 :H1:
0i j 0i j i j
critji
ji Dnn
QMDFkxx 11)1(
onde F é o valor tabelado da distribuição F com (k-1) graus de liberdade no
numerador e (nT-k) graus de liberdade no denominador para o nível de
significância adotado.
![Page 40: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/40.jpg)
A B C D
12 14 19 24
18 12 17 30
13 21 Total
Total 30 39 57 54 180
Média 15 13 19 27 18
n 2 3 3 2 10
Exemplo: comparação de 4 médias
![Page 41: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/41.jpg)
Fonte de Variação SQ Graus de
Liberdade QM F Valor - p
Entre 258
Dentro 46
Total 304
ANOVA (Análise de Variância)
9
6
3
7,67
86 11,2 0,0072
Conclusão: rejeito H0 a 5%, ou seja, pelo menos uma média édiferente das demais.
![Page 42: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/42.jpg)
Médias
B=13 A=15 C=19 D=27
jicrit
jijicrit
nnD
nnnnQMDFkD
1146,10
1167,7757,4)14(11)1(
05,0
![Page 43: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/43.jpg)
Comparando médias de B e A:
critDD
Conclusão: não rejeito a hipótese nula de igualdade de médias entre B e A.
13151927
iX
15 13 2D 55,931
2146,10 critD
![Page 44: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/44.jpg)
Comparando médias de B e C:
critDD
Conclusão: não rejeito a hipótese nula de igualdade de médias entre B e C.
13151927
iX
19 13 6D 54,831
3146,10 critD
![Page 45: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/45.jpg)
Comparando médias de B e D:
critDD
Conclusão: rejeito a hipótese nula de igualdade de médias entre B e D.
13151927
iX
27 13 14D 55,931
2146,10 critD
![Page 46: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/46.jpg)
Comparando médias de A e C:
critDD
Conclusão: não rejeito a hipótese nula de igualdade de médias entre A e C.
13151927
iX
19 15 4D 55,931
2146,10 critD
![Page 47: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/47.jpg)
Comparando médias de A e D:
critDD
Conclusão: rejeito a hipótese nula de igualdade de médias entre A e D.
13151927
iX
27 15 12D 46,1021
2146,10 critD
![Page 48: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/48.jpg)
Comparando médias de C e D:
critDD
Conclusão: não rejeito a hipótese nula de igualdade de médias entre C e D.
13151927
iX
27 19 8D 55,931
2146,10 critD
![Page 49: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/49.jpg)
ResultadoTeste de Scheffé
B A C D
![Page 50: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/50.jpg)
Tukey vs. Scheffé
• Quando as amostras têm tamanhos iguais o teste de Tukey é mais adequado do que o teste de Scheffé.
• Para amostras com tamanhos diferentes, a probabilidade do erro tipo I no teste de Tukey (α) é na verdade um pouco menor que o valor especificado. Consequentemente, o poder do teste também é um pouco menor.
)(1
)()(
)()(
00
00
00
falsaHHrejeitarPPoder
falsaHHrejeitarnaoPIItipoerroP
verdadeiraHHrejeitarPItipoerroP
![Page 51: ESTATISTICA](https://reader035.vdocuments.net/reader035/viewer/2022070508/577c80561a28abe054a83fdd/html5/thumbnails/51.jpg)
• Teste de Duncan
• Teste de Dunnett O teste de Dunnett serve para comparações múltiplas onde apenas
um tratamento serve de referência, quer dizer, deseja-se comparar todos os tratamentos com apenas um. O tratamento de referência pode ser por exemplo o tratamento padrão, não havendo interesse na comparação dos demais tratamentos entre si.
Outros testes para Comparações Múltiplas