Inferência Estatística: decidindo na presença de incerteza
Universidade Federal de Minas GeraisInstituto de Ciências ExatasDepartamento de Estatística
Princípios de Bioestatística
Aula 8 :
Intervalos de Confiança para Média e Proporção
Distribuição t-Student
A distribuição t-Student aproxima-se da distribuição Normal Padrão à medida que seus graus de liberdade, k, crescem.
Tabela t
(continua…)
(… continuação)
Tabela t
879.0]10;20.0[ =t 812.1]10;05.0[ =t 753.1]15;05.0[ =t
Distribuição t-Student
A distribuição t-Student é simétrica em torno de 0 .
É por isso que somente os percentis positivos são tabelados.
812.1]05.0;10[
=t
812.1]05.0;10[]95.0;10[
−=−= tt
Inferência Estatística
Parâmetros:média (µ)
desvio-padrão (σ)proporção (θ)
AMOSTRA
Estatísticas:média ( )
desvio-padrão (s) x
Conjunto de métodos de análise estatística que permitem tirar conclusões sobre uma população com base em
somente uma parte dela, a amostra .
POPULAÇÃO
desvio-padrão (s) proporção (p)
Tipos de Inferência Estatística
Inferência sobre
Estimação de(de µ ou θ)
Intervalo de Confiança
Inferência sobre os parâmetros
(µ ou θ)
Teste de Hipóteses (sobre µ ou θ)
Teste de Hipóteses
Estimação
Exemplo: de posse de uma amostra de 1000 eleitores de um Estado, deseja-se estimar a proporção de eleitores desse Estado que votarão no candidato Fulano.
O valor dessa proporção na população(θ) é desconhecido.Este parâmetro pode ser estimado de duas formas:Este parâmetro pode ser estimado de duas formas:
somente um valor é dado como estimativa para θ. Exemplo : proporção amostral de eleitores de
Fulano, p=0.60.
Estimação pontual :
Estimação intervalar :
um intervalo de valores é dado como estimativa para θ. Exemplo : [ p margem de erro ] = [0.60 0.03]
= [0.57 ; 0.63].± ±
Estimação Intervalar
Estimativa Intervalar
= Estimativa pontual ±±±± Margem de Erro
Exemplo:
Em uma amostra de 40 alunos da UFMG, encontrou-se umaEm uma amostra de 40 alunos da UFMG, encontrou-se umarenda familiar média de 1600 reais (estimativa pontual ),com desvio-padrão de 323 reais .
A margem de erro foi calculada em 104 reais .
Assim, a estimativa intervalar para a renda familiar média doaluno da UFMG é de
[1600 ±±±± 104] = [1496 ; 1704] reais.
EXEMPLO: estimar µ, a média da renda familiar dos alunos que ingressaram na UFMG este ano
Experimento :
1. Cada um de vocês tem acesso a uma amostra de 100 calouros;
2. Cada um calcula a estimativa pontual em sua amostra;
3. Os valores de irão variar de amostra para amostra:
x
x
Alguns valores de serão próximos a µ, outros não….x
Nível de Confiança de uma Estimativa Intervalar
A estimativa intervalar é associada a um nível de confiança(geralmente expresso em porcentagem).
Ex: nível de confiança de 95%.
Chamamos a Estimativa Intervalar de Intervalo de Confiança .
Ex: o intervalo de 95% de confiança para a renda familiar médiaEx: o intervalo de 95% de confiança para a renda familiar médiado aluno da UFMG vai de R$1496 a R$1704.
Interpretação:
Temos uma confiança de 95% de que o valor desconhecido da renda familiar média do aluno
da UFMG está entre R$1496 a R$1704.
O que entendemos por confiança ?
EXEMPLO: estimar µ, a renda média familiar dos alunos que ingressaram na UFMG este ano
Experimento :
1. Cada um de vocês tem acesso a uma amostra de 100 calouros;
intervalo de 95% de confiança 2. Cada um construirá um intervalo de 95% de confiança utilizando os dados da sua amostra.
Resultado esperado :
Intervalos de confiança com limites e comprimentos diferentes.
Cerca de 95% dos intervalos construídos por vocês irão conter o valor desconhecido de µ.
Interpretação do Nível de Confiança na Estimação In tervalar
95% dos IC95% construídos de diferentes amostras de mesmo tamanho contêmo valor desconhecido de µ.
Intervalo de Confiança para uma Média µµµµ
margem de erro
estimativa da variabilidade de entre amostras de tamanho n
x
percentil da distribuição t-Student com (n -1) g.l. que deixa acima dele uma probabilidade igual a α/2
/ 2;( 1)ntα −
α/2
estimativa
pontual de µ
tamanho nnível de confiança
Exemplo : Estimação da idade média ao falar
Em uma amostra de n=20 crianças, a idade média ao falar foi de= 10 meses, com desvio-padrão de s =1,5 meses.x
( 1; /2) (19; /2)100(1 )% . 10n
sIC x t t
nα α
αµ −
− = ± = ±
( 1; /2) (19; /2) .1.5
. 1020
IC x t tα α = ± = ±
[ ]100(1 )%
nα−
= ± ]20
10 .0.335
[ ](19; /2)100(1 )% 10 .0.335IC t α
αµ
−
= ±
�Intervalo de 90% de confiança: 100(1-α)%=90%1-α = 0.90 → α = 0.10 → α/2 = 0.05 → t(19;0,05) = 1.729
[ ] [[ ]
90% 10 1.729 0.335 10 0,6 10 0.6;10 0.69.4;10.6
IC
ICµ = ± ⋅ = ± = − +
=[ ] [ ]10 1.729 0.335 10 0,6 10 0.6;10 0.6= ± ⋅ = ± = − +[
[ ]90% 9.4;10.6ICµ = “A idade média ao falar para esta populaçãode crianças é estimada entre 9.4 e 10.6meses, com 90% de confiança.”
�Intervalo de 95% de confiança: 100(1-α)%=95%1-α = 0.95 → α = 0.05 → α/2 = 0.025 → t(19;0,025) = 2.093
[ ] [ ] [ ][ ]
95% 10 2.093 0.335 10 0.7 10 0.7;10 0.7ICµ = ± ⋅ = ± = − += [ ]95% 9.3;10.7ICµ = “A idade média ao falar para esta população
de crianças é estimada entre 9.3 e 10.7meses, com 95% de confiança.”
Como reduzir a margem de erro (e o comprimento do IC )?
Reduzir o nível de confiança
Escolher uma população com menor
variabilidade
100(1 )% . 10s
IC x t tα− = ± = ±
Aumentar o tamanho da
amostra
[ ]( 1; /2) (19; /2)
100(1 )%
100(1 )%
. 10n
sIC x t t
nα α
αµ
α
−−
−
= ± = ±
= ±
Cálculo do Tamanho da Amostra para IC
nst me n ⋅= −
−)2/;1(
)%1(100α
αµ
Cálcular o tamanho da amostra (n) Cálcular o tamanho da amostra (n) tal que a margem de erro seja igual
ao valor especificado pelo pesquisador.
Exemplo: Em uma amostra de 40 alunos da UFMG, encontrou-se uma renda familiar média de 1600 reais, com d.p. de 323 reais.
A margem de erro com 95% de confiança na estimação da
média de renda na população de alunos (µ), é dada por:
reais. 104071.51)042.2(40
323)(]025.0;39[
%95 =⋅=⋅= tmeµ
Suponha que se deseja que a margem de erro caia para 50 reais.Suponha que se deseja que a margem de erro caia para 50 reais.Para quanto deveria ser aumentado o tamanho da amostra?
? reais 50323
]025.0;1[ =⇒=⋅− nn
nt
nntme
323]025.0;1[
%95 ⋅= −µ
Intervalo de Confiança para uma Proporção θθθθmargem de erro
estimativa da variabilidade de p entre amostras de tamanho n
nível de
Válido somente quando n > 30 (amostras grandes)
e 0.2<θ<0.8.
percentil da distribuição Normal Padrão que deixa acima dele probabilidade igual a α/2
estimativa pontual
de θ
nível de confiança
Exemplo: Deseja-se estimar:
θθθθ = proporção de pessoas curadas com o novo tratamento.
Estimativa Pontual: a proporção amostral p = 40/50 = 0.8
50 pessoas receberam o novo tratamento e 40 foram curadas.
Estimativa Intervalar:
90% de confiança: 100(1-α)%=90%
Com base nesta amostra, estimamos que a proporção de cura como novo tratamento está entre 70% e 90%, com 90% de confiança.
90% de confiança: 100(1-α)%=90%1-α = 0.90 → α = 0.10 → α/2 = 0.05 → zαααα/2 = z0,05 =1.64
[ ] [ ] [ ].9.0 ; 7.01.08.0 )06.0)(64.1(8.050
)2.0(8.0)64.1(8.0%90 =±=±=
±=θIC
Cálculo do Tamanho da Amostra para IC
nz me pp )1(
)2/()%1(100 −⋅=−
αα
θ
Para um valor de margem de erro (d) especificado pelo pesquisador,
o tamanho da amostra deve ser:
][ )1(2
]2/[pp
dz
n −⋅
= α
o tamanho da amostra deve ser:
máximo=0.25 quando p=0.50
4
1 ][
22
]2/[]2/[)1( ⋅
=⇒⋅
= −
d
zn
d
zn pp
αα
Para 95% de confiança: 1-α=0.95 � zαααα/2 = z0,025 =1.96 ≈ 2
12122
]2/[ ⋅=⇒⋅
=z α
4
12
4
1]2/[ ⋅
=⇒⋅
=
dn
d
zn α
2222dn
1=