Download - Livro Estatistica II
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 3
Capitulo1: TEORIA DE AMOSTRAGEM
Introduo A teoria de amostragem dedica-se ao desenvolvimento, anlise e melhoramento dos mtodos de
recolha de informao necessria num inqurito, a seleco da amostra, a obteno de
informao da amostra, na traduo da informao em afirmaes relacionadas com os
objectivos do inqurito e na avaliao dessas afirmaes.
O problema da inferncia Indutiva do ponto de vista de estatstica, encarado da seguinte
forma: A finalidade da investigao descobrir algo sobre determina caracterstica da
populao ou universo. Por isso importante definir alguns conceitos fundamentais na teoria da
amostragem.
1.1 Alguns Conceitos Importantes na Teoria de Amostragem
1.1.2 Populao ou universo
Conjunto de unidades bem definidas com caractersticas comuns, no tempo e no espao. A
unidade bsica de uma populao denomina-se elemento da populao.
Para definir uma populao, ns temos que estar em condies de determinar o tipo de
elementos que a constitui e indicar as regras de incluso ou excluso um elemento particular.
Exemplos:
1. Pases produtores de ouro.
2. O nmero de habitantes dum determinado pas, ou cidade.
1. O nmero de desempregados dum pas, duma provncia, num determinado perodo de tempo,
etc.
1.1.2 Amostra um sub-conjunto do universo ou populao. A obteno de informao
sobre parte de uma populao denomina-se Amostragem.
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 4
Em geral, o investigador est interessado em certa(s) caracterstica(s) especfica(s) da populao
em estudo. Define-se ento uma certa varivel X que representar a caracterstica que se
pretende avaliar.
A varivel X poder designar: O nmero de filhos por famlia; O rendimento mensal dos
agregados familiares moambicanos ou de algumas provncias, ou distritos de interesse
econmico:
Plano de Amostragem constitudo por todas as etapas necessrias para seleccionar uma
amostra depois da definio da populao.
1.1.3 Tipos de variveis: As variveis podem ser: Discretas ou Contnuas
Variveis Discretas
So no numricas
So normalmente codificadas;
Variveis Contnuas: Podem ser:
Discretas Neste caso assumem somente um e um s valor . Exemplo: Nmero de filhos
Contnuas - Medidas com mais detalhes, ou sejam tomam um valor num certo intervalo, por
exemplo a altura duma pessoa, o peso, etc.
Mtodos de Amostragem Amostragem Aleatria Simples
Amostragem Estratificada
Amostragem por Conglomerados
Amostragem por Estgios Mltiplos
Fontes de Erro em levantamentos por Amostragem
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 5
Amostragem Aleatria Simples Tambm conhecida por amostragem casual, randnica, acidental etc. Consiste basicamente em
atribuir a cada elemento do universo um nmero nico para, depois, seleccionar alguns desses
elementos de maneira casual.
Este procedimento, embora seja o que mais se ajusta aos princpios da teoria das
probabilidades, nem sempre o de mais fcil aplicao, sobretudo porque se exige que se
atribua a cada elemento da populao um nico nmero. Alm disso, despreza o conhecimento
prvio da populao que por ventura o pesquisador pode ter.
Amostragem Sistemtica
uma variao da amostragem aleatria simples. A sua aplicao requer que a populao seja
ordenada de tal modo que cada um de seus elementos possa ser unicamente identificado pela
posio. Apresentam condies para satisfao desse requisito uma populao identificada a
partir de uma lista que englobe todos os seus elementos, uma fila de pessoas ou um conjunto de
candidatos a um concurso identificado pela ficha de inscrio.
Amostragem Estratificada
Caracteriza-se pela seleco de uma amostra de cada subgrupo da populao considerada.
O fundamento para delimitar os subgrupos ou estratos pode ser encontrados em propriedades
como sexo, idade ou classe social. Muitas vezes essas propriedades so combinadas, o que
exige uma matriz de classificao. Por exemplo quando se compara homem e mulher com
"maior de 18 anos" e menor de 18 anos" resultam quatros extractos: homem menor de 18 anos,
mulher menor de 18 anos, homem maior de 18 anos, mulher maior de 18 anos.
A amostragem estratificada pode ser proporcional ou no-proporcional.
No primeiro caso, selecciona-se de cada grupo uma amostra aleatria que seja proporcional
extenso de cada subgrupo determinada por alguma propriedade tida como relevante. Este
tipo de amostragem tem como principal vantagem o fato de assegurar representatividade em
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 6
relao s propriedades adoptadas como critrios para estratificao.
No caso da amostragem estratificada no-proporcional, a extenso da amostra dos vrios
estratos no proporcional extenso desses estratos em relao ao universo. H situaes em
que esse procedimento o mais adequado, particularmente naqueles em que se tem interesse na
comparao entre os vrios estratos.
Amostragem por Conglomerados
So indicadas em situaes em que bastante difcil a identificao de seus elementos. o caso,
por exemplo, de pesquisa cuja populao seja constituda por todos os habitantes de uma
cidade. Em casos desse tipo possvel proceder-se seleco da amostra a partir de
"conglomerados".(quarteires, organizaes, edifcios, fazendas, etc.)
Amostragem Por Cotas
Este tipo de amostragem muito utilizado em pesquisas eleitorais e de mercado, tendo como
principal vantagem o seu baixo custo. De modo geral desenvolvida em trs fases :
1 Classificao da populao em funo de propiedades tidas como relevantes para o
fenmeno a ser estudado.
2 Determinao da proporo da populao a ser colocada em cada classe com base na
constituio conhecida ou presumida da populao.
3 Fixao de cotas para cada entrevistador encarregado de seleccionar elementos da
populao a ser pesquisada de modo tal que a amostra total seja composta em observncia
proporo das classes consideradas.
Amostragem por Estgios Mltiplos Esta estratgia de amostragem pode ser vista como uma combinao de dois ou mais planos
amostrais. Considere por exemplo uma populao estratificada onde o nmero de estratos
muito grande. Ao invs de sortear uma amostra de cada estrato, o que poderia ser invivel
devido quantidade de estratos, o pesquisador poderia optar por sortear alguns estratos e em
seguida seleccionar uma amostra de cada estrato sorteado. Neste caso, teramos uma
amostragem em dois estgios usando, nas duas vezes, a amostragem aleatria simples, sendo
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 7
que no primeiro estgio as unidades amostrais so os estratos e no segundo so as componentes
da populao.
Nota: Nos levantamentos por Amostragem usam-se os Questionrios. Este tpico sera tratado
mais tarde no curso.
2. ESTIMAO DE PARMETROS
Nesta seco introduziremos alguns conceitos aplicados na rea de inferncia Estatstica que
sero dados nos captulos seguintes. A inferncia estatstica inclui assim trs grandes tipos de
aplicao:
1. Estimao pontual;
2. Estimao por intervalos;
3. Testes de Hipteses;
2.1 Estimao Pontual O objectivo da estimao por pontos usar toda a informao disponvel a partir da amostra,
para produzir um valor que melhor valor que se pode adiantar para um certo parmetro da
populao ou universo.
Um estimador para certo parmetro designa-se genericamente por e
uma estatstica, ou seja, uma varivel aleatria funo duma amostra.
Como resultado, obtm-se uma aproximao concreta ao valor do parmetro que lhe est
associado. Esta designa-se por estimativa e denota-se, usualmente por: .
Portanto, um estimador uma frmula, funo de variveis observveis a partir da amostra,
que no pode envolver valores desconhecidos. Para um mesmo parmetro (desconhecido)
possvel propor estimadores alternativos. Cada estimador uma varivel aleatria que
fornece infinitas estimativas, uma para cada concretizao da amostra aleatria.
Uma estimativa um valor concreto, resultante do estimador.
),...,,( 21 nXXX
*
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 8
Exemplo:
Para estimar o parmetro (mdia da populao) duma populao normal poder-se-ia
utilizar, entre outros estimadores, o estimador:
ou seja a mdia amostral.
2.2 Propriedades dos estimadores A preciso de qualquer estimativa feita da amostra depende do mtodo atravs do qual a
estimativa calculada e do plano de amostragem.
As principais propriedades dos estimadores em pequenas amostras so:
1. No enviesamento (no viciamento);
2. Eficincia;
3. Suficincia.
2.2.1 No Enviesamento Um estimador diz-se no enviesado (no viciado) se o valor mdio da estimativa (valor
esperado), para todas as amostras possveis do tamanho n, for exactamente igual ao valor real
da populao ou seja se para o parmetro se tem .
Exemplos:
A mdia amostral e a varincia amostral so exemplos de estimadores no viciados j
que demonstra que:
.
n
xX
i
][E
X 2s
22 ][
][
sE
XE
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 9
2.2.2 Eficincia
Um estimador diz-se eficiente, de dentro da classe dos estimadores no viciado ou centrados
tiver a menor varincia. Assim, dados dois estimadores 1 e 2 ambos no viciados, 1 ser mais
eficiente que 2 , se )()( 21 VarVar .
Exemplo:
De entre os estimadores para a mdia da populao normal, pode se demonstrar que X um
estimador eficiente; pois:
][][
][
VarXVar
XE , Onde designa qualquer outro estimador no viciado para .
2.2.3 Suficincia
O estimador diz-se suficiente, se utiliza toda a informao disponvel na amostra, relevante
para estimao de
Exemplo: Os estimadores Mo e Me so estimadores suficientes para a mdia duma populao
normal .
2.3. Amostragem Aleatria Simples
Inquritos por amostragem envolvem a escolha de amostras duma populao que contem um
nmero finito N de unidades. Se essas unidades podem ser distinguidas uma da outra, o nmero
de amostras diferentes de tamanho n que podem ser formadas a partir de N unidades, 1qual
a:
!!!
nNn
N
n
N
Exemplo: Se uma populao contm 5 unidades, representadas por A, B, C, D e E,
respectivamente, existem 10 amostras diferentes de tamanho 3, que so.
.
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 10
ABC ABD ABE ACD ACE
ADE BCD BCE BDE CDE
Neste exemplo, podemos notar que:
No h letras repetidas na mesma amostra;
A ordem das letras no tem importncia;
E as seis amostras ABC, ACB, BAC, BCA, CAB e CBA so consideradas de forma idntica.
2.3.1 Amostragem aleatria simples
um mtodo de seleco de n unidades a partir de N atravs do qual, cada uma das
n
N
amostras tm igual chance (probabilidade) de serem escolhidas. Este tipo de amostragem
tambm conhecido pelo nome de amostragem aleatria sem restries.
Na prtica, a amostra aleatria simples seleccionada unidade por unidade. As unidades na
populao so enumeradas de 1 at N. E depois, uma srie de nmeros aleatrios entre 1 e N,
da tabela dos nmeros aleatrios, so lidos em sequncia at se atingir o nmero n, o tamanho
da amostra. As unidades que tomarem os nmeros lidos da tabela constituiro a amostra.
Em cada etapa da escolha, este processo d aos nmeros a mesma chance de serem escolhidos.
Se o nmero escolhido no devolvido para a lista, pois isso daria a possibilidade de a mesma
unidade entrar na amostra mais do que uma vez, na prtica no se repete. Por essa razo este
tipo de amostragem se d o nome de amostragem sem reposio.
Desta forma, ao usarmos a tabela dos nmeros aleatrio, o nmero que j foi escolhido
anteriormente ignorado.
Muitas vezes, no plausvel o uso deste tipo de amostragem preferindo-se outros tipos de
amostragem, por razes de convenincia ou mesmo aumento de preciso.
2.3.2. Definies Bsicas e Notaes Ao seleccionarmos uma amostra ns estamos interessados em certas propriedades que ns
pretendemos medir ou registar para cada unidade que entra na amostra. Estas propriedades
so denominadas de caractersticas ou mais simplesmente itemes.
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 11
Assim:
Os valores obtidos para cada item nas N unidades que compem a populao so
representados por: y1, y2, y3,..., yN .
E os valores correspondentes na amostra por: y1, y2, y3, ..., yn ou simplismente yi (i =1, 2, ...,n)
Exemplos sobre caractersticas:
Populao Algumas caractersticas
Todas as pessoas moradoras
duma cidade
Peso mdio;
Rendimento Total;
Percentagem de rendimento gasto em comida;
Nmero de mulheres;
Distribuio do rendimento total entre as famlias
por tamanho de rendimento;
Portanto, caracterstica da populao no tem que ser obrigatoriamente numrica. Caracterstica
tudo aquilo que nos possa interessar saber sobre a populao em estudo.
Usam-se letras maisculas para representar as caractersticas da populao e as minsculas para
representar as da amostra: Para os totais e as mdias, temos as seguintes definies:
Populao Amostra
Total: N
N
i
i yyyyY
...211
n
n
i
i yyyy
...211
Mdia
N
y
N
yyyY
N
i
i
N
121
...
n
y
n
yyyy
n
i
i
n
121
...
Embora a amostragem seja realizada para diferentes objectivos, geralmente o interesse centras
em quatro caractersticas da populao, nomeadamente:
1. A mdia = Y , por exemplo, o nmero mdio de crianas por escola;
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 12
2. O total = Y, Por exemplo, o nmero total de moradores dum distrito;
3. A razo entre dois totais ou duas mdias
X
You
X
YR ;
4. A proporo de unidades que pertencem a uma certa classe ou categoria. Por exemplo a
proporo de habitantes do sexo Feminino, a proporo de estudantes dispensados, etc.
O Simbolo ^ usado para indicar a estimativa duma caracterstica da populao obtida atravs
da amostra. Nesta seco ns somente consideraremos as estimativas mais simples:
Estimativa (estimante)
Media da populao Y yY mdia da amostra
Total da populao Y
n
y
NyNY
n
i
i 1
Razo da populao R
n
i
i
n
i
i
x
y
x
yR
1
1
Em Y o factor n
N a que se multiplica o total da amostra chamado de factor de expanso, ou
factor de inflao. O seu inverso N
n, a razo entre o tamanho da amostra e o tamanho da
populao, chamado de fraco de amostragem e representado por f.
2.3.3 Propriedades dos Estimadores Para Amostragem Aleatria Simples (AAS) Para investigar se y ou no viciado, para amostragem Aleatria Simples ns calculamos o
valor de y para todas as
n
N amostras e depois achamos a mdias das estimativas. O
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 13
Smbolo E denota, mdia de todas possveis amostras, ou seja o valor esperados das mdias
amostrais
Teorema 3.1:
A mdia amostral y um estimador no viciado de Y , isto : YXE ][
Demonstrao: Por definio
n
yyy
N
nNn
nNn
Nn
yyy
n
N
yyE
n
n
)...(
!
)!(!
)!(!
!
)...(
21
21
(3.1)
Onde o somatrio se estende para todas as
n
N amostras. Para calcular esta soma, ns
determinamos em quantas amostras um dado valor especfico iy aparece. Dado que existem
outras (N-1) unidades para o resto da amostra e (n-1) lugares para preencher na amostra, o
nmero de amostras contendo iy :
)!()!1(
)!1(
1
1
nNn
N
n
N
Consequentemente,
)...(
)!()!1(
)!1()...( 2121 Nn yyy
nNn
Nyyy
De (a) teremos
YN
yyy
yyynN
nNn
nNn
nNyE
N
N
)...(
)...(!
)!_(!
)!()!1(
)!(
21
21
Corolrio 3.1:
yNY um estimador no viciado do total da populao Y. (3.2)
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 14
2.3.4 As Varincias dos Estimadores
A varincia de iy numa populao finita geralmente definida como:
N
YyN
i
i
1
2
2
)(
(3.4)
Agora vamos considerar a varincia de y a mdia amotral, considerada para todas as
n
N mostras possveis, ou seja 2YyE .
Teorema 3.2: A varincia da mdia amostral para Amostragem Aleatria Simples igual a:
fn
S
n
nN
n
SYyEyV
1
222
(3.5)
Onde N
nf a fraco amostral.
Corolrio 3.2: O erro padro para y
fn
SNnN
n
Sy
1/ (3.6)
Corolrio 3.3: A varincia de yNY , como estimador do total da populao Y, na
amostragem Aleatria Simples dada pela frmula:
fn
SN
N
nN
n
SNYYEYV
1
)()()(
22222
(3.7)
Corolrio 3.4: O Erro padro para a estimativa do o total da populao Y igual a:
fn
NSNnN
n
NSY
1/)( (3.8)
2.3.5 O Factor de Correco da Populao Finita
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 15
Sabemos que para qualquer populao infinita, para uma amostra de tamanho a varincia
da mdia amostral igual a:
n
yV2
Quando a populao finita, introduz-se o factor N
nN )( para a varincia e o factor
N
nN )( para o desvio padro.
Esses factores do-se o nome de factores de correlao da populao finita. Na pratica, o
factor de correco pode ser ignorado sempre que ele no exceder 5% e para muitas
aplicaes mesmo quando for superior a 10%. O efeito da ignorncia do factor da
correco super estima o erro padro do estimador y .
2.3.6 Clculo do Erro Padro a Partir da Amostra
Para Amostragem Aleatria Simples tem lugar o seguinte Teorema.
Teorema 3.3: Para a Amostragem Aleatria Simples (AAS)
)1(
)(1
2
2
n
yy
s
n
i
i
um estimador no viciado para
1
)(1
2
2
N
Yy
S
N
i
i
Nota: Ns tivemos um resultado idntico para populao infinita, onde provamos que
22 ][ SE . A nica diferena que na demonstrao entra o factor de correco.
Corolrio 3.5: Os estimadores no viciados das varincias da mdia amostral y e do total
da populao yNY so:
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 16
fn
s
N
nN
n
ssyv
s
y
1)(
22
(3.9)
e,
fn
sN
N
nN
n
sNsYv
s
Y
1)(
2222 (3.10)
Respectivamente.
Para os erros padro toma-se.
fs
ss
y 1 e f
n
Nss
Y 1 (3.11)
Nota: Esses estimadores so ligeiramente enviesados (viciados). Para muitas aplicaes o
enviesamento no importante.
2.3.7 Intervalos de Confiana
Os intervalos de confiana para a mdia e para o estimador do total so dados por:
a) Para Mdia, tem-se:
fn
tsyY 1 (3.12)
b) Para o Total:
fn
tNsyNY 1
(3.13)
O smbolo t o valor do desvio da mdia na distribuio Normal e depende do intervalo de
confiana desejado ( ou da probabilidade de confiana desejada)
Os valore mais comuns no:
Intervalo de confiana (%) 50 80 90 95 99
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 17
Valor de t corresponte 0.67 1.28 1.64 1.96 2.58
NOTA: Se o tamanho da amostra for menor do que 60, os pontos percentuais acima referidos
so tirados da tabela de distribuio t de Student com (n-1) graus de liberdade, graus
liberdades usados no calcula da varincia 2s .
Exerccio:
Numa localidade com 250 Famlias (Agregados familiares), fez-se um levantamento por
amostragem com o objectivo de determinar o nmero de crianas com idades compreendias
entre 0 e 14 anos na aldeia independentemente de quem so os pais. Decidiu-se trabalhar com
uma amostra de 80 famlias (AF). A tabela abaixo indica os resultados do inqurito.
# filhos yi 2 3 5 6 7 8
Fi 13 19 15 20 10 3
Com base nesse dados estimar:
a) o nmero mdio de crianas por agregado Familiar;
b) o nmero total de crianas existentes nessa aldeia;
c) o intervalo de confiana da mdia e do da estimativa do total.
Estimao de um ndice (duma Razo)
Frequentemente, a quantidade que deve ser estimada, atravs de uma amostra aleatria
simples, uma relao entre duas variveis, as quais variam de unidade para unidade. Em
inquritos aos agregados familiares, so exemplos disso o nmero de casacos por homem adulto,
a mdia das despesas com cosmticos por mulher adulta, o nmero mdio de horas semanais
passadas assistindo televiso por crianas de idade entre 10 e 15 anos, etc. A fim de estimar a
primeira dessas quantidades, registaramos, para os i agregados familiares ( i = 1, 2, ..., n),o
nmero de homens adultos que a vivem xi e o nmero de mudas de roupa que eles possussem yi.
O parmetro da populao a ser estimado o ndice
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 18
N
i
i
N
i
i
x
y
adultosensdetotalNumero
casadetotalNumeroR
1
1
hom
cos
o estimativa da amostra correspondente :
x
y
x
y
Rn
i
i
n
i
i
1
1 (3.14)
Exemplos dessa natureza ocorrem, frequentemente, quando a unidade de amostragem (no caso
do AF) e o nosso interesse est no valor mdio da populao por elemento. Os ndices tambm
aparecem em muitas outras aplicaes, como, por exemplo, o ndice de emprstimos para
construes imobilirias no total de emprstimos de um banco, ou o ndice de acres plantadas
com trigo, no total dos acres cultivados de uma fazenda.
Teorema 3.4:
Se as variveis iy e ix so medidas em cada unidade de uma amostra aleatria simples de
tamanho n, que se presume grande, a varincia da razo xyR / , aproximadamente igual
a:
1
)(1
2
2
N
Rxy
Xn
fRVar
ii
(3.15)
Onde
X
YR o ndice dos valores mdios da populao e
N
nf .
Demonstrao:
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 19
x
xRyR
x
yRR
(3.16)
X
xRyRR
0 X
XRY
X
xRyERRE
Visto que X
YR . Isto mostra que a ordem de aproximao usada, ou seja R um estimador
no viciado de R .
De (3.16), ns obtemos o seguinte resultado
2
2)(
1)()( xRyE
XRRERVar
A quantidade xRy a mdia amostral da varivel iii Rxyd , cuja mdia populacional
.0 XRYD
Assim, podemos calcular ][RVar aplicando o teorema (2.2) a varincia da mdia da
Amostragem Aleatria Simples.
Como estimativa amostral de
1
)(1
2
N
RxyN
i
ii
comum tomar-se
1
)( 2
1
n
xRy i
n
i
i
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 20
E para o estimador do erro padro para R o seguinte:
1
)(1)(
2
n
xRy
Xn
fRs
ii (3.17)
Se X no conhecido, o estimador amostral x substitudo no denominador. A forma mais
rpida de calcular )(Rs com mquina de calcular expressa da forma:
1
21)(
22
n
xRxyRy
nX
fRs
iiii (3.18)
2.4 Estimao do Valor Mdio das Sub-Populaes
Em muitos inquritos, as estimativas so feitas em cada classe na qual a populao se encontra
sub-divida. Por exemplo, o Agregado familiar podemos estar interessados em achar as
estimativas para AF com 0, 1,.., n filhos.
A Comisso de Amostragem dos Estados Unidos (1950), chamou dessas sub-divises da
populao por Domnios de Estudo.
Na situao mais simples cada unidade da populao pertence um dos domnios.
Seja jth o domnio que contm Nj unidades e
nj = o nmero de unidades na Amostragem Aleatria Simples de tamanho n.
Se yjk (k= 1, 2,.., nj ) so as medies nessas unidades, a mdia da populao jY para o domnio
jht estimado por
jn
k j
jk
jn
yy
1 (3.19)
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 21
Assim:
1. jy um estimador no viciado para jY ;
2. O erro padro para jy igual a
j
j
j
j
y N
n
n
Ss
j
1 (3.20)
Onde
jN
k j
jjk
jN
YyS
1
2
2
1 (3.21)
Uma estimativa do erro padro para jy dada por
j
j
j
j
N
n
n
s1 (3.22)
Onde
jN
k j
jjk
jn
yys
1
2
2
1 (3.23)
Se o valor de Nj for desconhecido, a quantidade N
n pode ser utilizada em llugar de
j
j
N
n, no
calculo do cpf.
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 22
2.5 Estimao dos valores Totais das Sub-Populaes
Consideremos um exemplo, duma lista de clientes da Mcel com contractos, onde uns pagaram a
sua mensalidade e outros no. Podemos estar interessados em estimar, atravs duma amostra, o
total do dinheiro ainda em divida. Se (o nmero de dividas no pagas na populao) for Nj
conhecido, ento a estimativa do total na amostra ser:
jjj yNY
(3.24)
Se Nj nem o total de recebimentos forem desconhecidos, as estimativas no se podem calcular. No
seu lugar usa-se a estimativa. Seguinte:
jn
k
jkj yn
NY
1
(3.25)
E o o seu erro padro correspondente :
N
n
n
NSY j 1)(
'
(3.26)
Em cuja S um afastamento padro da populao de 'iy .A fim de calcularmos S, admitamos
que a populao seja constituda de Nj valores de yi que esto compreendidos no sector j, e e
de N Nj valores. Vem ento
Onde
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 23
)(1
1
sec
22'
N
Yy
NS
j
jtor
i
(3.27)
Assim, uma estimativa amostral do erro padro de jY^
para ser:
N
n
n
NsYs
i
j 1
(3.28)
3. AMOSTRAGEM PARA PROPORCES E PERCENTAGENS
3.1 Varincias dos Estimadores Amostrais
s vezes, deseja-se estimar o nmero total, a proporo de unidades na populao que possuem
uma certa caracterstica ou atributo, ou que integram uma determinada categoria. Muitos dos
resultados dos censos e inquritos, habitualmente divulgados assumem essa forma, como, por
exemplo, o nmero de pessoas desempregadas numa populao C e C. Admite-se que qualquer
unidade da populao se integra em uma das duas categorias.
A notao usada a seguinte:
Nmero de unidades na categoria C Proporo de unidades em C
Na populao Na amostra Na populao Na Amostra
A a P = A/N p = a/n
Teorema 4.1: A proporo amostral n
ap um estimador no viciado da proporo da
populao N
AP .
N
nN
n
PQ
N
nN
N
SPpEpVar
22)()(
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 24
Corolrio 1:
Corolrio 2: A varincia de NpA , o estimador do nmero total de unidades na classe/
categoria C, :
1)(
2
N
nN
n
PQNAVar (37)
Teorema 4.2 (3.3): O estimador no viciado da varincia de p, obtido da amostra :
pqn
nNsp p
)1()var(
2
(3.8)
Demonstrao:
Corolrio: O estimador no viciado da varincia de NpA , estimado do nmero total de
unidades na classe C na populao dada por:
pqn
nNNsA Np
1
)()var(
2
(3.11)
4. CLCULO DO TAMANHO DA AMOSTRA
4.1. A Especificao da Preciso
4.2. A Frmula para o Tamanho da Amostra para Propores
As unidades so classificadas em duas classes C e C. Admite se uma margem de erro d, na
proporo estimada p das unidades da classe C e existe um pequeno risco que ns aceitamos
incorrer e o erro real admitido de ser maior do que d, isto ,
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 25
dPpPr (3.12)
Assumindo que p distribuda de forma normal, e que se trata de amostragem Aleatria
Simples, sabemos que:
n
PQ
N
nNp
1
(3.13)
Consequentemente, a frmula que liga n com o grau de preciso desejado :
n
PQ
N
nNtd
1
(3.14)
Onde t a abcissa da curva normal que corta a rea nas regio em dois lados.
Resolvendo em relao a n, temos:
11
12
2
2
2
d
PQt
N
d
PQt
n (3.15)
Para o uso prtico, como estimador aproximado para P, toma-se p na frmula. Se N for grande,
como primeira aproximao para n, toma-se:
V
pq
d
pqtn
2
2
0 (3.16)
Onde
2
2
t
dV = Varincia da populao desejada.
Na prtica, primeiro calcula-se 0n . Se N
n0 for negligencivel, 0n uma aproximao
satisfatria de n. Se no, o n obtido atravs da frmula:
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 26
N
n
n
N
n
nn
0
0
0
0
1)1(
1
(3.17)
4.3 A Frmula do Tamanho da Amostra para Dados Contnuos
Se y for a mdia de n observaes duma amostra aleatria simples, ns pretendemos que:
dYyPr (3.18)
Onde d, a margem de erro escolhido e uma probailidade pequena. Dos captulos
anteriores sabemos que, que o erro padro da mdia :
n
S
N
nNy
(3.19)
Ento
n
S
N
nNtd
(3.20)
Elevando ambos os membros ao quadrado, e expressando em funo a n ebtemos:
2
2
11
d
tS
N
d
tS
n (3.21)
Como para o caso das propores, toma-se como primeira aproximao para o tamanho da
amostra n o nmero:
V
S
d
tSn
22
0
(3.22)
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 27
Esta frmula da resultado aceitvel, a no que N
n0 seja grande. Caso seja, ento calculamos
n, como
N
n
nn
0
0
1
(3.23)
Se o que se pretende estimar o total da populao Y, com a margem de erro d , toma-se como
a primeira aproximao para n
V
NS
d
NtSn
22
0
(3.24)
no lugar de (3.23), e o resto mantm-se.
4.4 Mtodos Avanados na Estimao da Varincia da Populao.
Geralmente, a varincia da populao 2S desconhecida. Na, prtica existem quatro mtodos
de estimao da varincia da populao no clculo do tamanho da amostra.
1. Escolha do tamanho da amostra em duas etapas, onde na primeira etapa se escolhe o
tamanho 1n duma amostra aleatria simples no qual os valores de 2S e P e o tamanho
exigido de n so Obtidos;
2. Atravs dos resultados dum estudo piloto;
3. Atravs de inquritos de populaes similares;
4. Atravs dum guess work sobre a estrutura da populao com apoio de resultados
matemticos
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 28
4.5 Estimao de Y com varincia V
Se 2
1s for a varincia resultante da primeira amostra, tome unidades adicionais para tornar o
tamanho da amostra igual a:
1
2
1 21nV
sn . (3.23)
Assume se que y aproximadamente normal. Se S fosse exactamente conhecido, o tamanho
necessrio (exigido) seria ./2 VS O efeito de no conhecer S o de aumentar o tamanho mdio
pelo factor
1
21
n. (3.24)
4.6 Estimao de P com a varincia V
Seja 1p a estimada de P, resultante da primeira amostra. O tamanho da amostra combinado as
duas primeiras amostras ser:
1
11
11
1111 3183
Vn
qp
qp
qp
V
qpn
(3.25)
O primeiro termo em (x) o tamanho da amostra requerido se sabido que P e igual a 1p .
Com este mtodo o estimador binomial de p obtido atravs duma amostra completa de
tamanho n, ligeiramente viciado. Para corrigir este enviesamento, use:
pq
pVpp
)21(
(3.26)
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 29
5.7 Estimao de P dado o coeficiente de varincia
Ccv
Para n toma-se
11111
1 13
nCpqpCp
qn (3.27)
A estimativa torna-se:
q
CppP (3.28)
6. AMOSTRAGEM ALEATRIA ESTRATIFICADA
Neste mtodo a populao dividida em L sub-populaes mutuamente exclusivas ou estratos, e
a amostragem aleatria Simples realizada para cada estrato. Essas sub amostras so
combinadas numa nica amostra, estatsticas da qual so usadas para estimar os parmetros da
populao.
Notaes
O sufixo h denota o estrato e i a unidade dentro do estrato. Geralmente, so usados os seguintes
smbolos.
hN = Nmero total de unidades no estrato h;
hn = O nmero de unidades na amostra no estrato h;
hiy = Valor obtido para a unidade i no estrato h
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 30
h
kh
N
nf = a fraco amostral no estrato
N
NW hh = O peso do estrato h
h
N
i
hi
h
N
y
Y
k
1 = A mdia do estrato h na populao = h
h
n
i
hi
hn
y
y
h
1 = Mdia amostral do estrato h
hN
i
hhi
h
h YYN
S1
22
1
1 == a varincia verdadeira do estrato h;
hn
i
hhi
h
h yyn
s1
22
1
1 = a varincia amostral do estrato h
6.1 Alocao da Amostra
Na amostragem aleatria estratificada, o total da amostra n, pode ser alocada aos vrios
estratos de diferentes maneiras. O tamanho total da amostra e o tamanho da amostra em cada
estrato depende do mtodo de alocao usado. Ns vamos descrever trs dos mais usados
mtodos de alocao.
6.2 Propriedades dos estimadores na Amostragem Estratificada
Para o valor mdio, por unidade, da populao, a estimativa usada na amostragem estratificada
representada por sty (onde st significa stratified), onde
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 31
N
yN
y
L
h
hh
st
1 (6.1)
na qual LNNNN ...21 .
A estimativa sty , de modo geral, no o mesmo valor mdio amostral. Esse valor mdio
amostral, y , dado pela frmula:
n
yn
y
L
h
hh 1 (6.2)
A diferena que, em sty , as estimativas dos estratos individuais recebem os seus pesos
correctos correspondentes N
NW hh .
evidente que y coincide com sty , desde que em cada estrato se verifique a condio
N
N
n
n hh N
n
N
n
h
h ou seja ffh (6.3)
Significando assim, que a fraco amostral a mesma em todos os estratos.
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 32
As principais propriedades da estimativa sty
Teorema 6.1: Se, em todos os estratos, a estimativa amostral hy for sem tendncia, ento o sty
uma estimativa sem tendncia do valor mdio da populacional Y .
Corolrio 6.1: Uma vez que hy um estimador no viciado para hY para a amostragem
aleatria simples dentro do estrato, sty um estimador no viciado para a mdia populacional
Y para a amostragem aleatria estratificada.
Isto significa, que na amostragem aleatria estratificada, como estimador da mdia da
populao Y , usa-se:
N
yN
y
L
h
hh
st
1 (6.4)
Teorema 6.2: Para a amostragem estratificada, a varincia do estimador sty , sendo este uma
estimativa do valor mdio da populao Y :
L
h
hh
L
h
hh
st yVarWN
yVarN
yVar1
2
2
1
2
)(
)(
)( (6.5)
Onde
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 33
2)( hhh YyEyVarV (6.6)
Nota Importante: A varincia de sty depende das varincias dos estimadores das mdias hY
de cada.
Teorema 6.3: Para a amostragem aleatria estratificada, a varincia da estimativa sty
L
h
L
h
h
h
hh
h
hhhhst f
n
SW
n
SnNN
NyV
1 1
22
2
2)1()(
1)( (6.8)
Corolrio 6.2: Se as fraces de amostragem h
h
N
n forem desprezveis em todos os estratos,
tem-se:
L
h h
hhL
h h
hh
stn
SW
n
SN
NyV
1
22
1
22
2
1)( (6.9)
Esta frmula apropriada quando se podem desprezar as correces das para populaes
finitas.
Corolrio 6.3:
No caso em que a repartio proporcional, pode-se substituir hn por seu valor na frmula
(6.8),
N
nNn hh
Desse modo, reduzindo a varincia para mm
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 34
L
h
L
h
hhhh
st SWn
f
N
nN
n
S
N
NyV
1 1
22
1)( (6.10)
Corolrio 6.4: Se a amostragem for proporcional ao tamanho e as varincias de todos os
estratos tiverem o mesmo valor 2
wS , obtm-se a frmula simplificada
fn
S
N
nN
n
SyV wwst
1
22
(6.11)
Tem lugar o seguinte resultado.
Teorema 6.4: Se stst yNY a estimativa do valor total da populao Y, ento temos:
h
hnnnst
n
SnNNYV
2
)()( (6.12)
(Nota: Incluir o exemplo da pag.133-134)
6.3.1 Alocao proporcional
A amostra alocada ao estrato, proporcionalmente ao tamanho do estrato, isto :
N
N
n
n hh (6.1)
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 35
6.3.2 Alocao ptima
Na amostragem estratificada os valores dos tamanhos das amostras kn nos estratos so
escolhidos pelo amostrista. Esses valores podem ser escolhidos de modo a minimizar
estyVarV para um dado custo especfico para a mostra ou para minimizar o custo para um
valor especfico para estyVarV .
A funo custo mais simples tem a forma:
L
i
hhnCCCcusto1
0 (6.2)
Onde
0C = Custo de contingncias
hC = Custo por unidade em cada estrato e pode variar de unidade por unidade, e para cada
estrato, este custo proporcional ao tamanho da amostra.
Se a amostra alocada ao estrato de tal modo que a varincia do estimador seja mnima, na
condio de que o total oramento disponvel para cobrir a varivel custos fixa e igual a C e
que o custo de amostragem por unidade no estrato h Ch . Essa alocao dada por:
L
i
hhh
hhh
L
i
hhh
hhhn
CSN
CSN
CSW
CSW
n
n
11
/
/
/
/ (6.3)
A equao (6.3) d hn em termo de n . Se os custos so fixos, ento n pode ser expresso como:
L
i
hhh
L
i
hhh
CSN
CSNCC
n
1
1
0 /
(6.4)
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 36
Se estyVarV for fixo, ento n dado por:
L
i
hh
L
i
hhhhh
SWN
V
CSWSW
n
1
2
1
1
/
(6.5)
Onde, NNW hh / .
6.3.3 Alocao de Neyman (1934)
A amostra alocada ao estrato de modo que a varincia do estimador seja mnima, na condio
de que o oramento total disponvel para cobrir a varivel custo fixo e iqual a C e que o custo
de amostragem por unidade o mesmo para cada. Essa alocao dada por:
L
i
hh
hh
L
i
hh
hhn
SN
SN
SW
SW
n
n
11
(6.7)
CONFECAO DO QUESTIONRIO
Sob a denominao genrica de " formulrio " se inclui toda forma impressa destinada a colecta
de dados, tal como pronturios, formulrios de declarao de imposto de renda, formulrio de
atestado de bito ou questionrio que por sua vez permitem recolher dados ou sirvam para sua
apuraro.
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 37
Os formulrios devem ser planejados cuidadosamente, de tal forma que sejam realmente teis e
que facilitem e no dificultem a obteno de dados. Eles devem ajudar a colectar informaes
de maneira completa e eficiente, permitindo uniformidades nas diferentes observaes e
evitando a colecta de dados inteis ou irrelevantes ao estudo.
1. Formas de aplicao de um questionrio:
I) QUESTIONRIO - enviado (distribudo pelo correio) apresentado (distribudos por
pesquisadores que mais tarde vo busc-los.
Desvantagens:
1. Dificuldades de esclarecer dvidas do informante;
2. Uso de abreviaturas nas respostas, m letra, etc;
3. Impossibilidades fazer comprovaes;
S devem ser usadas em grupos seleccionados, cujos componentes possam, sozinhos,
preencher os questionrios e tenham compreenso do valor e do alcance da pesquisa.
Nesse caso, possvel sua utilizao preferindo-se o processo por questionrio
apresentado.
II) QUESTIONRIO E ENTREVISTA
O prprio entrevistador preenche o questionrio, interrogando o informante;
o melhor de todos os processos;
Custo maior devido a necessidade de entrevistadores;
2.Principios de construo de um questionrio:
Antes de ser elaborado o questionrio devem ser considerados:
I) o propsito para qual ser utilizado;
II) as circunstncias sob as quais se recolher a informao;
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 38
O primeiro tem importncia para se decidir sobre os dados que em ultima estncia se recolhero
e o seguro para a adopo do tamanho, forma e tamanho mais conveniente.
O questionrio deve permitir reconhecer duas classes de dados:
I) Dados administrativos ou de Identificao - ajudaro a identificar as unidades em
observao.
II) Dados sobre o problema que se estuda - devem ter o propsito perfeitamente definido a ser
pertinentes ao estudo
Embora seja impossvel dar regras fixas para a correcta elaborao de um questionrio, os
seguintes princpios devem ser usados:
I) Decidir sobre os dados que sero colectados:
Fazer uma lista de todas as informaes que so " desejveis " colectar de acordo com a
finalidade do estudo;
Considerar aqueles que so factveis de colectar de maneira fidedigna e exactas;
Limitar os dados queles prticos de colectar;
Limitar a informao quela que se usar; (s perguntar o estritamente necessrio)
II) Decidir a ordem em que se alocaro as perguntas do questionrio.
O questionrio deve ser dividido em grupos de questes que denominamos de Blocos .As
questes de um bloco so de um mesmo assunto;
O 1 Bloco geralmente constitudo de dados dos informantes (bloco e identificao);
O desenho o questionrio deve separar os blocos visando uma melhor visualizao;
III) Considerar como sero feitas as perguntas:
S perguntar aquilo que o informante tem o conhecimento directo;
Perguntar fato e no juzos, a no ser em caso especiais;
No exigir clculos e sim dados;
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 39
Empregar linguagem simples e sem ambiguidades;
Enunciar perguntas sem prolixidade;
Evitar perguntas: insinuantes, pouco explcitas, que faam apelam a memria;
Fazer pergunta de carcter quantitativos e no qualitativos, sempre que possvel;
IV) Planear como se anotaro as respostas.
No utilizar perguntas abertas, somente em pesquisas especiais esta pergunta
admitida. Pois as respostas podem, ser as mais diversas possveis.
As perguntas de um questionrio podem ser classificadas em funo das respostas em:
Perguntas Abertas - informante expressa livremente sua opinio sobre determinado assunto.
Perguntas Fechadas - informante selecciona sua resposta dentre um conjunto de opes.
V) Determinar as caractersticas do formulrio.
Quem colectar a informao?
De Quem ser colectada?
Onde e Quando se registar?
Como se processar os dados?
De acordo com as respostas s perguntas acima se decidir sobre:
A Forma
O Tamanho
O Material
A Cor
VI) Provar a operacionalidade do questionrio - PESQUISA PILOTO.
Testar o questionrio no mnimo com 10 informantes com a mesma caracterstica da
populao em estudo;
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 40
Reformular se necessrio
VII) Redigir as informaes necessrias:
Apresentao explicando o objectivo da pesquisa e enfatizando a importncia das
respostas do informante;
Manual de resposta se necessrio;
No entanto antes de entramos nos temas especficos introduziremos alguns conceitos necessrios
para compreenso dessas matrias.
Exerccios Resolvidos Um pesquisador deseja estimar a proporo de ratos nos quais se desenvolve um certo tipo de
tumor quando submetidos a radiao. Ele deseja que sua estimativa no se desvie da proporo
verdadeira por mais de 0,02 com uma probabilidade de pelo menos 90%.
(a) Quantos animais ele precisa examinar para satisfazer essa exigncia?
Pelo enunciado acima temos:
- Erro da estimativa: =0,02.
- Coeficiente de confiana: P()= 0,90.
Logo, pela tabela da distribuio Normal Padro, temos que z tal que A(z)=0,95, portanto,
z=1,64.
Como no temos uma informao preliminar sobre p, devemos utilizar p=0,5, que maximiza p (1-
p).
Assim, podemos calcular o tamanho da amostra da seguinte forma:
221,64
(1) 0,250,02
zn pp
1681
Logo, para que o erro cometido na estimao da proporo de ratos nos quais se desenvolve
certo tipo de tumor quando submetidos a radiao seja no mximo 0,02 com probabilidade
igual a 0,90, o pesquisador precisa examinar 1.681 animais.
.
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 41
(b) Como seria possvel diminuir o tamanho da amostra utilizando a informao adicional de que
em geral esse tipo de radiao no afeta mais que 20% dos ratos?
Se p for no mximo 20%, o tamanho da amostra ser:
221,64
(1) 0,20*0,800,02
zn pp
1076
Logo, se p for no mximo 20%, para que o erro cometido na estimao da proporo de
ratos nos quais se desenvolve certo tipo de tumor quando submetidos a radiao seja no mximo
0,02 com probabilidade igual a 0,90, o pesquisador precisa examinar 1.076 animais.
Exerccio 02
Antes de uma eleio, um determinado partido est interessado em estimar a proporo de
eleitores favorveis a seu candidato.
(a) Determine o tamanho de amostra necessrio para que o erro cometido na estimao seja de,
no mximo 0,01, com probabilidade de 80%.
Pelo enunciado acima temos:
- Erro da estimativa: =0,01.
- Coeficiente de confiana: P() =0,80.
Logo, pela tabela da distribuio Normal Padro, temos que z tal que A(z)=0,90, portanto,
z=1,28.
Como no dispomos de uma informao preliminar sobre p, devemos usar p=0,5, que maximiza
p(1-p).
Assim, podemos calcular o tamanho da amostra da seguinte forma:
221,28
(1) 0,250,01
zn pp
4096
Logo, para que o erro cometido na estimao seja de no mximo 0,01, com probabilidade de
80%, o tamanho da amostra teria que ser de 4.096 eleitores.
.
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 42
(b) Uma amostra piloto revelou que entre 60% e 70% dos eleitores eram favorveis ao
candidato em questo. Com base nessa informao, qual deve ser o tamanho de amostra de
modo que as condies em (a) estejam satisfeitos?
Nesse caso, o mximo de p (1-p) ocorre quando p=0,60. Assim,
221,28
(1) 0,60*0,400,01
zn pp
3933
ou seja, sabendo que p dever estar entre 0,60 e 0,70, o tamanho da amostra teria que ser
3.933, para que as condies em (a) sejam satisfeitas.
(c) Se na amostra com tamanho igual ao obtido em (a), observou-se que 55% dos eleitores eram
favorveis ao candidato, construa um intervalo de confiana para a proporo de eleitores
do candidato com coeficiente de confiana de 0,95.
Temos que:
n = 4096
p =0,55
P()= 0,95
Logo, pela tabela da distribuio Normal Padro, temos que z tal que A(z)=0,975, portanto,
z=1,96.
(1) (;0,95)
ppICp pz
n
0,55(10,55)
(;0,95)0,551,96 0,550,01520,5348;0,56524096
ICp
Exerccio 03
Um cientista resolve estimar a proporo p de indivduos com certa molstia numa regio. Ele
deseja que a probabilidade de que a sua estimativa no se desvie do verdadeiro valor de p
por mais que 0,02 seja de pelo menos 95%. Qual deve ser o tamanho da amostra para que
.
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 43
essas condies sejam satisfeitas? Um outro cientista descobre que a doena em questo est
relacionada com a concentrao da substncia A no sangue e que considerado doente todo
indivduo para o qual a concentrao A menor que 1,488 mg/cm3. Sabe-se que a
concentrao da substncia A no sangue tem distribuio normal com desvio padro 0,4 mg/cm3
e mdia maior que 2,0 mg/cm3. Voc acha que essas novas informaes podem ser utilizadas
pelo primeiro cientista para diminuir o tamanho amostral? Em caso afirmativo, qual seria o novo
tamanho amostral?
= 0,02
P()= 0,95
z tal que A(z) = 0,975 ,z = 1,96
Como no temos uma informao sobre p, devemos usar p=0,5, que maximiza p(1-p).
Assim, podemos calcular o tamanho da amostra da seguinte forma:
221,96
(1) 0,250,02
zn pp
2401
O tamanho da amostra deve ser 2.401 indivduos para que as condies acima sejam satisfeitas.
Seja X: concentrao da substncia A no sangue em mg/cm3
X~N (; 0,42), >2.
P = P (estar doente) = P(X1,28] =
= 1 - P[Z1,28] = 1 A(1,28) = 1 0,9 =0,1.
Assim, segundo um outro cientista, p menor ou igual a 0,10.
A informao acima podem ser utilizada pelo primeiro cientista para reduzir o tamanho da
amostra, pois como o valor de p no mximo 0,1, o valor mximo de p(1-p) atingido quando
p=0,10, e assim:
221,96
(1) 0,10*0,900,02
zn pp
865
.
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 44
Neste caso, a informao do segundo cientista ajuda a reduzir o tamanho de amostra para
aproximadamente 865 indivduos.
Exerccio 04
Um centro de estudos de pesquisa de opinio realizou uma pesquisa para avaliar a opinio dos
telespectadores de uma regio, sobre um certo comentarista desportivo. Para isso entrevistou
380 telespectadores, seleccionados ao acaso da regio, e constatou que 180 desejavam que o
comentarista fosse afastado da TV.
(a) Determine um intervalo de confiana de 90% para p:proporo de telespectadores,
favorveis ao afastamento do comentarista.
Uma estimativa pontual da proporo p de telespectadores da regio favorveis ao
afastamento do comentarista desportivo dada por:
180 0,47370,47380
p
Considerando o coeficiente de confiana =0,90, temos que z tal que A(z)=0,95 e,
portanto, z=1,64.
Assim, o intervalo de confiana para p ser:
(1) (;0,90)
ppICp pz
n
0,47(10,47)
(;0,90)0,471,64 0,470,040,43;0,51380
ICp
(b) Suponha agora que o centro decida que um intervalo de confiana, com coeficiente de 90%
para p, deve ter comprimento 0,05. Voc acha que os dados do item (a) atingem esse
objetivo? Justifique e comente.
Os dados do item (a) no atingiram o objectivo, j que, o intervalo obtido no item (a) tem
comprimento igual a 0,08.
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 45
Para que o objectivo seja atingido, deveramos ter comprimento 0,05.
Para diminuir o comprimento do intervalo, necessrio diminuir o erro, ou seja,
Comprimento 0,05 = 0,025.
Para um erro menor, necessrio aumentar o tamanho da amostra para:
*
*
0,47(10,47)1,64 0,025n
n
=1072.
Assim, os dados do item(a) atingem os objectivos se o nmero de telespectadores
entrevistados aumentar para 1.072.
Os dados do item (a) no atingem o objectivo, somente se o nmero de telespectadores
entrevistados aumentar para 1072, ou seja:
Comprimento = 0,05 = 0,025.
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 46
Exerccios
1. Seja X1, X2, ..., X6, variveis aleatrias independentes, identicamente distribudas de forma
normal com a mdia, e varincia, 2 . Defina os seguintes estimadores:
a) 5
3 53211
XXXX b)
4 43212
XXXX
c) 4
2 43213
XXXX d)
6 543214
XXXXX
e) 5
543215
XXXXX
Diga qual desses estimadores no viciado e qual o mais eficiente.
2. Sejam X1 = 25, X2 = 30, X3 = 27, X4 = 35, X5 = 40, as idades dos estudantes duma turma
do DMI (Departamento de Matemtica e Informtica).
a) Com base nesses dados determine a idade mdia da turma.
b) Forme todas as amostras de tamanho trs e calcule as mdias de cada amostra e
comprove que XE e n
X2
]var[
.
c) Quantas amostras de tamanho 4 so possveis formar? Forme essas amostras e repita o
exerccio da alnea b).
3. Determine a distribuio por amostragem da diferena entre duas mdias amostrais, isto
determine 21 XXE e 21var XX .
4. Mostre que a varincia amostral 2S um estimador no enviesado (no viciado da
varincia da populao 2 .
5. Num estudo sobre a relao existente entre uma atitude de criana e a idade na qual ela
fala primeiro, os pesquisadores registaram a idade (em meses) da primeira fala da criana e
o nmero de pontos (escore) obtido pela criana num teste sobre a atitude. Seguem-se os
dados para 21 crianas:
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 47
criana 1 2 3 4 5 6 7 8 9 10 11
Idade 15 2 10 9 15 20 18 11 8 20 7
Escore 95 71 83 91 102 87 93 100 104 94 113
Criana 12 13 14 15 16 17 18 19 20 21
Idade 9 10 11 11 10 12 42 17 11 10
Escore 96 83 84 102 100 105 57 121 86 100
a) Fazendo o uso da tabela de nmeros aleatrios seleccione uma amostra de tamanho 8. Inicie
a sua leitura da tabela em anexo na linha um, coluna dois. A leitura deve ser feita atravs das
colunas.
b) Com base na sua amostra determine:
(i) a idade mdia da primeira fala;
(ii) o nmero mdio de pontos (escores) dessa amostra e a sua varincia;
(iii) estime o nmero total de pontos para a populao em estudo;
(iv) estime o erro padro da estimativa do total e, d o intervalo de confiana de 95%
dessa estimativa.
6. Numa Biblioteca Privada, os livros esto arrumados em 130 estantes de igual tamanho. Duma
amostra aleatria de 15 estantes deu as seguintes quantidades de livros em cada estante:
28, 23, 25, 33, 31, 18, 22, 29, 30, 22, 26, 20, 21, 28, 25
a) Estimar o valor total de livros dessa biblioteca e o intervalo de confiana dessa estimativa do
total.
b) Suponha agora que o resultado da estimativa no suficientemente correcto e pretendemos ser
95% certos de que a estimativa do do total duma amostra aleatria esteja a 100 de unidades
do valor verdadeiro. Quantas estantes devero ser inclusos na amostra?
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 48
7. Num sector particular duma fbrica foi realizado um inquerido para tentar investigar at que
ponto o absentismo no este ligado com doenas ou frias oficiais. Uma amostra de 500
pessoas, num total de 36000 trabalhadores foi perguntada sobre o nmero de dias que eles
j tinham solicitado para descansar, nos anteriores seis meses.
Os resultados do inqurito foram os seguintes:
No. De dias de licena 1 2 3 4 5 6 7 8 9 10
No. De trabalhadores 157 192 90 31 18 5 2 40\ 0 1
a) Estimar o nmero total de licenas solicitadas, o o erro padro e o respectivo intervalo
confiana de 95% dessa estimativa.
b) Repita o mesmo exerccio pra uma amostra de1000.
8. Uma amostra aleatria simples de 30 Agregados Familiares (AF) foi seleccionada em uma
zona urbana que contem 14848 AFs. O nmero de pessoas (membros do AF) em cada um
dos AFs que integram a mostra o seguinte:
3, 6, 3, 3, 2, 3, 3, 3, 4, 4, 3, 2, 7, 4, 3, 5, 4, 4, 3, 3, 4, 3, 3, 1, 2, 4, 3, 4, 2, 4.
a) Estimar o nmero total de pessoas que vivem na zona.
b) Calcular a probabilidade de que essa estimativa esteja dentro do limite de 10% do valo
real.
9. Numa populao em que N = 6, os valores de yi so 8, 3, 1, 11, 4 e 7.
a) Calcular o valor mdio amostral y para todas as possveis amostras simples de tamanho 2.
Provar que um estimador y no viciado (sem tendncia) de Y .
b) Dada a mesma populao, calcular 2s para todas as amostras aleatrias simples de tamanho
3 e provar que 22 ][ SsE .
10 Duma populao de 2400 estudantes residentes fora da residncia universitria, foram
escolhidas duas amostras independentes (sem reposio) de tamanhos 200 e 450
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 49
respectivamente. Cada estudante foi perguntado sobre a distncia entre a sua casa e a
universidade. Os resultados amostrais foram os seguintes:
14.51 y 90.42 y
87.321 s 02.42
2 s
Calcule o intervalo de confiana aproximado de 99% para a distncia mdia entre a
universidade e a zona de residncia dos estudantes.
11.Sabe-se que duma populao de tamanho N = 430 unidades, 19Y e 6,852 S . Qual o
tamanho da amostra necessria para estimar Y com a probabilidade de 10% e a margem de
erro de 1,9.
12.O instituto Internacional de Democracia pretende realizar um inqurito nalguns distritos do
pas com objectivo de determinar a percentagem de pessoas que tm uma certa percepo
sobre democracia. O nmero total da populao (Universo) em causa N = 50000 pessoas.
a) Determine o tamanho da amostra necessrio para a realizao deste levantamento por
amostragem, com um erro aceitvel de 5% e com um intervalo de confiana de 95%.
b) Alteraes haver no tamanho da amostra se o intervalo de confiana for de 90%?
13.Numa Amostra Aleatria simples de tamanho 100, duma populao de tamanho 500, existem
37 unidades na classe C. Determine o intervalo de confiana de 95% da proporo para o
nmero total de unidades em C na populao
14. Pretende se realizar um inqurito ao Agregados familiares com o objectivo de determinar a
proporo de famlias que possuem certos atributos. Numa populao com 4000 Agregados
familiares, qual o tamanho da amostra necessrio para determinar P, com uma margem de erro
de 5% com 95% de confiana?
a) Se sabe de estudos anteriores de que a proporo p = 30%.
b) Se o valor p desconhecido?
15.Os dados seguintes mostram a estratificao de todas as empresas agrcolas, de acordo com
o tamanho da farma e o nmero mdio de hectares de milho por farma em cada estrato.
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 50
Tamanho
da farma
Nmero
de Farmas
Mdia
de milho
Desvio
Padro
hN hY hS
0- 40 394 5.4 8.3
41-80 461 16.3 13.3
81-120 391 24.3 15.1
121-160 334 34.5 19.8
161-200 169 42.1 24.5
201-240 113 50.1 26.0
241 - 148 63.8 35.2
Total ou
mdias
2010 26.3
Para uma amostra de 100 farmas, calcule o tamanho da amostra para cada estrato, usando:
a) A alocao proporcional;
b) A alocao ptima
16. Um amostrista pretende seleccionar uma amostra aleatria estratificada e suspeita que os
custos do trabalho de campo sero da forma hhnC . As estimativas das quantidades relativas
para os dois estratos so:
Estrato hW hS hC
1 0.4 10 $4
2 0.6 20 $9
a) Determine valores de nn /1 e nn /2 que minimizam o custos para dado valor de estyVar .
b) Determine o tamanho da amostra necessrio, para esta alocao, de modo que .1estyVar
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 51
Capitulo 2: INTEVALO DE CONFIANCA
Introduo
Intervalo de confiana uma tcnica para se fazer inferncia estatstica. Ou seja, a
partir de um intervalo de confiana, construdo com elementos amostrais, pode-se inferir sobre um
parmetro populacional.
A lgica da construo de intervalos de confiana a seguinte:
Seja um parmetro populacional;
Seja um estimado de q.
Conhecida a distribuio de probabilidade de , possvel construir um intervalo:
1 2
que contm , e se exigir que a probabilidade do intervalo seja de (1 ) = nvel de
confiana.
Geralmente (1-).100=90%, 95%, 99%, .
Esta tcnica diferencia-se da estimao por ponto, onde se calcula um nico valor (estimativa)
para o parmetro populacional. No caso do intervalo de confiana busca-se um segmento, ou
intervalo 1: 2 que contm o parmetro desconhecido.
Por exemplo, retira-se uma amostra de 500 Moambicanos e calcula-se a mdia de suas alturas
encontrando-se 1,66 m. Logo, uma estimao pontual da verdadeira altura mdia (m) dada
por x =1,66 m. J atravs do intervalo de confiana poder-se-ia encontrar um intervalo, por
exemplo [1,58; 1,68] que, em 95% das vezes, incluiria (a verdadeira altura mdia dos
Moambicanos).
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 52
2.1 INTERVALO DE CONFIANA PARA A MDIA POPULACIONAL QUANDO A VARINCIA (2) CONHECIDA
Como se sabe, o estimador de X . Tambm conhecida a distribuio de probabilidade de
X :
X ~N(;
) para as populaes infinitas
X ~N(;
) para as populaes finitas
Assim, para o caso de populaes infinitas, a varivel padronizada de X ser:
Z=
Fixando se um nvel de confiana: 1- tem se:
Ou seja:
P( -Z/2ZZ/2)=1-
Substituindo se o valor de Z,
P(-Z/2
Z/2)=1-
Resolvendo -se as duas inequaes para , tem-se o intervalo de confiana para a mdia
populacional () quando a varincia (2) conhecida:
P( X -Z/2
X +Z/2
)
Exemplo:
A durao da vida de uma pea de equipamento tal que = 5 horas.
Foram amostradas 100 dessas peas obtendo-se a mdia de 500 horas. Deseja-se construir um
intervalo de confiana para a verdadeira durao mdia da pea com um nvel de 95%.
Resolucao:
Do problema se tem: = 5; n = 100; X = 500; (1 a).100 = 95%
Z/2=1.96
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 53
Lembre-se que para descobrir a abcissa 1,96, entrou-se na tabela com 0.475= 47.5%, j que a
tabela da faixa central.
Substituindo se os dados na formula:
P(500-1,96.
500+1,96.
) =95%
Efectuando os clculos:
P(499.02500.98)=95%
que o intervalo solicitado.
A interpretao desse resultado dada por:
O intervalo [499,02; 500,98] contm a durao mdia da pea com 95% de confiana. Isto
significa que se forem construdos intervalos dessa mesma maneira, para um grande nmero de
amostras, em 95% dos casos tais intervalos incluiriam.
Para o caso de populaes finitas usa-se a seguinte frmula:
P( X -Z/2
X +Z/2
)=1-
Um intervalo unilateral de 100(1-)% com limite superior estabelecido a partir de:
X +Z
Um intervalo unilateral de 100(1-)% com limite inferior estabelecido a partir de:
X -Z/2
ERRO DE ESTIMACAO
O intervalo de confiana bilateral tem a forma;
X Z/2
Aumentando a amplitude do intervalo, aumenta se o nvel de confiana do intervalo, no entanto,
aumenta se o erro mximo de estimacao que o valor absoluto da diferena entre o parmetro
amostral ( X ) e o parametro papulacional(), representado como =| X |.
Como o intervalo de confiana tem centro na mdia amostral, o erro mximo provvel igual a
metade da amplitude do intervalo.
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 54
Como X Z/2
, pode se escrever X erro
Logo = Z/2
n= (
)2
Logo, o tamanho da amostra depender:
do grau de confiana;
da disperso na populao ;
dee certo valor especifico para o erro tolervel.
2.2 INTERVALO DE CONFIANA PARA A MDIA () QUANDO A VARINCIA (2) DESCONHECIDA
O processo para se obter o intervalo de confiana semelhante quele mostrado no item
anterior. Como no se conhece , porm, preciso substitu-lo por S (desvio-padro amostral)
que, contrariamente a , uma varivel aleatria. Da se
ter o quociente entre duas variveis aleatrias, X e S, pois:
Pode-se demonstrar que:
t=
Tem distribuio t de Student com (n 1) graus de liberdade.
Fixando-se um nvel de confiana: 1 tem-se:
P( -Z/2ZZ/2)=1-
Substituindo se o valor de t e resolvendo -se as duas inequaes para , obtm-se o intervalo
para a mdia quando a varincia (2) desconhecida.
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 55
P( X -t/2
X +t/2
)=1-
Onde a varivel t possui (n 1) graus de liberdade.
Exemplo:
A amostra: 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extrada de uma populao normal. Construir um
intervalo de confiana para a mdia a nvel de 95%.
Resolucao:
Calculando-se a mdia e o desvio-padro da amostra obtm-se: X = 8,7 e S = 2.
Como: 1 - = 95% e g. l. = = n 1 = 10 1 = 9
t/2=2.2622 (tabela)
Logo
P(8.7-2.2622.
8.7+2.2622.
)=95%
Ou
P(7.2710.13)=95%
A interpretao desse resultado dada por:
O intervalo [7,27; 10,13] contm a verdadeira mdia com 95% de confiana.
Para o caso de populaes finitas usa-se a seguinte frmula:
Para o caso de populaes finitas usa-se a seguinte frmula:
P( X -t/2
X +t/2
)=1-
2.3 INTERVALO DE CONFIANA PARA A VARINCIA O estimador de 2 S2.
Demonstra-se que )
tem distribuio qui-quadrado com (n 1) graus de liberdade. Ou
seja:
n-1 )
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 56
Ento, substituindo-se o valor de 2, e isolando-se 2 obtm-se o seguinte intervalo:
P( )
)
)
Exemplo:
Admita n = 10, S2=4 e que se deseja construir um IC para a varincia a nvel de 90%
Resolucao:
Tem se n=10, S2=4, (1-).100=90% e =(n-1)=(10-1)+9
Consultando-se a tabela de distribuio qui-quadrado:
Logo:
P(
)=90%
P(2,13 )=90%
A interpretao que o intervalo [2,13; 10,81] contm a verdadeira varincia com 90% de
confiana.
2.4 INTERVALO DE CONFIANA PARA O DESVIO-PADRO
Como o desvio-padro a raiz quadrada da varincia, pode-se usar a seguinte: frmula:
P( S. )
)
)=1-
Com a distribuio qui-quadrado de parmetros: = (n 1).
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 57
A interpretao segue o modelo j apresentado.
2.5 INTERVALO DE CONFIANA PARA PROPORO f o estimador de e tem distribuio dada por:
f (
)
f (
)
Assim, para o caso de populaes infinitas, a varivel padronizada de f dada por:
Z=
Fixando-se um nvel de confiana 1 a tem-se:
P( -Z/2ZZ/2)=1-
Substituindo-se o valor de Z:
P( -Z/2
Z/2)=1-
Isolando-se do denominador, encontra-se:
P(f-Z/2
f+
)=1-
Para amostras grandes (n > 30) pode-se substituir p e q = (1 p) do radicando por f e (1 f).
Assim, o IC para a proporo ser:
P(f-Z/2 )
f+
)
)=1-
Para o caso de populaes finitas o IC ser:
P(f-Z/2 )
f+
)
)=1-
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 58
Exemplo: Examinadas 500 peas de uma grande produo encontrou-se 260 defeituosas. No
nvel de 90% construir um IC para a verdadeira proporo de peas defeituosas.
Tem-se: n = 500, p = 260, 1 - a = 90%.
Logo:
f=
=
=0.52
Z/2=1.64
Ento, o IC ser:
P(0.52-1.64 )
(0.52+1.64
)
=1-
Ou
P(0.483 )
Ou ainda
P(48.3% )
E a interpretao de que o intervalo [44,8%; 55,2%] contm a verdadeira percentagem (ou
proporo) de peas defeituosas.
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 59
Capitulo3: TESTE DE HIPTESES
INTRODUO
Teste de Hipteses uma tcnica para se fazer inferncia estatstica. Ou seja, a partir
de um teste de hipteses, realizado com os dados amostrais, pode-se inferir sobre a populao.
No caso das inferncias atravs dos IC, busca-se cercar o parmetro populacional
desconhecido. Aqui formula-se uma hiptese quanto ao valor do parmetro populacional, e pelos
elementos amostrais faz-se um teste que indicar a aceitao ou rejeio da hiptese formulada.
CONCEITO DE HIPTESE ESTATSTICA Hiptese estatstica uma suposio quanto ao valor de um parmetro populacional, ou quanto
natureza da distribuio de probabilidade de uma varivel populacional.
Nesta sesso trabalharemos apenas com os testes referentes aos parmetros da populao.
So exemplos de hipteses estatsticas:
a) A altura mdia da populao Moambicana 1,65m, isto : H: = 1,65 m;
b) A varincia populacional dos salrios vale 2.0002mt, isto : H : 2= 2.000 2mt
c) A proporo de Maputenses com a doena X 40%, ou seja: H: = 40%;
d) A distribuio dos pesos dos alunos da nossa faculdade normal;
e) A chegada de navios ao porto de Nacala descrita por uma distribuio de Poisson.
3.1 TESTE DE HIPTESES E TIPOS DE HIPTESE
Teste de hipteses uma regra de deciso para aceitar ou rejeitar uma hiptese estatstica com
base nos elementos amostrais.
Uma hiptese pode ser definida como uma afirmativa sobre a populao.
Por exemplo, um psiclogo pode levantar a hiptese de que as meninas tm melhor desempenho
verbal do que os meninos, ou um mdico pode levantar a hiptese de que os fumantes vivem
menos do que os no-fumantes. O testes de hipteses permitem estabelecer se tais afirmativas
so confirmadas pelos dados disponveis.
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 60
A primeira hiptese denominada hiptese nula e a segunda denominada hiptese
alternativa. Indica-se a primeira hiptese por H0 (l-se agzero) e a segunda por H1 (l-se ag-
um). Escreve-se: H
H0:as mdias so iguais H
H1 as mdias so diferentes
Para decidir por uma das hipteses isto , para decidir se as mdias na populao so, ou
no so, iguais o pesquisador submete os dados da sua amostra a um teste de hipteses. Mas
em que consiste este teste? O pesquisador supe que as mdias, na populao, so iguais. Se
sob essa hiptese for pouco provvel ocorrer uma diferena de mdias to grande ou maior
do que a que se observou na amostra, o pesquisador rejeita a hiptese inicial e conclui que as
mdias, na populao, so diferentes.
Exemplo:
Um professor quer saber se dois mtodos de alfabetizao, A e B, tm a mesma eficincia. Na
amostra, as mdias das notas dos alunos foram 5,0 para o mtodo A e 7,0 para o mtodo B. Se
sob a hiptese de que, na populao, as mdias so iguais for pouco provvel ocorrer, na
amostra, uma diferena de dois pontos ou mais entre mdias, lgico rejeitar a hiptese inicial e
concluir que B mais eficiente do que A.
Mas preciso insistir neste ponto pouco provvel no significa impossvel. Ento, o
pesquisador pode cometer erro quando conclui que, na populao, as mdias so diferentes s
porque seria pouco provvel ocorrer uma diferena de mdias to grande, ou maior do que a
que ele prprio observou, se as mdias da populao fossem iguais. O pesquisador no sabe se
est ou no cometendo esse tipo de erro, embora a probabilidade de ocorrer o erro seja
conhecida. o que os estatsticos denominam nvel de significncia do teste (probabilidade de
rejeitar H0 quando H0 verdadeira).
Finalmente, toda vez que se rejeita H0, ao nvel de significncia de 5%, usual afirmar que o
resultado significante e indicar isso com um asterisco. Quando se rejeita H0 ao nvel de
significncia de 1%, usual afirmar que o resultado altamente significante e indicar isso com
dois asteriscos.
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 61
O exemplo a seguir mostra diferentes tipos de testes de hipteses.
Exemplo:
a) H0: =1.65m
H1: 1.65m Dar origem a um teste bicaudal
b) H0: =1.65m
H1: 1.65m Dar origem a um teste unicaudal direita
c) H0: =1.65m
H1: 1.65m Dar origem a um teste unicaudal esquerda
3.2 TESTES DE SIGNIFICNCIA Os testes de significncia so os mais usados nas pesquisas educacionais, scio-econmicas, etc.
O procedimento para realizao dos testes de significncia resumido nos seguintes passos:
1) Enunciar as hipteses H0 e H1;
2) Fixar o limite de erro a, e identificar a varivel de teste;
3) Com o auxlio das tabelas estatsticas, considerando e a varivel do teste, determinar a RC
(regio crtica) e RA (regio de aceitao) para H0
4) Com os elementos amostrais, calcular o valor da varivel do teste;
5) Concluir pela aceitao ou rejeio de H0 pela comparao do valor obtido no passo
anterior com RA e RC.
3.2.1 TESTE DE SIGNIFICNCIA PARA MDIAS
1) H0: =0
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 62
H1: Uma das alternativas
0 (a)
0 (b)
0 (c)
2) Fixar . Admitindo-se que 2 desconhecida, a varivel do teste ser t de
Student, com = (n 1).
3) Com auxlio da tabela t determinam-se RA e RC.
4) Clculo do valor da varivel
onde:
X = Media amostral
0= Valor da hiptese nula
S= desvio padro amostral
n = tamanho da amostra
5) Concluses
a) Se -t/2 tcal t/2 no se rejeita H0
Se tcal> t/2 ou tcal t rejeita se H0
c) Se tcal -t no se rejeita H0
Se tcal
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 63
Resoluo
1) H0: =1.65m
H1: 1.65m
2) = 0,05
Varivel t com 19 graus de liberdade.
3) t/2=2,093
4)
=0,67
5) Como 2,093 tcal 2,093, no se pode rejeitar H0: = 115 com esse nvel de
significncia.
3.2.2 TESTE DE SIGNIFICNCIA PARA VARINCIAS 1) H0: 2= 20
H1: 2 20 (a)
2>20 (b)
2< 20 (c)
2) Fixar . Escolher a varivel qui-quadrado com = (n 1).
3)
4) Com auxlio da tabela 2 determinam-se RA e RC.
5) Clculo do valor da varivel
)
onde:
n = tamanho da amostra;
S2= varincia amostral;
2 = valor da hiptese nula.
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 64
6) Conclusoes:
a) Se 2inf 2cal 2sup no se pode rejeitar H0
Se 2cal> 2sup ou 2cal < 2inf rejeita se H0
b) Se 2cal 2sup no se pode rejeitar H0
Se 2cal> 2sup rejeita se H0
c) 2ca 2inf no se pode rejeitar H0
2ca 2inf rejeita se H0
Exemplo: Para testar a hiptese de que a varincia de uma populao 25, tirou-se uma
amostra aleatria de 25 elementos obtendo se S2=18,3. Admitindo-se = 0,1, efectuar o teste
de significncia unicaudal esquerda.
Resolucao:
1) H0: 2= 25
2< 25
2) = 0,01; varivel 2 com 25-1=24 graus de liberdade
3) 2inf=15.7
4) 2cal= )
=17,56
5) Como 2cal> 15.7, no se pode rejeitar H0: 2= 25 ao nvel de significncia de 10%.
3.2.3 TESTE DE SIGNIFICNCIA PARA PROPORES 1) H0: p=p0
H1: Uma das alternativas
p=p0 (a)
p>p0 (b)
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 65
p Z/2 ou Zcal Z regeita se H0
c) Se Zcal Z no se pode rejeitar H0
Se Zcal Z rejeita se H0
Exemplo:
As condies de mortalidade de uma regio so tais que a proporo de nascidos que
sobrevivem at 60 anos de 0,6. Testar essa hiptese ao nvel de 5% se em 1000 nascimentos
amostrados aleatoriamente, verificou-se 530 sobreviventes at 60 anos.
1) H0: p=0.6
H1: p
2) =0.05 e a varivel escolhida, a normal (0;1).
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 66
3) RA e RC
Z/2=1.96
4) Zcal=
)
=
)
=-4,51
5) Como Zcal , todavia, o mais comum
2) Fixar . Escolher a varivel F com (n1 1) graus de liberdade no numerador, e (n2 1)
graus de liberdade no denominador.
3)
4) Com auxlio da tabela da distribuio F, determinam-se RA e RC.
=(n-1)
5) Clculo do valor da varivel
Fcal=
6) Concluses
Se Fint Fsup no se pode rejeitar H0;
Se Fcal > Fsup ou Fcal < Fint, rejeita se H0
Exemplo
Dois programas de treinamento de funcionrios foram efectuados. Os 21 funcionrios treinados no programa antigo apresentam uma varincia 146 em suas taxas de erro. No novo programa,
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 67
13 funcionrios apresentaram uma varincia de 200. Sendo = 0,1, pode-se concluir que a varincia diferente para os dois programas?
1) H0: 21= 22
H1: 21 22
2) = 0,1. A varivel F com 1=n1-1=20 e 2=n2-1=12
3) RA e RC
Fint=0,43 e Fsup=2.54
4) Fcal=
=
=0.73
5 Como 0,43 Fcal2.54, no se pode rejeitar H, portanto, no se pode concluir que as varincias sejam diferentes em esse nvel de significncia.
3.2.5 TESTE DE SIGNIFICNCIA PARA A IGUALDADE DE DUAS MDIAS
1 Caso: As varincias so conhecidas, independentes e normais.
1) H0: 1=2 ou 1-2=d onde d>0 uma diferena admitida entre as medias.
H1: 1 2 ou 1-2 d
2) Fixar . Escolher a varivel normal padro: Z.
3) Com auxilio da tabela da distribuicao normal padro, determinar RA e RC.
4) Clculo do valor da varivel
Zcal =( X X )
5) Conclusoes
Se -Z/2ZcalZ/2 no se pode regeitar H0;
Se Zcal> Z/2 ou Zcal
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 68
Exemplo
Um fabricante de pneus produz dois modelos. Para o modelo A, = 2500 milhas, e para o
modelo B, = 3000 milhas. Um txi testou 50 pneus do modelo A e 40 do modelo B, obtendo
24000 milhas e 26000 milhas de durao mdia dos respectivos modelos. Adoptando-se um
risco = 0,04 testar a hiptese de que a vida mdia dos dois modelos a mesma.
Resolucao:
1) H0: A=B
H1: A B
2) =0.04, a varivel N(0;1)
3) RA e RC
Z/2=2.05
4) Zcal =
=-3,38
5) Como Zcal 0 uma diferena admitida entre as medias.
H1: 1 2 ou 1-2 d
2) Fixar . Escolher a varivel t, com =(n1+n2-2)
3) Com auxlio da tabela da distribuio t, determinam-se RA e RC.
4) Clculo do valor da varivel
-
Inferncia Estatstica
Autor: Filipe Mahaluca [email protected] 69
tcal =( X X )
5) Concluses
Se -t/2tcalt/2 no se pode rejeitar H0;
Se tcal> t/2 ou tcal < -t/2 , rejeita se H0.
Exemplo: Dois tipos de tinta foram testados sob as mesmas condies meteorolgicas. O tipo A
registou uma mdia de 80 com um desvio de 5 em 5 partes. O tipo B, uma mdia de 83 com um
desvio de 4 em 6 partes. Adoptando-se = 0,05 testar a hiptese da igualdade das mdias.
Resolucao:
1) H0: A=B
H1: A B
2) =0,05 e a varivel t