estatística inferencial (cap. 7 martins)
Post on 03-Jan-2016
106 Views
Preview:
DESCRIPTION
TRANSCRIPT
Estatística Inferencial (cap. 7 Martins)
• Estatística descritiva – trata da organização, sumarização e descrição dos dados
• Estatística inferencial – métodos que tornam possível a estimação de características de uma população baseadas nos resultados amostrais
• População é a totalidade de itens, objetos, ou pessoas sob consideração
• Amostra é uma parte da população que é selecionada
Amostragem
Amostragem aleatória simples – todos os elementos da população têm igual probabilidade de compor a amostra;
Se a população é finita, a escolha de uma amostra aleatória envolve a compilação de uma lista de todos os elementos da população, e a realização de sorteios para escolher os itens que irão compor a amostra
Níveis de mensuraçãoAs operações aritméticas e técnicas estatísticas admissíveis dependem do nível de mensuração da variável
Nível nominal – a variável pode assumir duas ou mais categorias. Ex.: estado civil, religião. Não é possível realizar operações aritméticas. Estas variáveis são chamadas de variáveis categóricas
Nível ordinal – quando as categorias mantêm uma relação de ordem. Ex.: escolaridade
Nível intervalar – além de manter uma ordem, os intervalos de medição são iguais. Ex.: peso, altura, volume. Permite operações aritméticas básicas.
Nível de razão – além das características do nível intervalar, o zero é real, é absoluto (não é arbitrário).
Medidas de posição e de dispersão
X =Soma dos valores de x
Número de observações =
Σ x
n
X
Dispersão Amostra (a) = 20, 19, 21
Amostra (b) = 30, 20, 10
Xa = 20 Xb = 20
O que interessa é o desvio em relação à média
Medidas de posição e de dispersão
X
Dispersão Amostra (a) = 20, 19, 21
Amostra (b) = 30, 20, 10
Xa = 20 Xb = 20
O que interessa é o desvio em relação à média, mas ......
A variância amostral (S²), de uma amostra de n medidas é igual à soma dos quadrados dos desvios dividido por (n-1)
S² = Σ (Xi –X)²
n-1
S = √S²
O desvio padrão (S),
Regra empírica
• O intervalo X ± S contém entre 60% e 80% de todas as observações amostrais
• O intervalo X ± 2S contém aproximadamente 95% de todas as observações amostrais
Coeficiente de variação de Pearson
Mede a dispersão relativa C.V = x 100 S
X
C.V < 15% baixa dispersão C.V > 30% alta dispersão
Escore padronizado
É outra medida relativa de dispersão Para uma medida Xi é dado por:
Zi = Xi –XS
Um escore negativo indica que Xi está à esquerda da média e positivo à direita
Exemplo: São dadas as médias e os desvios padrões das avaliações de duas disciplinas:Português Xp = 6,5 Sp = 1,2Matemática Xm = 5,0 Sm= 0,9
Relativamente às duas disciplinas, em qual delas obteve melhor desempenho um aluno que tirou 7,5 em português e 6,0 em matemática?
Utilizando escore padronizado teremos:
Zi = Xi –XS
Zp = 7,5 – 6,51,2
Zp = 0,83
Zm = 6,0 – 5,00,9
Zm = 1,11
Logo, o desempenho melhor foi em matemática, apesar da sua nota ter sido menor
3-3 Xp= 6,5 Xm = 5,0
0,83
7,5
1,11
6,0
OutliersObservações que fogem das dimensões esperadasConsiderar outliers as observações cujos escores padronizados sejam maiores do que 3, em valor absoluto
99,74 %
3-3
Distribuição normal padrão
Z=0 Zi
Uma tabela fornece a área em função de Z
Área = probabilidade
Z = X -
Exercício 1As alturas dos alunos de determinada escola são normalmente distribuídas com média 1,60 m e desvio padrão de 0,3 m. Encontre a probabilidade de um aluno medir entre 1,50 e 1,80m
Z = 0
= 1,60 = 0,30P (1,50 < X < 1,80) = P(Z1 < Z < Z2)
Z1Z2
Z = X -
Z1 = 1,50 – 1,60 0,3
Z1 = - 0,33 Z2 = 1,80 – 1,60 0,3
Z2 = 0,67
Solução
Exercício 1 - continuação
Z = 0Z1
Z2
Consultando a tabela:Área = 0,1293 p/Z1 = 0,33Área = 0,2486 p/Z2 = 0,67
Logo, Área total = 0,1293+ 0,2486Área = 0,3779 ouP (1,50 < X < 1,80) = 37,79%
As alturas dos alunos de determinada escola são normalmente distribuídas com média 1,60 m e desvio padrão de 0,3 m. Encontre a probabilidade de um aluno medir mais de 1,75 m
Exercício 2
X=1,60 1,75
Transformando em normal padrão
0 0,5
Consultando a tabela temos a área (amarela) que é 0,1915, logo a área azul será 0,5 – 0,1915 = 0,3085 A probabilidade de um aluno com mais de 1,75m é de 30,85%
Solução
As alturas dos alunos de determinada escola são normalmente distribuídas com média 1,60 m e desvio padrão de 0,3 m. Encontre a probabilidade de um aluno medir menos de 1,48 m
Exercício 3
1,48 1,60 -0,4 0
Z = 1,48 – 1,60
0,3
Z = - 0,4
Consultando a tabela temos a área igual (0,5 – 0,1554) = 0,3446A probabilidade de um aluno com menos de 1,48m é de 34,46%
Solução
As alturas dos alunos de determinada escola são normalmente distribuídas com média 1,60 m e desvio padrão de 0,3 m. Qual deve ser a medida mínima para escolhermos 10% dos mais altos?
Exercício 4
Solução
0 Z
10% mais altos, logo conhecemos a área e queremos determinar o valor de Z
Consultando a tabela para uma área igual a 0,40 (0,5-0,1) temos Z=1,28
Z = (X – 1,60)/ 0,3Logo X = (1,28x0,3) + 1,60
X = 1,98Assim, a medida mínima para
escolhermos os 10% mais altos é 1,98m
Inferência estatística
Inferência ou indução estatística
EstimadorParâmetro
populacional
Busca obter informações sobre a população a partir dos elementos amostrais
População Amostra
Inferência estatística
População
Amostra
xs
Inferência estatísticaPode ser feita por ponto ou por intervalo de confiançaExemplo: retira-se uma amostra aleatória de 500 brasileiros e calcula-se a média de suas alturas, encontrando-se 1,66. Uma estimativa pontual da verdadeira altura média (μ) é dada por X = 1,66m. Através do intervalo de confiança poder-se-ia encontrar um intervalo, por exemplo [1,58; 1,68] que, em 95% das vezes incluiria μ, o verdadeiro valor da média dos brasileiros
Intervalo de confiança
α = erro (nível de significância) 1- α = nível de confiançaα = 5% 1- α = 95%
1- α
-Z α/2 Z α/2
α/2α/2
Intervalo de confiança
O intervalo de confiança para a média populacional (μ) quando a variância (²) é conhecida
X - Zα/2 ≤ μ ≤ X + Zα/2√n
√n
P [ ]= 1- α
Exemplo: a duração da vida de uma peça é tal que horas. Foram amostradas 100 dessas peças obtendo-se a média de 500 horas. Deseja-se construir a verdadeira duração média da peça com um nível de 95%.
Solução
Do enunciado do problema se tem:n = 100 X = 500 (1- α)100 = 95%
95%
-Z α/2 = -1,96 Z α/2 = 1,96
2,5%2,5%
Para se encontrar o valor de Z α/2 entrou-se na tabela com 0,475
X - Zα/2 ≤ μ ≤ X + Zα/2√n
√n
P [ ]= 1- αSubstituindo os valores na fórmula abaixo
Solução Do enunciado do problema se tem:n = 100 X = 500 (1- α)100 = 95%
P[ 500 – 1,96. 5/√100 ≤ μ ≤ 500 + 1,96. 5/√100] = 95%
P[ 499,02≤ μ ≤ 500,98] = 95% Intervalo de confiança
Estimativa de intervaloEx.: O intervalo [ 1,60m; 1,64m] contém a altura média dos moradores do município X, com um nível de confiança de 95% .O risco do erro de inferência será de 5%, isto é, se tomarmos 100 amostras de tamanhos iguais, poderíamos esperar que 95 desses intervalos iriam conter o parâmetro populacional
1
2
3
4
5
6
99
100
AmostragemAmostra é um subconjunto da população que deve de fato representar toda a população
População
AmostraN
n
nN
= fração amostral
Tamanho da amostra para se estimar a média de uma população finita
n = Z .
d[ ]2
Amostragem
Z = abscissa da distribuição normal padrão
d = erro amostral, máxima diferença entre e x admissível
= desvio padrão da população
n = tamanho da amostra aleatória simples
Z = 1,96 para um nível de confiança de 95%
Z = 2,57 para um nível de confiança de 99% Z = 2,0 para um nível de confiança de 95,5%
ExemplosSuponha que a variável escolhida em um estudo seja o peso de uma certa peça, e que a população é infinita. O desvio padrão é de 10kg. Admitindo-se um nível de confiança de 95,5% e um erro amostral de 1,5 kg, qual deve ser o tamanho da amostra?
n = Z .
d[ ]2 Z = 2,0 d = 1,5 kg
= 10kg
n = tamanho da amostra aleatória simplesn =
2 . 101,5[ ]
2
= 178
Z = 2,0 para um nível de confiança de 95,5%
top related