aula 02
Post on 18-Nov-2015
40 Views
Preview:
DESCRIPTION
TRANSCRIPT
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
1
1 Caracterizao de uma Distribuio de Frequncias ............................................... 2
1.1 Medidas de Disperso .................................................................................................. 2
1.1.1 Varincia ......................................................................................................................... 2
1.1.2 Desvio Padro ............................................................................................................... 12
1.1.3 Coeficiente de Variao ................................................................................................ 13
1.1.4 Desvio Interquartlico ................................................................................................... 13
1.1.5 Amplitude...................................................................................................................... 14
1.1.6 Diagrama de Caixa ........................................................................................................ 14
1.2 Medidas de Assimetria ............................................................................................... 18
1.4 Medidas de Curtose .................................................................................................... 20
2 O Mnimo que Voc Precisa Saber ................................................................................ 22
3 Exerccios de Fixao ......................................................................................................... 23
4 Gabarito .................................................................................................................................. 28
5 Resoluo dos Exerccios de Fixao ........................................................................... 29
Aula 02
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
2
1 Caracterizao de uma Distribuio de Frequncias A distribuio de frequncias de uma varivel quantitativa pode ser caracterizada por grandezas numricas denominadas medidas da distribuio de frequncias. As medidas buscam sumarizar as informaes disponveis sobre o comportamento de uma varivel. As duas medidas estatsticas mais comuns so a mdia (medida de posio) e o desvio padro (medida de disperso). As medidas de posio foram estudadas na aula passada. A aula de hoje aborda as medidas de disperso, que caracterizam a variabilidade dos dados em torno da regio central da distribuio, e as medidas de assimetria e curtose. 1.1 Medidas de Disperso Pense na seguinte situao: uma pessoa faz quatro refeies por dia, enquanto que outra no faz nenhuma refeio por dia. Na mdia, ambas fazem duas refeies por dia. Isto quer dizer que os dois indivduos esto bem alimentados? A resposta bvia no. para isso que servem as medidas de disperso, isto , medidas de como os dados esto agrupados: mais ou menos prximos entre si (mais ou menos dispersos). As medidas de disperso indicam o quanto os dados se apresentam dispersos em torno da regio central. Desta forma, caracterizam o grau de variabilidade existente nos dados. As seguintes medidas de disperso nos interessam: a varincia, o desvio padro, o coeficiente de variao e o desvio interquartlico. 1.1.1 Varincia A varincia de um conjunto de valores },...,,{ 21 nxxxX = pode ser calculada pela frmula
(1) =
=n
i
ix xxn
s1
22 )(1
em que 2xs denota a varincia e x representa a mdia aritmtica. Neste curso,
tambm utilizaremos a notao Var(X) para a varincia do conjunto X. Se os valores distintos kxxx ,...,, 21 ocorrerem com as frequncias kfff ,...,, 21 (
=
=k
i
i nf1
), respectivamente, a varincia ser dada por (*)
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
3
(2) =
=k
i
iix xxfn
s1
22 )(1
.
(*) Em (1) e (2), consideramos que os dados se referem a uma populao finita. Caso os dados estejam associados a uma amostra, o fator n (= fi) que aparece no denominador do lado direito de (1) e (2) deve ser substitudo por (n1). A justificativa para o uso do fator (n1) foge ao escopo desta aula porque trata-se de um problema de inferncia estatstica. Contudo, o erro cometido quando calculamos a varincia amostral pela frmula (1) (ou (2)) pequeno para grandes valores de n (digamos n>30).
Considere o conjunto de observaes },...,,{ 21 nxxxX = . A varincia tem as seguintes propriedades:
Seja o novo conjunto Y=cX={cx1, cx2,..., cxn}, em que c um valor fixo. Ento a varincia de Y igual a c elevado ao quadrado vezes a varincia de X: Var(Y) = c2Var(X).
Seja o novo conjunto W=c+X={c+x1, c+x2,..., c+xn}, em que c um valor fixo. Ento a varincia de W=c+X igual a varincia de X (*): Var(W) = Var(X).
(*) A varincia de um valor fixo nula. A frmula (1) pode ser reescrita na forma
22
2
2 111)( xxn
xn
xn
XVari
i
i
i
i
i
=
= ,
ou seja, como a diferena entre a mdia aritmtica dos quadrados dos valores e o quadrado da mdia aritmtica dos valores:
Varincia = Mdia dos Quadrados Quadrado da Mdia. A varincia amostral tambm pode ser reescrita em uma forma anloga:
2
1
2
1
2
11
1)(
1
1)( x
n
nx
nxx
nXVar
n
i
i
n
i
i
=
= ==
ou
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
4
2
1
2
11
1)( x
n
nxf
nXVar
n
i
ii
= =
caso os valores distintos kxxx ,...,, 21 ocorram com as frequncias kfff ,...,, 21 (
=
=k
i
i nf1
).
Varincia Amostral = Soma dos Quadrados/(n1) Quadrado da Mdia corrigido pelo fator n/(n1) EXEMPLO. Julgue o item a seguir. Considere o conjunto de dados {2, 5, 8, 11, 14}. Ento a varincia desse conjunto menor que 20. Resoluo A mdia do conjunto
85
1411852=
++++=x
e a varincia
185
)814()811()88()85()82()( 222222
2 =++++
=
= n
xxs
i
x Item certo.
Tambm podemos usar a frmula "maceteada" da varincia:
Varincia = Mdia dos Quadrados Quadrado da Mdia = 221
xxn i
i
Sequncia de clculos: 1) Mdia dos quadrados:
825
410
5
1411852122222
2 ==++++
=i
ixn
.
2) Quadrado da mdia:
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
5
6481 22
2
===
xxn i
i .
Ento, 3) 1864822 ==xs (mesmo resultado!).
GABARITO: C Exemplo (ATRFB/ESAF/2012): A varincia da amostra formada pelos valores 2, 3, 1, 4, 5 e 3 igual a A) 3
B) 2
C) 1
D) 4
E) 5
Resoluo A questo pede que voc calcule a varincia de uma amostra (ou varincia amostral). Ento a frmula a ser utilizada a verso corrigida de (14), em que o denominador do lado direito da igualdade (n1):
=
=k
i
iix xxfn
s1
22 )(1
1
Clculo da mdia:
valor (x) frequncia (fi) xi.fi xi2.fi
1 1 1x1 = 1 12x1 = 1 2 1 2x1 = 2 22x1 = 4 3 2 3x2 = 6 32x2 = 18 4 1 4x1 = 4 42x1 = 16 5 1 5x1 = 5 52x1 = 25 fi = n = 6 xi.fi = 18 xi2.fi = 64
36
18
6
)15()14()23()12()11(1
1
==++++
== =
k
i
ii fxn
x
Clculo da varincia amostral:
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
6
5
])35(1[])34(1[])33(2[])32(1[])31(1[)(
1
1 22222
1
22 ++++=
= =
k
i
iix xxfn
s
25
410142 =++++
=xs opo B
A varincia amostral tambm pode ser calculada pela frmula,
Varincia Amostral = Soma dos Quadrados/(n1) Quadrado da Mdia corrigido pelo fator n/(n1)
25
10
5
5464
5
96
5
64
11
1 2
1
22 ==
=
=
= =
xn
nxf
ns
n
i
iix
GABARITO: B Varincia Combinada Considere o conjunto de dados A com NA elementos, mdia A e varincia
2
As e
o conjunto B com NB elementos, mdia B e varincia 2
Bs . Pode-se demonstrar que a varincia da populao conjunta A+B, tambm denominada varincia combinada ou global, dada por
222
2
+
+
++
+= +
BABABA
BANN
BA
NN
B
NN
As .
Fazendo N = NA + NB, obtemos
222
2
++= +
N
BA
N
B
N
As BA .
Exemplo (REFAP/Cesgranrio/2007): O setor de recursos humanos de uma empresa tem o hbito de divulgar separadamente a mdia e a varincia das notas das avaliaes dos funcionrios do sexo feminino e do masculino. Na ltima avaliao, os resultados obtidos foram:
Feminino Masculino Nmero de funcionrios 20 30
Mdia 6 7 Varincia 3,4 4
A mdia e a varincia das notas dos funcionrios dessa empresa, respectivamente, valem:
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
7
A) 6,5 e 3,7
B) 6,6 e 3,4
C) 6,6 e 4,0
D) 7,5 e 3,7
E) 13,0 e 7,5
Resoluo Dados: NA = 20, 6=A e 4,3
2 =As (conjunto feminino); NB = 30, 7=B e 0,42 =Bs
(conjunto masculino). A mdia global ou mdia das mdias dada pela mdia ponderada das mdias dos conjuntos:
.6,63020
730620=
++
=++
=+BA
BABA
NN
BNANX
O resultado acima j nos permite eliminar as opes A, D e E. Restaram as alternativas B e C. A varincia combinada dada por
222
2
++= +
N
BA
N
B
N
As BA .
Calcularemos a varincia combinada se soubermos os valores das somatrias
A (soma de A), B (soma de B), 2A (soma dos quadrados de A) e 2B (soma dos quadrados de B).
A mdia do conjunto A 6 120620
== AA
(soma de A = 120).
A mdia do conjunto B 7 210730
== BB
(soma de B = 210).
A varincia de A 3,4. Ento,
4,3920
4,3620
4,320
4,3
2
2
2
2
222
2 ====
= AAAA
N
A
N
As
AA
A
7884,39202 == A (soma dos quadrados de A = 788).
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
8
A varincia de B 4,0. Logo,
0,5330
0,4730
0,430
0,4
2
2
2
2
222
2 ====
= BBBB
N
B
N
Bs
BB
B
590.153302 ==B (soma dos quadrados de B = 1.590). Finalmente, temos que
2
22222
2 6,656,4750
330
50
378.2
50
210120
50
590.1
50
788=
=
++=
++= +
N
BA
N
B
N
As BA
0,456,4356,472 ==+BAs varincia combinada = 4,0. GABARITO: C Nota: se as mdias dos conjuntos A e B forem iguais, ou seja, se BA = , a varincia combinada pode ser calculada por meio da frmula simplificada
N
sNsN
NN
sNsNs BBAA
BA
BBAABA
22222 +=
++
=+ ,
em que N = NA + NB. Repare que trata-se de uma mdia ponderada das varincias individuais. Ateno: a frmula acima um caso particular da frmula anterior da varincia combinada. Voc s poder aplic-la quando as mdias dos conjuntos A e B forem iguais! Exemplo. Sejam os conjuntos de nmeros {2, 5, 8, 11, 14} e {2, 8, 14}, Assinale a opo com a varincia dos conjuntos combinados ou reunidos. A) 8
B) 20,25
C) 18
D) 24
E) 22
Resoluo Temos a srie estatstica A = {2, 5, 8, 11, 14} com mdia
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
9
85
40
5
1411852==
++++=A
e a srie B = {2, 8, 14} com mdia
83
24
3
1482==
++=B .
Como as mdias so iguais, podemos aplicar a frmula simplificada
N
sNsNs BBAABA
222 +=+ .
Varincia do 1 conjunto:
.185
)814()811()88()85()82()( 222222
2 =++++
=
= A
AN
AAs
Varincia do 2 conjunto: .243
)814()88()82()( 2222
2 =++
=
= B
BN
BBs
Varincia combinada: .25,2035
2431852 =+
+=+BAs
GABARITO: B Varincia de Dados Agrupados em Intervalos de Classe Como j visto, quando os dados so apresentados em uma distribuio de frequncias, todos os valores includos num certo intervalo de classe so considerados coincidentes com o ponto mdio do intervalo. As frmulas (1) e (2)
==
==n
i
i
n
i
i xxn
xxn
XVar1
22
1
2 1)(1
)(
===
===k
i
ii
k
i
ii
k
i
ii xpxxfxn
xxfn
XVar1
22
1
22
1
2 1)(1
)(
sero vlidas para esses dados agrupados quando se interpretar ix como o
ponto mdio e if ( nfk
i
i ==1
, 11
==
k
i
ip ) como a frequncia de classe
correspondente.
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
10
Exemplo. Seja a distribuio em classes de frequncia dada na Tabela 5. Temos que
Tabela 7: clculo da varincia.
Classe (limites reais) i
f ix ii fx ii fx2
40,0 45,0 6 42,5 255,0 10.837,5
45,0 50,0 16 47,5 760,0 36.100,0
50,0 55,0 32 52,5 1.680,0 88.200,0
55,0 60,0 24 57,5 1.380,0 79.350,0
60,0 65,0 14 62,5 875,0 54.687,5
65,0 70,0 6 67,5 405,0 27.337,5
70,0 75,0 2 72,5 145,0 10.512,5
Total n = 100 5.500 307.025,0
Vimos que,
0,55100
500.5===
n
fxx
ii .
Logo,
Varincia 25,450,025.325,070.355100
025.3071 2
1
222 ==== =
k
i
iix xfxn
s
J caiu em prova! (Papiloscopista PF/CESPE-UnB/2004) Classificao mnimo 1 quartil mediana mdia 3 quartil mximo varincia
A 20 25 27,5 30 32,5 50 49
B 18 23 32 33 42 52 100
A ou B x y z 31 w u v
De acordo com um levantamento estatstico, a mdia das idades de um grupo de presidirios igual a 31 anos de idade. Nesse levantamento, os presidirios foram classificados como A ou B, dependendo da sua condio psicossocial. Constatou-se que a mdia das idades dos presidirios classificados como A menor que a mdia das idades dos presidirios classificados como B. A tabela
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
11
acima apresenta algumas medidas estatsticas obtidas por meio desse levantamento. A partir das informaes acima, julgue os itens que se seguem. O nmero de presidirios classificados como A igual ao dobro do nmero de presidirios classificados como B. Resoluo Dados: 30=A , 33=B . Mdia das mdias ( X ):
BA
BA
nn
BnAnX
++
= BA
BA
nn
nn
++
=3330
31 BA nn 2=
em que
An e Bn denotam o nmero de presidirios classificados como A e o nmero de presidirios classificados como B, respectivamente. Logo, correto afirmar que o nmero de presidirios classificados como A igual ao dobro do nmero de presidirios classificados como B. GABARITO: C O valor de v est entre 65 e 75. Resoluo A varincia combinada v dada por
222
2
+
+
++
+== +
BABABA
BAnn
BA
nn
B
nn
ASv
30=A 30=An
A BA nnA 6030 == , pois BA nn 2=
33=B 33=Bn
B BnB 33=
492 =AS 492
2
= An
A
A
9493049 22
=+=An
A BA nnA 1898949
2 ==
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
12
1002 =BS 1002
2
= Bn
B
B
118933100 22
=+=Bn
B BnB 1189
2 =
6896110293133,39667,6323
3360
3
1189
3
1898 22
2 ==+=
++== +
B
BB
B
B
B
BBA
n
nn
n
n
n
nSv
Ento certo afirmar que 65 < v = 68 < 75. GABARITO: C Valores de x e u so, respectivamente, iguais a 19 e 51 anos de idade. Resoluo O levantamento estatstico no deixa dvida de que o valor mnimo de A ou B x = 18 e o valor mximo de A ou B u = 52. Item errado. GABARITO: E 1.1.2 Desvio Padro O desvio padro mede a disperso absoluta de um conjunto de dados. dado pela raiz quadrada positiva da varincia:
(3) 2xx ss += .
O desvio padro est na mesma unidade da varivel e indica, em mdia, qual ser o erro (desvio) cometido ao tentar substituir cada observao pela mdia do conjunto de dados. Nota: tambm utilizaremos a notao DP(X) (ou EP(X)) para o desvio padro (ou Erro Padro) do conjunto X. Exemplo. Determine o desvio padro do conjunto 2, 5, 8, 11, 14. Vimos que esse conjunto possui varincia igual a 18. Logo, 24,418 =xs .
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
13
Considere o conjunto de valores },...,,{ 21 nxxxX = . O desvio padro tem as seguintes propriedades:
Seja o conjunto Y=cX={cx1, cx2,..., cxn}, em que c um valor fixo. Ento o desvio padro de Y igual a c vezes o desvio padro de X: DP(Y) = c.DP(X).
Seja o novo conjunto W=c+X={c+x1, c+x2,..., c+xn}, em que c um valor fixo. Ento o desvio padro de W = c+X igual ao desvio padro de X: DP(W) = DP(X)
1.1.3 Coeficiente de Variao O coeficiente de variao definido como o quociente entre o desvio padro e a mdia, sendo frequentemente expresso em porcentagem (*):
(4) x
XDPxcv
)()( =
O coeficiente de variao mede a disperso relativa dos dados. Utiliza-se o coeficiente de variao na comparao do grau de concentrao em torno da mdia para duas ou mais sries distintas. (*) Logo, podemos dizer que o coeficiente de variao um adimensional. Exemplo. Determine o coeficiente de variao do conjunto 2, 5, 8, 11, 14.
O conjunto tem mdia 8 e desvio padro 4,24. Portanto, %5353,08
24,4)( ==xcv .
1.1.4 Desvio Interquartlico O desvio interquartlico (ou amplitude interquartil ou intervalo interquartlico) definido como (5) 13 QQdQ = ,
em que Qd denota o desvio interquartlico, 3Q o terceiro quartil (ou quartil
superior) e 1Q o primeiro quartil (ou quartil inferior).
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
14
A amplitude interquartil pode ser usada como uma medida de disperso. Em distribuies mais dispersas, os valores dos quartis ficam mais distantes. Em distribuies simtricas, a distncia entre o quartil inferior e a mediana igual distncia entre a mediana e o quartil superior, enquanto que em distribuies assimtricas essas distncias so diferentes. O intervalo interquartlico no influenciado por valores extremos (outliers). Exemplo. O primeiro e o terceiro quartis da distribuio das alturas dos estudantes da Universidade de So Paulo so 165,56 cm e 178,59 cm, respectivamente. Calcule o desvio interquartlico dessa distribuio.
03,1356,16559,17813 === QQdQ cm.
1.1.5 Amplitude A amplitude total (R) definida como a diferena entre o maior valor e o menor valor do conjunto de dados: (6) minmax xxR = . A amplitude altamente influenciada por valores extremos (outliers) porque se baseia somente em duas observaes. Exemplo. A amplitude do conjunto 3, 3, 4, 5, 5, 6, 7, 7, 7, 10 10 3 = 7. 1.1.6 Diagrama de Caixa Um diagrama de caixa ou box plot ou caixa-de-bigodes um retngulo que representa o desvio interquartlico (IQR) ( a estatstica Qd definida
por (5)). Para construir esse diagrama (veja a prxima figura), consideramos um retngulo onde esto representados a mediana, o primeiro quartil (Q1) e o terceiro quartil (Q3). A partir do retngulo, para cima, segue uma linha at o ponto mais remoto que no pode exceder LS = Q3 + 1,5.IQR, chamado limite superior. De modo anlogo, a partir do retngulo, para baixo, segue uma linha at o ponto mais remoto que no seja menor que LI = Q1 1,5.IQR, chamado limite inferior. Os valores compreendidos entre esses dois limites so chamandos valores adjacentes. As observaes que estiverem acima do limite superior ou abaixo do limite inferior sero denominadas pontos exteriores. Essas observaes so destoantes das demais e podem ou no ser o que chamamos de outliers ou valores atpicos (*)1. Um outlier pode ser produto de um erro de observao ou de arredondamento. Contudo, as
1 BUSSAB, Wilton de O.; MORETTIN, Pedro Alberto. Estatstica Bsica. So Paulo: Ed. Saraiva, 2010.
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
15
denominaes pontos exteriores e outliers so frequentemente usadas com o mesmo significado por alguns autores2: observaes fora de lugar, discrepantes ou atpicas. (*) A mdia aritmtica sensvel a outliers. Um nico valor ruim do conjunto de dados pode distorcer a mdia, ou seja, pode mover a mdia para longe do centro da distribuio de frequncias. As mdias geomtrica e harmnica, assim como a aritmtica, tambm no so robustas a outliers. O box plot nos d uma noo da posio, disperso, assimetria, caudas e dados discrepantes da distribuio. A posio central dada pela mediana e a disperso por IQR. As posies relativas de Q1, Q2 e Q3 nos do uma idia da assimetria da distribuio. Os comprimentos das caudas so dados pelas linhas que vo do retngulo aos valores remotos e pelos valores atpicos. Os comprimentos das caudas so dados pelas linhas que vo do retngulo aos valores remotos e pelos valores atpicos.
Exemplo. Considere um conjunto de dados com os seguintes percentis:
0% 25% 50% 75% 100% 1,7524 4,6901 5,7004 6,1768 7,3658
2 MONTGOMERY, Douglas C.; RUNGER, George C. Estatstica Aplicada e Probabilidade para Engenheiros. Rio de
Janeiro: LTC, 2008.
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
16
A prxima figura um box plot do conjunto de dados que gerou a tabela de percentis acima. A cauda inferior longa e isto indica que a distribuio assimtrica. Note tambm a presena de outliers na parte inferior do box plot (so os pontos vermelhos).
A figura abaixo mostra o histograma associado ao box plot do exemplo.
_______________________________________________________ A prxima figura refora a relao do box plot com o histograma. A distribuio da esquerda simtrica, enquanto que a da direita assimtrica.
1
2
3
4
5
6
7V
alo
res
1 2 3 4 5 6 7 80
10
20
30
40
50
60
70
80
90
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
17
25% 25%
25%25%
Qi md Qs
25% 25%
25%25%
Os box plots da figura abaixo mostram a comparao dos tamanhos das ptalas em duas amostras das espcies de flor-de-lis versicolor e virginica3.
A existncia de um outlier nos dados da espcie versicolor indicada pelo ponto vermelho na parte inferior esquerda da figura.
3 Conjunto de dados de Fisher.
versicolor virginica
3
3.5
4
4.5
5
5.5
6
6.5
7
Valo
res
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
18
1.2 Medidas de Assimetria Assimetria o grau de desvio, ou afastamento da simetria, de uma distribuio. As distribuies alongadas direita so ditas positivamente assimtricas, e as alongadas esquerda, negativamente assimtricas. Uma medida conveniente de assimetria, por ser adimensional, dada pelo coeficiente de assimetria (A)
(7) 3
3
1
3
3)(
11
x
n
i
i
x s
mxx
nsA ==
=
em que =
=n
i
i xxn
m1
3
3 )(1
denota o momento centrado de terceira ordem e
3
xs o cubo do desvio padro. O coeficiente de assimetria (7) indica o sentido da assimetria e pode ser usado para comparar vrios casos porque adimensional. O sinal do coeficiente de assimetria ser positivo ou negativo se a distribuio for assimtrica direita ou esquerda, respectivamente. A assimetria tambm pode ser medida pelo primeiro coeficiente de assimetria de Pearson
(8) x
ps
moxA
=1
em que x a mdia, mo denota a moda e xs o desvio padro. Para evitar o emprego da moda em (8), pode-se adotar a frmula emprica
(mdia moda) = 3(mdia - mediana), de forma que (8) pode ser reescrita como
x
ps
mdxA
)(32
=
conhecida como segundo coeficiente de assimetria de Pearson. Uma outra medida de assimetria, denominada coeficiente quartlico de assimetria ( qA ), definida pela frmula
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
19
(9) 13
13 2
QQ
QmdQAq
+= .
Exemplo (IPEA/FCC/2004). Numa distribuio de frequncias com assimetria negativa mais de 50% dos dados situam-se A) sobre a mdia B) acima da mdia C) entre a mdia e a moda D) entre a mdia e a mediana E) acima da mediana Resoluo A prxima figura ilustra uma Distribuio de Frequncias com Assimetria Negativa ou Esquerda:
Observe que
Mdia < Mediana < Moda Bizu: na assimetria negativa, voc deve puxar a seta com a mo esquerda, de forma que:
1) a seta puxa a mdia;
2) a moda est no topo; e
3) a mediana est no meio.
0
1
2
3
4
5
6
7
8
0 a 10 10 a 20 20 a 30 30 a 40 40 a 50
Moda
Mediana
Mdia
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
20
Uma distribuio de frequncias com assimetria negativa alongada esquerda. A mediana o valor que divide a distribuio ao meio, deixando os 50% menores valores de um lado e os 50% maiores valores do outro lado. Logo, numa distribuio de frequncias com assimetria negativa, mais de 50% dos dados esto acima da mdia (pois a mdia menor do que a mediana). Assimetria Positiva ou Direita: Mdia > Mediana > Moda ou Moda < Mediana < Mdia
Bizu: na assimetria positiva ou direita, voc deve puxar a seta com a mo direita, de modo que:
1) a seta puxa a mdia;
2) a moda est no topo; e
3) a mediana est no meio.
GABARITO: B 1.4 Medidas de Curtose As medidas de curtose visam caracterizar a forma da distribuio quanto ao seu achatamento. A referncia para comparao dada pela distribuio normal, modelo probabilstico terico de grande aplicao prtica (*). Diz-se que a distribuio normal mesocrtica (veja a figura
0
1
2
3
4
5
6
7
8
9
0 a 10 10 a 20 20 a 30 30 a 40 40 a 50
Moda
Mediana
Mdia
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
21
abaixo). As distribuies mais achatadas que a normal so platicrticas e as menos achatadas so leptocrticas. (*) No fique preocupado se voc no conhece a curva normal. Neste momento, basta que voc saiba que o formato da curva normal lembra um sino.
Platicrtica
Mesocrtica
(normal)
Leptocrtica
A caracterizao do achatamento de uma distribuio s tem sentido se a distribuio for aproximadamente simtrica. Entre as possveis medidas de achatamento, temos o coeficiente do momento de curtose (a4), definido como a razo entre o momento centrado de quarta ordem e a quarta potncia do desvio padro:
(10) .4
44
xs
ma =
Esse coeficiente adimensional, sendo menor que trs para as distribuies platicrticas, igual a trs para a normal e maior que trs para as distribuies leptocrticas. Outra medida de curtose tambm empregada, denominada coeficiente percentlico de curtose, baseia-se nos quartis e percentis e definida por:
(11) 1090 PP
QK
=
em que Q a metade da distncia interquartlica, ou seja, Q = (Q3 - Q1)/2.
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
22
2 O Mnimo que Voc Precisa Saber
- Varincia = Mdia dos Quadrados Quadrado da Mdia = 221
xxn i
i
- Varincia amostral: 21
2
1
2
11
1)(
1
1)( x
n
nx
nxx
nXVar
n
i
i
n
i
i
=
= ==
- Varincia combinada dos conjuntos A e B: 222
2
++= +
N
BA
N
B
N
As BA
- Desvio Padro = Raiz Quadrada positiva da Varincia.
- Coeficiente de variao: x
XDPxcv
)()( = .
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
23
3 Exerccios de Fixao (BACEN-rea 4/Cesgranrio/2010) Considere as informaes a seguir para responder s questes de nos 1 a 3. A viabilidade financeira do projeto de uma microempresa leva em considerao dados histricos de 100 projetos semelhantes. A tabela abaixo mostra a distribuio de frequncias do VPL Valor Presente Lquido (valores em milhes de reais) de um conjunto de microempresas similares.
VPL Frequncia Relativa
-10 < x 0 10%
0 < x 10 80%
10 < x 20 10% 1. Utilizando os dados histricos acima, o valor esperado para o VPL da microempresa, em milhes de reais, (A) -10
(B) 0
(C) 5
(D) 10
(E) 20
2. Segundo os dados histricos, o valor, em milhes de reais, que mais se aproxima do desvio padro do VPL da microempresa (A) 1
(B) 2
(C) 2,5
(D) 4
(E) 4,5
3. Um projeto alternativo para o investidor apresenta um VPL esperado, em reais, de 6 milhes e um risco (desvio padro) de 2 milhes. Pela tica do risco relativo, qual o melhor investimento, a microempresa ou o projeto alternativo? (A) A microempresa, pois apresenta um Coeficiente de Variao maior.
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
24
(B) A microempresa, pois apresenta um Coeficiente de Variao menor.
(C) O projeto alternativo, pois apresenta um Coeficiente de Variao maior.
(D) O projeto alternativo, pois apresenta um Coeficiente de Variao menor.
(E) indiferente, pois os investimentos apresentam Coeficientes de Variao iguais.
(ANACrea 7/CESPE-UnB/2012) Com base no histograma acima apresentado, julgue os itens a seguir. 4. Considerando que o histograma mostra a distribuio dos voos de certo aeroporto por distncia voada, correto afirmar que a distncia mdia dos voos desse aeroporto superior a 150 milhas nuticas. 5. Os quartis das distncias voadas (em milhas nuticas) obtidos a partir do grfico so: 1o quartil = 100,0; 2o quartil (mediana) = 150,0; e 3o quartil = 200,0.
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
25
nota contagem
0 27
1 6
2 5
3 7
4 2
5 3
Considerando que uma pesquisa de satisfao referente a um novo terminal de passageiros tenha sido realizada com 50 pessoas e o resultado em uma amostra de notas conforme apresentado na tabela acima, julgue os itens seguintes. 6. A mdia geomtrica da distribuio das notas foi superior mdia aritmtica. 7. A varincia amostral das notas atribudas pelos passageiros foi superior a 2,4. (Analista Judicirio-TST/CESPE-UnB/2007/Adaptada) Considere que, em um ambiente de trabalho industrial, as seguintes medies acerca da poluio do ar tenham sido observadas: 1, 6, 4, 3, 2, 3, 1, 5, 1, 4. Nessas situao, julgue os itens que se seguem. 8. A mediana da amostra igual a 2,5. 9. As mdias harmnica e geomtrica so ambas inferiores a 3. 10. O terceiro quartil igual a 3. 11. A varincia amostral superior a 2,8.
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
26
Varivel X Frequncia relativa
0 0,10
1 0,20
2 0,30
3 0,40
(SEAD-CPC/Cespe-UnB/2007/Adaptada) Considerando a tabela acima, que apresenta as freqncias relativas de uma varivel X, relativa a uma contagem, julgue os itens a seguir. 12. A mdia de X inferior a 1,5. 13. O desvio-padro de X inferior a 1,5. 14. A moda e a mediana de X so iguais a 3. 15. O coeficiente de variao de X superior a 1. (MI-CENAD/ESAF/2012/Adaptada) A distribuio de frequncias em classes do salrio mensal x, medido em nmero de salrios mnimos, de uma amostra aleatria de 50 funcionrios de uma empresa, apresentado a seguir.
x f
mais de 0 a 10 22
mais de 10 a 20 13
mais de 20 a 30 10
mais de 30 a 40 3
mais de 40 a 50 2
16. Usando os dados acima, obtenha o valor mais prximo da varincia amostral do salrio mensal. (A) 121,5
(B) 124
(C) 126,5
(D) 129
(E) 131,5
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
27
17. (ATRFB/ESAF/2012) A varincia da amostra formada pelos valores 2, 3, 1, 4, 5 e 3 igual a (A) 3
(B) 2
(C) 1
(D) 4
(E) 5
(ANCINE/CESPE-UnB/2013) Considerando os mtodos descritivos, julgue os itens a seguir. 18. Suponha que A = 5 x I, em que A e I representam, respectivamente, a amplitude total e o intervalo interquartlico de um conjunto de dados. Em face dessa hiptese, sabendo que no existem outliers no extremo inferior da distribuio, infere-se que a distribuio desses dados simtrica. 19. Para o conjunto de dados 1, 1, 1, , 1, 1, 1, o desvio mediano absoluto, que se define como | , , |, positivo.
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
28
4 Gabarito
1 C 2 E 3 D 4 C 5 C 6 E 7 C 8 E
9 C 10 E 11 C 12 E 13 C 14 E 15 E 16 C
17 B 18 E 19 E
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
29
5 Resoluo dos Exerccios de Fixao (BACEN-rea 4/Cesgranrio/2010) Considere as informaes a seguir para responder s questes de nos 1 a 3. A viabilidade financeira do projeto de uma microempresa leva em considerao dados histricos de 100 projetos semelhantes. A tabela abaixo mostra a distribuio de frequncias do VPL Valor Presente Lquido (valores em milhes de reais) de um conjunto de microempresas similares.
VPL Frequncia Relativa
-10 < x 0 10%
0 < x 10 80%
10 < x 20 10% 1. Utilizando os dados histricos acima, o valor esperado para o VPL da microempresa, em milhes de reais, (A) -10
(B) 0
(C) 5
(D) 10
(E) 20
Resoluo A questo pede para voc calcular o valor esperado ou mdia de uma distribuio de frequncias de dados numricos agrupados em intervalos de classe. Quando os dados numricos so apresentados em uma distribuio de frequncias, todos os valores includos num certo intervalo de classe so considerados coincidentes com o ponto mdio do intervalo. Utilizemos a seguinte notao: VPL = X, XVPLE =)( (valor esperado de VPL = mdia de X). Clculo de E(VPL):
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
30
=
=++=++==3
1
0,55,10,45,0)1,015()8,05()1,05(i
ii pXX
A memria de clculos ilustrada pela tabela a seguir.
VPL Xi (ponto mdio do intervalo)
Freq. Relativa (pi)
Xipi
-10 < x 0 -5 0,1 -0,5
0 < x 10 5 0,8 4,0
10 < x 20 15 0,8 1,5
Total Xipi = 5,0
GABARITO: C 2. Segundo os dados histricos, o valor, em milhes de reais, que mais se aproxima do desvio padro do VPL da microempresa (A) 1
(B) 2
(C) 2,5
(D) 4
(E) 4,5
Resoluo Deve-se calcular o desvio padro de uma distribuio de frequncias de dados numricos agrupados em intervalos de classe. Quando os dados numricos so apresentados em uma distribuio de frequncias, todos os valores includos num certo intervalo de classe so considerados coincidentes com o ponto mdio do intervalo. Utilizemos a seguinte notao:
VPL = X;
XVPLE =)( (valor esperado de VPL = mdia de X)
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
31
Var(VPL) denota a varincia de VPL; e
DP(VPL) representa o desvio padro de VPL.
DP(VPL) = raiz quadrada positiva de Var(VPL). Clculo de DP(VPL):
=
==++==3
1
22222 20254525)1,015()8,05()1,05()(i
ii XpXVPLVar
5,447,420)()( === VPLVarVPLDP
GABARITO: E 3. Um projeto alternativo para o investidor apresenta um VPL esperado, em reais, de 6 milhes e um risco (desvio padro) de 2 milhes. Pela tica do risco relativo, qual o melhor investimento, a microempresa ou o projeto alternativo? (A) A microempresa, pois apresenta um Coeficiente de Variao maior.
(B) A microempresa, pois apresenta um Coeficiente de Variao menor.
(C) O projeto alternativo, pois apresenta um Coeficiente de Variao maior.
(D) O projeto alternativo, pois apresenta um Coeficiente de Variao menor.
(E) indiferente, pois os investimentos apresentam Coeficientes de Variao iguais.
Resoluo A questo pede que voc compare os riscos de dois projetos. Pela tica do risco relativo, o melhor investimento aquele que apresenta a distribuio de frequncias com menor disperso em torno do valor esperado. Observe que essa comparao no pode ser feita com o desvio padro, pois essa medida no mede a disperso relativa dos dados. A comparao dos riscos deve ser efetuada por meio do Coeficiente de Variao (CV). Pela tica do risco relativo, o melhor investimento o que possui VPL com o menor Coeficiente de Variao. O coeficiente de variao definido como o quociente entre o Desvio Padro (DP) e a mdia ( X ), sendo frequentemente expresso em porcentagem:
X
XDPXCV
)()( = .
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
32
Clculo do CV para o investimento microempresa (denotado por X1):
894,05
47,4)()(
1
11 ===
X
XDPXCV
Clculo do CV para o investimento alternativo (denotado por X2): Dados: DP(X2) = 2 e E(X2) = 6.
333,06
2)()(
2
22 ===
X
XDPXCV
Como CV(X2) < CV(X1), o melhor investimento, pela tica do risco relativo, o projeto alternativo, pois apresenta um Coeficiente de Variao menor. GABARITO: D
(ANACrea 7/CESPE-UnB/2012) Com base no histograma acima apresentado, julgue os itens a seguir. 4. Considerando que o histograma mostra a distribuio dos voos de certo aeroporto por distncia voada, correto afirmar que a distncia mdia dos voos desse aeroporto superior a 150 milhas nuticas. Resoluo
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
33
A mdia aritmtica, ou mdia, de um conjunto de n nmeros nXXX ,...,, 21 definida por (leia-se X barra)
==+++==
Xn
Xnn
XXXX
n
i
in 11...
1
21
Se k valores distintos observados kXXX ,...,, 21 ocorrerem com as frequncias
kfff ,...,, 21 ( nfk
i
i ==1
), respectivamente, a mdia ser
==
=
= ===+++++
+++++=
k
i
ii
k
i
iik
i
i
k
i
ii
ki
kkii XpXfn
f
Xf
ffff
XfXfXfXfX
11
1
1
21
2211 1
......
......
em que pi denota a i-sima frequncia relativa. Quando os dados so apresentados em uma distribuio de frequncias, todos os valores includos num certo intervalo de classe so considerados coincidentes com o ponto mdio do intervalo. As frmulas acima sero vlidas para esses dados agrupados quando se interpretar iX como o ponto mdio do
intervalo e if como a frequncia de classe correspondente.
)350%5()250%20()150%50()50%25(4
1
+++===i
iiXpX
1555,1750755,12)35005,0()25020,0()15050,0()5025,0( =+++=+++=X
A distncia mdia dos voos desse aeroporto superior a 150 milhas nuticas. Item certo. GABARITO: C 5. Os quartis das distncias voadas (em milhas nuticas) obtidos a partir do grfico so: 1o quartil = 100,0; 2o quartil (mediana) = 150,0; e 3o quartil = 200,0. Resoluo Os quartis dividem os dados do histograma em quatro subconjuntos com igual nmero de elementos. O primeiro quartil (Q1) ou quartil inferior (Qi) delimita os 25% menores valores. O segundo quartil a prpria mediana e o terceiro quartil (Q3) ou quartil superior (Qs) o valor que separa os 25% maiores valores.
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
34
Neste item, o valor x = 100,0 o primeiro quartil, pois delimita os 25% menores valores. O valor x = 150,0 a mediana, porque corresponde ao valor que divide a distribuio ao meio, deixando os 50% menores valores de um lado e os 50% maiores valores do outro lado. O terceiro quartil o valor x = 200,0, pois separa os 25% maiores valores do restante da distribuio. Item certo. Alm dos quartis, podemos definir os decis (D1, D2,..., D9), que so os valores que dividem os dados em dez partes iguais (note que a mediana corresponde ao quinto decil D5) e os percentis,que so os valores que dividem os dados ordenados em 100 partes iguais, sendo representados por P1, P2,..., P99 (a mediana o percentil P50). De maneira geral, os quartis, decis e percentis e outros valores obtidos mediante subdivises dos dados em partes iguais so denominados quantis. Os quartis, os decis e os percentis so medidas de posio separatrizes, pois so valores que ocupam determinados lugares do eixo horizontal da distribuio de frequncias, abrangendo intervalos iguais de um conjunto de valores coletados e organizados. Observe que a mediana, alm de ser uma medida de posio de tendncia central, tambm uma medida separatriz. GABARITO: C
nota contagem
0 27
1 6
2 5
3 7
4 2
5 3
Considerando que uma pesquisa de satisfao referente a um novo terminal de passageiros tenha sido realizada com 50 pessoas e o resultado em uma amostra de notas conforme apresentado na tabela acima, julgue os itens seguintes.
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
35
6. A mdia geomtrica da distribuio das notas foi superior mdia aritmtica. Resoluo A soma da contagem n = f1+ f2 + ... + f6 = 27 + 6 + 5 + 7 + 2 + 3 = 50, em que os fi, i =1, 2, ..., 6, denotam as frequncias da contagem. A mdia geomtrica nula: 0)5...0()....( 50/1/121 ===
n
nG XXXX . Como a mdia aritmtica um valor no nulo, a mdia geomtrica da distribuio das notas inferior mdia aritmtica. Item errado. Clculo da mdia:
2,150
60
50
)35()24()73()52()61()270(... 6611 ==+++++
=++
=n
XfXfX
Relao entre as mdias aritmtica, geomtrica e harmnica A mdia geomtrica de um conjunto de nmeros positivos nXXX ,...,, 21 menor
do que ou igual sua mdia aritmtica, mas maior do que ou igual sua mdia harmnica:
mdia harmnica mdia geomtrica mdia aritmtica A propriedade acima pode ser usada para se resolver este item sem fazer contas (macete de prova). GABARITO: E 7. A varincia amostral das notas atribudas pelos passageiros foi superior a 2,4. Resoluo Frmula da Varincia amostral:
2
1
2
11
1)( X
n
nXf
nXVar
k
i
ii
= =
Varincia Amostral = Soma dos Quadrados/(n1) Quadrado da Mdia corrigido pelo fator n/(n1)
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
36
Clculo da Soma dos Quadrados:
196)35()24()73()52()61()270( 2222226
1
2 =+++++==i
iiXf
Clculo da Varincia Amostral:
53,247,100,42,149
50
49
196)( 2 ==
=XVar
GABARITO: C (Analista Judicirio-TST/CESPE-UnB/2007/Adaptada) Considere que, em um ambiente de trabalho industrial, as seguintes medies acerca da poluio do ar tenham sido observadas: 1, 6, 4, 3, 2, 3, 1, 5, 1, 4. Nessas situao, julgue os itens que se seguem. 8. A mediana da amostra igual a 2,5. Resoluo Rol: 1, 1, 1, 2, 3, 3, 4, 4, 5, 6 (N = 10 medies) N = 10 par. Ento
mediana = mdia aritmtica entre as 5a e 6a medies do rol mediana = (3+3)/2 = 3 GABARITO: E 9. As mdias harmnica e geomtrica so ambas inferiores a 3. Resoluo Frmulas:
Mdia geomtrica: nn
i
in
ng xxxxx/1
1
21 ....
==
=
Mdia harmnica:
=
=+++
=n
i in
h
x
n
xxx
nx
121
11...
11
Mdia geomtrica:
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
37
( ) 1010/110/121 864086406544332111.... ==== n ng xxxx
E agora, como fazer a conta acima? Como voc poderia efetuar a raiz dcima de 8640 em uma situao real de prova? Ns faramos uma conta aproximada, como nmeros inteiros. Quer ver? Quanto d 310? 310 = 33 x 33 x 33 x 3 = 27 x 27 x 27 x 3 = 19683 x 3 > 8640 Logo,
3864010
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
38
1,139
118
1
1 2 = i i
xn
Observe que a frmula da mdia dos quadrados leva em conta o fator 1/(n1) em lugar de 1/n porque trata-se da varincia de uma amostra. Quadrado da Mdia de uma amostra:
310
30
10
6544332111==
+++++++++=x 92 =x 109
9
10
1
2 ==
xn
n
Varincia amostral= 13,1 10 = 3,1 > 2,8 item certo. Nota: calculemos a varincia como se fosse a varincia da populao:
1182 =i
ix 8,1110
1181 2 ==i
ixn
Mdia dos quadrados = 11,8 Quadrado da mdia = 9 Varincia = mdia dos quadrados quadrado da mdia = 11,8 9 = 2,8 voc julgaria que o item errado pela conta aproximada. Neste caso, o erro de aproximao (3,1 2,8) = 0,3, correspondente a aproximadamente 10% do valor da varincia amostral (significativo!). O erro percentual da conta aproximada grande porque o nmero de amostras (n=10) pequeno. GABARITO: C
Varivel X Frequncia relativa
0 0,10
1 0,20
2 0,30
3 0,40
(SEAD-CPC/Cespe-UnB/2007/Adaptada) Considerando a tabela acima, que apresenta as freqncias relativas de uma varivel X, relativa a uma contagem, julgue os itens a seguir.
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
39
12. A mdia de X inferior a 1,5. Resoluo
= ii pXX , em que pi denota a frequncia relativa de Xi.
0,22,16,02,00)40,03()30,02()20,01()10,00( =+++=+++=X inferior a 1,5. Item certo. GABARITO: E 13. O desvio-padro de X inferior a 1,5. Resoluo
= 22)( XpXXVaa ii = mdia dos quadrados quadrado da mdia
[ ] 0,146,32,12,002)40,03()30,02()20,01()10,00()( 22222 =+++=+++=XVar
0,1)()( == XVarXDP item certo. GABARITO: C 14. A moda e a mediana de X so iguais a 3. Resoluo
Varivel X Frequncia relativa Frequncia relativa
acumulada
0 0,10 0,10
1 0,20 0,30
2 0,30 0,60
3 0,40 1,00
O valor de maior frequncia 3,0 moda = 3. A mediana 2, haja vista que a frequncia acumulada at X=1 30% e at X=2 60%. Item errado. GABARITO: E
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
40
15. O coeficiente de variao de X superior a 1. Resoluo
5,02
1)(===
X
XDPCVx inferior a 1. Item errado.
GABARITO: E (MI-CENAD/ESAF/2012/Adaptada) A distribuio de frequncias em classes do salrio mensal x, medido em nmero de salrios mnimos, de uma amostra aleatria de 50 funcionrios de uma empresa, apresentado a seguir.
x f
mais de 0 a 10 22
mais de 10 a 20 13
mais de 20 a 30 10
mais de 30 a 40 3
mais de 40 a 50 2
16. Usando os dados acima, obtenha o valor mais prximo da varincia amostral do salrio mensal. (A) 121,5
(B) 124
(C) 126,5
(D) 129
(E) 131,5 Resoluo
ponto mdio da classe
f
5 22
15 13
25 10
35 3
45 2
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
41
Soma das frequncias 50
Mdia aritmtica:
0,1550
750
50
)245()335()1025()1315()225(==
++++=X
Varincia Amostral:
2
1
2
11
1)( X
n
nXf
nXVar
k
i
ii
= =
Varincia Amostral de X = Soma dos Quadrados/(n1) Mdia de X
ao Quadrado corrigida pelo fator n/(n1)
Xi (Xi)2 fi fi.(Xi)2
5 25 22 550
15 225 13 2.925
25 625 10 6.250
35 1.225 3 3.675
45 2.025 2 4.050
Soma n=50 17.450
53,12659,22912,3561549
50450.17
49
1)( 2 ==
=XVar
E o valor mais prximo da varincia amostral 126,5 (alternativa C). Nota (pegadinha da banca!): como n = 50 > 30, o valor aproximado da varincia amostral
12422534915450.1750
11)( 22
1
2 === =
XXfn
XVark
i
ii opo B!
Voc teria errado a questo se tivesse efetuado o clculo aproximado da varincia amostral. E a? Ser que existe algum problema com a frmula aproximada da varincia amostral?
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
42
Fique tranquilo(a)! No h nenhum problema com a frmula aproximada da varincia amostral. A frmula pode ser aplicada, desde que voc tome as devidas precaues. Este problema mostra que voc dever estar atento s alternativas das questes da sua prova. Observe que o erro de aproximao () do resultado obtido pela frmula aproximada pequeno:
%202,053,126
53,2
53,126
12453,126===
=
Contudo, a banca imps, por meio de uma escolha cuidadosa das alternativas, o clculo da varincia amostral pela frmula correspondente. GABARITO: C 17. (ATRFB/ESAF/2012) A varincia da amostra formada pelos valores 2, 3, 1, 4, 5 e 3 igual a (A) 3
(B) 2
(C) 1
(D) 4
(E) 5
Resoluo Se os k valores distintos },...,,{ 21 kxxx de uma amostra X ocorrem com as
frequncias },...,,{ 21 kfff , respectivamente (=
=k
i
i nf1
), ento a varincia dessa
amostra dada por =
=k
i
ii xxfn
XVar1
2)(1
1)( , em que )(XVar denota a varincia
e x representa a mdia amostral. Clculo da mdia e da varincia amostral:
valor (x) frequncia (fi) xi.fi xi2.fi
1 1 1x1 = 1 12x1 = 1 2 1 2x1 = 2 22x1 = 4 3 2 3x2 = 6 32x2 = 18 4 1 4x1 = 4 42x1 = 16 5 1 5x1 = 5 52x1 = 25 fi = n = 6 xi.fi = 18 xi2.fi = 64
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
43
36
18
6
)15()14()23()12()11(1
1
==++++
== =
k
i
ii fxn
x
5
])35(1[])34(1[])33(2[])32(1[])31(1[)(
1
1)(
22222
1
2 ++++=
= =
k
i
ii xxfn
XVar
25
41014)( =
++++=XVar opo B
A varincia amostral tambm pode ser calculada pela frmula,
Varincia Amostral = Soma dos Quadrados/(n1) Quadrado da Mdia corrigido pelo fator n/(n1)
25
10
5
5464
5
96
5
64
11
1)( 2
1
2 ==
=
=
= =
xn
nxf
nXVar
n
i
ii
GABARITO: B (ANCINE/CESPE-UnB/2013) Considerando os mtodos descritivos, julgue os itens a seguir. 18. Suponha que A = 5 x I, em que A e I representam, respectivamente, a amplitude total e o intervalo interquartlico de um conjunto de dados. Em face dessa hiptese, sabendo que no existem outliers no extremo inferior da distribuio, infere-se que a distribuio desses dados simtrica. Resoluo No h como inferir que a distribuio dos dados necessariamente simtrica a partir dos elementos fornecidos pelo item. Se o item tivesse fornecido, pelo menos, um boxplot do conjunto de dados, a teramos condies de analisar a simetria da distribuio. Item errado. GABARITO: E 19. Para o conjunto de dados 1, 1, 1, , 1, 1, 1, o desvio mediano absoluto, que se define como | , , |, positivo. Resoluo A mediana do conjunto de dados 1, 1, 1, , 1, 1, 1 igual a 1, pois 1. Portante, , , 1.
-
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
A N D R E A L O Y R O D R I G U E S 7 1 6 2 0 0 3 6 0 5 3
Pacote de Conhecimentos Especficos Especialista ANTAQ Aula 02 Estatstica Descritiva II
Prof. Alexandre Lima
www.pontodosconcursos.com.br | Prof. Alexandre Lima
44
O conjunto formado pelas distncias entre cada observao e a mediana do conjunto de observaes (| , , |) dado por
|1 1|, , |1 1| 0, 0, 0 , 0, 0, 0 todos os elementos so nulos A mediana do conjunto acima igual a zero. Por conseguinte, o desvio mediano absoluto do conjunto original de dados 1, 1, 1, , 1, 1, 1 tambm igual a zero. Item errado. GABARITO: E Abraos e at a prxima aula, Bons estudos, Alexandre Lima alexandre@pontodosconcursos.com.br
top related