estatÍsticafiles.professoracarma.webnode.com.br/200000022-bfefac0e9c/apostila.pdf · 53,24>...

20
ESTATÍSTICA

Upload: vanthu

Post on 09-Nov-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

ESTATÍSTICA

2

1 INTRODUÇÃO Desde a antiguidade, vários povos já registravam o número de habitantes, de

nascimentos, de óbitos, faziam estimativas das riquezas individual e social, distribuíam equitativamente terras ao povo, cobravam impostos e realizavam inquéritos quantitativos por processos que, hoje, chamaríamos de ESTATÍSTICA.

Na Idade Média colhiam-se informações, geralmente com finalidades tributárias ou bélicas. A partir do Século XVI começaram a surgir as primeiras análises sistemáticas de fatos sociais, como batizados, casamentos, funerais, originando as primeiras tábuas e tabelas e os primeiros números relativos. No Século XVIII começaram a surgir os estudos de tais fatos que foram adquirindo, aos poucos, feição verdadeiramente científica. Godofredo Achenwall batizou a nova Ciência (ou método) com o nome de ESTATÍSTICA, determinando o seu objetivo e suas relações com as ciências.

Atualmente, a definição de Estatística não é única, pois abrange muito mais do que um traçado de gráfico e cálculos de medidas. Uma definição seria: “A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões” (CRESPO, 2002, p.13).

Ramos da Estatística ESTATÍSTICA DEDUTIVA ou DESCRITIVA: Trata da coleta, da organização e da descrição dos dados. TEORIA DA PROBABILIDADE: Proporciona uma base racional para lidar com situações influenciadas por fatores que envolvem o acaso. ESTATÍSTICA INDUTIVA ou INFERENCIAL: Trata da análise e da interpretação desses dados.

Método Estatístico Método é o caminho pelo qual se chega a determinado resultado (existem outras

definições). O método estatístico, diante da impossibilidade de manter as causas constantes, admite essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada um deles. Fases do método estatístico: Coleta de dados, crítica dos dados, apuração dos dados, exposição dos dados, análise dos resultados

Objetivo da ESTATÍSTICA O objetivo último da estatística é tirar conclusões sobre o todo (população) a partir de

informações fornecidas por parte representativa do todo (amostra). Assim, realizadas as fases anteriores (Estatística Descritiva), procede-se a análise dos resultados obtidos, através dos métodos da Estatística Indutiva ou Inferencial, que tem base a indução ou inferência, e tira-se desses resultados conclusões e previsões.

Alguns conceitos fundamentais: POPULAÇÃO: É um conjunto de indivíduos ou objetos que apresentam pelo menos uma característica em comum. A população pode ser finita ou infinita, dependendo de o número de elementos ser finito ou infinito. Na prática, quando uma população é finita, com um número grande de elementos, considera-se como população infinita. AMOSTRA: Considerando-se a impossibilidade, na maioria das vezes, do tratamento de todos os elementos da população, retira-se uma amostra (subconjunto finito de uma população), de acordo com alguma técnica de amostragem. VARIÁVEIS QUALITATIVAS: podem ser separados em diferentes categorias, atributos, que se distinguem por uma característica não numérica. Divide-se em:

I – Nominal: São dados caracterizados por rótulos ou categorias. Por exemplo: sexo, estado civil, cor dos olhos, etc. II – Ordinal: são dados caracterizados por uma ordem, mas não podem ser definidos por valor numérico. Exemplo: Nível de escolaridade (Fundamental, médio, superior),

3

intensidade da luz (muito forte, forte, média, suave, muito suave), etc. VARIÁVEIS QUANTITATIVAS: Consistem em números que representam contagens ou medidas. Dividem-se em:

I – Discretas: Resultam de um conjunto finito, enumerável, de valores possíveis. Exemplo: número de filhos. II – Contínuas: Resultam de um número infinito de valores possíveis, que podem ser associados a pontos em uma escala contínua. Exemplo: peso, altura.

EXERCÍCIOS Classifique cada uma das variáveis a seguir em qualitativa nominal ou ordinal e em quantitativa discreta ou contínua: a) Cor dos cabelos b) Números de filhos c) O ponto obtido ao se jogar um dado d) Saldo em uma conta corrente (R$) e) Grau de instrução f) Classe econômica g) Hierarquia de uma empresa h) Diâmetro de peças produzidas i) Comprimento de peças produzidas j) Tempo de espera na fila do banco (em minutos) k) Nome dos países exportadores de petróleo l) Grau de satisfação dos clientes de uma loja m) nº de ações negociadas na bolsa de valores n) Nº de alunos de uma universidade o) Estatua dos alunos de uma escola p) Precipitação pluviométrica durante um ano q) Nº de volumes de livros existentes nas bibliotecas de Rondônia r) Índice de liquidez das indústrias de Rondônia 2. NÚMEROS APROXIMADOS E ARREDONDAMENTO DE DADOS

Como sabemos, os números resultam de uma mensuração (no sentido mais amplo), a qual só pode ser exata quando assume a forma de contagem ou numeração, em números naturais, de coisas ou unidades mínimas indivisíveis. Em tais casos, a variável pode assumir valores discretos ou descontínuos (somente).

Arredondamento de Dados Muitas vezes, é necessário ou conveniente suprimir unidades inferiores às de

determinada ordem. Esta técnica é denominada ARREDONDAMENTO DE DADOS. De acordo com a resolução número 886/66 da Fundação IBGE, o arredondamento é feito da seguinte maneira:

a) Quando o primeiro algarismo a ser abandonado é 0, 1, 2, 3 ou 4, fica inalterado o último algarismo a permanecer (arredondamento por falta). Exemplo:

53,24 53,2 58,83 58,8 0,34853 0,3485 3,0047523 3,004752

b) Quando o primeiro algarismo a ser abandonado é 6, 7, 8 ou 9, aumenta-se de uma unidade o algarismo a permanecer (arredondamento por excesso). Exemplo:

42,87 42,9 24,39 24,4 25,089 25,09 72,99 73

c) Quando o primeiro algarismo a ser abandonado é 5, há duas soluções: I - Se ao 5 seguir em qualquer casa um algarismo diferente de zero, aumenta-se uma

4

unidade ao algarismo a permanecer. Exemplos: 2,352 2,4 76,25002 76,3

25,6501 25,7 2,3851 2,39 II - Se ao 5 seguirem zeros ou se o 5 for o último algarismo a ser conservado só será aumentado de uma unidade se for ímpar. Exemplos:

24,75 24,8 24,85 24,8 24,65 24,6 24,7500 24,8

Obs: Nunca devemos fazer arredondamentos sucessivos; é conveniente primeiro somar e depois fazer o arredondamento.

EXERCÍCIOS

1) Arredonde para o décimo mais próximo (uma casa decimal): a) 2,38 c) 4,24 e) 6,829 g) 0,351 i) 89,99 b) 24,65 d) 328,35 f) 5,550 h) 2,97 j) 3,75 2) Arredonde para o centésimo mais próximo (duas casas decimais): a) 46,727 c) 299,951 e) 253,650 b) 123,842 d) 28,255 f) 34,485 3) Arredonde para a unidade mais próxima (nenhuma casa decimal): a) 26,6 c) 67,5 e) 128,5 b) 49,98 d) 68,2 f) 39,49 3. DISTRIBUIÇÃO DE FREQUÊNCIAS

A distribuição de freqüência constitui-se no tipo de tabela mais importante para a Estatística Descritiva. Distribuição de freqüência sem intervalos de classe (variável discreta)

Quando se trata de variável discreta de variação relativamente pequena, cada valor pode ser tomado como um intervalo de classe (intervalo degenerado).

Dados Brutos: O conjunto dos dados numéricos obtidos após a crítica dos valores coletados constitui-se nos dados brutos (tabela primitiva). Exemplo:

24 23 22 28 35 21 23 3326 21 25 36 26 22 30 3224 33 34 21 31 25 31 2635 33 31 34 25 25

Rol: É o arranjo dos dados brutos em ordem de freqüência crescente ou decrescente. Exemplo:

21 21 21 22 22 23 23 2424 25 25 25 25 26 26 2628 30 31 31 31 32 33 3333 34 34 35 35 36

Amplitude total (At) ou Range (R): É a diferença entre o maior e o menor valor observados. No exemplo anterior temos: 15152136 =⇒=−= AtAt .

Freqüência absoluta (fi): É o número de vezes que o elemento aparece na amostra, ou o número de elementos pertencentes a uma classe. No exemplo anterior temos: ( ) ( ) 1,3 3621 == FF , etc.

Freqüência absoluta acumulada (Fi): É a soma das freqüências dos valores inferiores ou iguais ao valor dado.

Freqüência relativa (fri): São os valores das razões entre as freqüências absolutas e a freqüência total.

5

Freqüência relativa acumulada (FRi): É a soma das freqüências relativas dos valores inferiores ou iguais ao valor dado. Exemplo:

xi fi Fi fri FRi21 3 3 0,1000 0,1000 22 2 5 0,0667 0,1667 23 2 7 0,0667 0,2334 24 2 9 0,0667 0,3001 25 4 13 0,1333 0,4334 26 3 16 0,1000 0,5334 28 1 17 0,0333 0,5667 30 1 18 0,0333 0,6000 31 3 21 0,1000 0,7000 32 1 22 0,0333 0,7333 33 3 25 0,1000 0,8333 34 2 27 0,0667 0,9000 35 2 29 0,0667 0,9667 36 1 30 0,0333 1,0000 Σ 30 1,0000

Representação gráfica – Histograma

Distribuição de freqüência com intervalos de classe (variável contínua) Número de classes(k): Não há uma fórmula exata para o cálculo do número de classes. A seguir, uma sugestão: k= 5 para n ≤ 25 e k = n , para n > 25. Exemplo: 4,755 ==k , podemos ter 6,7 ou 7 classes.

Amplitude das classes (h): É dada pela relação kAth =

Limites das classes: Existem diversas maneiras de expressar os limites das classes. Porém iremos utilizar a seguinte Li|—li. Exemplo: 10 |— 12 compreende todos os valores de 10 até antes de 12. Li – limite superior da classe; li – limite inferior da classe.

Ponto médio das classes (xi): É a média aritmética entre o limite superior e o limite inferior da classe. Assim, se a classe for 10 |— 12, tem-se:

112

12102

=+

=+

= iii

lLx , como ponto médio da classe.

Exemplo: Dada a estatura de 40 alunos do Colégio A, pede-se:

150 151 152 153 154 155 155 155 155 156156 156 157 158 158 160 160 160 160 160161 161 161 161 162 162 163 163 164 164164 165 166 167 168 168 169 170 172 173

a) O tamanho da amostra → 40=n b) A amplitude total → 23150173 =−=At c) O número de classes → 3,640 ==k , podemos ter 5, 6 ou 7 classes. d) A amplitude das classes → Como At =23 e não é divisível por 5, 6 ou 7, nesse caso

precisaremos ajustar seu valor At = 23 + 1=24 → 4624

==h

e) A distribuição de freqüência contendo: classes, freqüência, ponto médio, freqüência acumulada e freqüência relativa.

6ESTATURA DE 40 ALUNOS DO COLÉGIO A

Classes fi xi Fi fri FRi 150 |— 154 154 |— 158 158 |— 162 162 |— 166 166 |— 170 170 |— 174

4 9 11 8 5 3

152 156 160 164 168 172

4 13 24 32 37 40

0,10 0,22 0,28 0,20 0,12 0,08

0,10 0,32 0,60 0,80 0,92 1,00

Σ 40 - - 1,00

Representação gráfica a) Histograma e polígono de freqüência

b) Polígono da freqüência acumulada

EXERCÍCIOS

1) Dada a amostra: 3, 4, 4, 5, 7, 6, 6, 7, 7, 4, 5, 5, 6, 6, 7, 5, 8, 5, 6, 6. Pede-se: o Rol; amplitude da amostra; a distribuição de frequência contendo frequência absoluta, frequência absoluta acumulada, frequência relativa e frequência relativa acumulada; o gráfico das frequências; a porcentagem de elementos maiores que 5.

2) Considere os dados obtidos pelas medidas das alturas de 100 indivíduos (dadas em cm): 151 152 154 155 158 159 159 160 161 161161 162 163 163 163 164 165 165 165 166166 166 166 167 167 167 167 167 168 168168 168 168 168 168 168 168 168 169 169169 169 169 169 169 170 170 170 170 170170 170 171 171 171 171 172 172 172 173173 173 174 174 174 175 175 175 175 176176 176 176 177 177 177 177 178 178 178179 179 180 180 180 180 181 181 181 182182 182 183 184 185 186 187 188 190 190

Pede-se: a amplitude da amostra; o número de classes; a distribuição de freqüência contendo as classes, as freqüências absolutas, as freqüências absolutas acumuladas, as freqüências relativas, as freqüências relativas acumuladas e os pontos médios das classes; o histograma; o polígono de freqüência; o polígono de freqüência acumulada.

7

4. MEDIDAS DE POSIÇÃO

As medidas de posição mais importantes são as MEDIDAS DE TENDÊNCIA CENTRAL que recebem tal denominação pelo fato de os dados observados tendem, em geral, a se agrupar em torno dos valores centrais. São medidas de tendência central: MÉDIA, MEDIANA e MODA. As outras medidas de posição são as SEPARATRIZES, que englobam: a própria MEDIANA, os QUARTIS, os DECIS e os PERCENTIS.

4.1 Média Aritmética ⎟⎠⎞

⎜⎝⎛ −−

X

Para dados não agrupados: Sejam X1, X2, X3, ... , Xn, portanto “n” valores da variável X. A

média aritmética SIMPLES de X representada por __X é definida por:

n

XX

n

ii∑

== 1__

, ou ainda nX

X i∑=__

Exemplo: Sabendo-se que a produção leiteira de uma vaca, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 litros, temos, para produção média da semana:

14798

712181615131410__

==++++++

== ∑nX

X i litros

Dados agrupados Sem intervalos de classe: Quando os dados estiverem agrupados (sem intervalos de

classe) numa distribuição de freqüência usa-se a média aritmética dos valores X1, X2, X3, ... , Xn, PONDERADOS pelas representativas freqüências absolutas: F1, F2, F3, ... , Fn. Assim,

nfx

X ii∑=__

, ou ainda ∑∑=

i

ii

ffx

X__

Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino. Qual é a média de filhos masculinos, por família?

Nº. de meninos (xi) Nº. de famílias (fi) 0 1 2 3 4

2 6 10 12 4

Σ 34

Nesse caso tem-se: Nº. de meninos (xi) Nº. de famílias (fi) xi*fi

0 1 2 3 4

2 6 10 12 4

0 6 20 36 16

Σ 34 78

3,23478__

====∑∑∑

i

iiii

ffx

nfx

X meninos

Interpretação: O valor médio 2,3 meninos sugere, neste caso, que o maior número de famílias tem 2 meninos e 2 meninas, sendo, porém, a tendência geral de uma leve superioridade numérica em relação ao número de meninos.

8

Com intervalos de classe: Neste caso, convenciona-se que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e determinamos a média aritmética ponderada por meio da fórmula:

nfx

x ii∑=__

ou ∑∑=

i

iiffx

x__

Exemplo: Determinar a média da distribuição: Renda Familiar Milhares de R$ 2 |— 4 4 |— 6 6 |— 8 8 |— 10 10 |— 12

Nº de famílias 5 10 14 8 3

Neste caso tem-se: Classes fi xi xi*fi

2 |— 4 4 |— 6 6 |— 8 8 |— 10 10 |— 12

5 10 14 8 3

3 5 7 9 11

15 50 98 72 33

Σ 40 - 268

7,640268__

====∑∑∑

i

iiii

ffx

nfx

X

Como a renda familiar foi dada em milhares de reais, conclui-se que a renda média desse grupo de 40 famílias é de R$ 6.700,00.

Emprego da média: A média é utilizada quando deseja-se obter a medida de posição que possui a maior estabilidade ou quando houver a necessidade de um tratamento algébrico ulterior.

4.2 Mediana (Md) A mediana é outra medida de posição definida como o número que se encontra no

centro de uma série de números, estando segundo uma ordem.

Mediana para dados não agrupados e distribuição de freqüência de variável discreta – se n é a quantidade de elementos, têm-se dois casos a considerar:

I - Se n for ímpar, a mediana será o elemento de ordem 2

1+n .

Exemplo 1: Dada a série de valores 5, 13, 10, 2, 18, 15, 6, 16, 9. Ordenação dos elementos: 2, 5, 6, 9, 10, 13, 15, 16, 18.

Como existem 9 (nove) elementos, então o elemento de ordem 52

192

1=

+=

+n º elem.,

logo Md = 10. Exemplo 2: Dada a distribuição:

xi fi Fi Como n = 11 (ímpar), logo a mediana (Md) será o

elemento de ordem 62

122

1112

1==

+=

+n º elem. Para

encontrá-lo, abre-se a coluna de freqüência acumulada (Fi). Neste caso será Md = 3.

1 2 3 4

1 3 5 2

1 4 9

11 Σ 11

II - Se n for par, a mediana será a média entre os elementos centrais (de ordem 2n e 12+n ).

9

Exemplo 1: seja a série 2, 6, 7, 10, 12, 13, 18, 21. Então: 11222

21210

==+

=Md

Exemplo 2: Dada a distribuição: xi fi Fi n = 42 (par), então, a mediana será a média entre os

elementos de ordem 2n e 12+n , isto é: º21242

2==

n

e º2212112421

2=+=+=+

n

Neste caso, o 21º corresponde a 87 e o 22º também corresponde a 87

80 85 87 89 90

5 10 15 8 4

5 15 30 38 42

Σ 42

Logo, 872

8787=

+=Md

Mediana para o caso de variável contínua, ou seja, agrupamento de dados em classes.

Procedimentos:

I) Calcula-se a ordem 2n .

II) Pela Fac identifica-se a classe que contém a mediana (classe mediana).

III) Utiliza-se a fórmula Md

Md f

hfn

lMd.

2⎟⎠⎞

⎜⎝⎛ −

+=∑

, onde:

LMd = limite inferior da classe mediana. n = tamanho da amostra ou número de elementos. Σf = soma de freqüências anteriores à classe mediana. H = amplitude da classe mediana. fMd = freqüência da classe mediana. Exemplo: Dada a distribuição:

xi fi Fi º292

582

==n , logo a classe mediana é a terceira.

67,6118

1205518

10.172

58

55 =+=⎟⎠⎞

⎜⎝⎛ −

+=Md

35 |— 45 45 |— 55 55 |— 65 65 |— 75 75 |— 85 85 |— 95

5 12 18 14 6 3

5 17 35 49 55 48

Σ 58

4.3 Moda (Mo) Denominamos moda o valor que ocorre com maior freqüência em uma série de valores.

Moda para dados não-agrupados Exemplos: I) Para a seqüência (7, 8, 9, 10, 10, 11, 12, 13, 15), Mo = 10 (modal) II) Para a seqüência (2, 3, 4, 4, 5, 6, 7, 7, 8, 9), Mo = 4 e 7 (bimodal) III) Para a seqüência (3, 5, 8, 10, 11, 12), não existe moda (amodal)

Moda para dados agrupados

Para distribuições de freqüência sem intervalos de classe é possível determinar imediatamente a moda: basta verificar o valor da variável de maior freqüência. Para a distribuição a seguir, por exemplo, a variável 87 é a moda (Mo = 87), pois apresenta a maior freqüência (15).

10

xi 80 85 87 89 90 fi 5 10 15 8 4

Para dados agrupados em classes, existem diversas fórmulas para o cálculo da moda. Será apresentado a seguir uma que é bastante usada, a fórmula de CZUBER. Procedimentos:

I – Identificar a classe modal (aquela que possuir maior freqüência absoluta). II – Aplicar a fórmula de Czuber:

hlMo .21

1

Δ+ΔΔ

+= , onde:

l = limite inferior da classe modal; Δ1 = diferença entre a freqüência de classe modal e a imediatamente anterior.

Δ2 = diferença entre a freqüência da classe modal e a imediatamente posterior. h = amplitude de classe. Exemplo: Em uma sala de aula de 40 alunos foi medida a estatura de cada um,

conforme tabela abaixo. Determine qual a estatura predominante na sala. Estaturas (cm) Fi A classe modal é a 3ª.

Δ1 = 11 – 9 = 2 l = 158 Δ2 = 11 – 8 = 3 h = 4

cmhlMo 6,1594.32

2158.21

1 =+

+=Δ+Δ

Δ+=

Isto é, a altura (estatura) predominante (a que mais aparece) entre os alunos da sala é de 159,6cm.

150 |— 154 154 |— 158 158 |— 162 162 |— 166 166 |— 170 170 |— 174

4 9

11 8 5 3

Σ 40 Obs: Para o cálculo da moda, existem outras fórmulas bem conhecidas, que são a Fórmula de PEARSON e a Fórmula de KING

Utilizações das medidas de tendência central

Normalmente é necessário calcular apenas uma das medidas (média, mediana ou moda) para caracterizar o centro da distribuição. Surge, então, a questão: qual medida deve ser utilizada?

A medida ideal em cada caso é aquela que melhor representa a maioria dos dados da distribuição. Assim:

a) Se uma medida apresenta forte concentração de dados em sua área central, a média, a moda e a mediana ficam também situadas em sua área central. Todas representam bem a distribuição no caso em questão. Como a mais conhecida é a média, esta distribuição será representada pela média. Neste caso, temos uma distribuição simétrica.

b) Se uma distribuição apresenta forte concentração de dados em seu início, a mediana e a moda estarão posicionadas no início da distribuição, representando bem esta concentração. Como a mais conhecida entre mediana e moda é a MEDIANA, esta será a medida indicada para representar tal distribuição. Neste caso, tem-se uma distribuição assimétrica positiva.

c) Quando a distribuição apresenta forte concentração de dados em seu final, a situação é análoga ao item (b), e daí, usa-se também a mediana para representá-la. Neste caso tem-se uma distribuição assimétrica negativa.

d) A moda deve ser a opção como medida de tendência central apenas em distribuições que apresentam um elemento típico, isto é, um valor cuja freqüência é muito superior à freqüência dos outros elementos da distribuição.

11

EXERCÍCIOS 1) Determinar a média aritmética, a mediana e a moda das seguintes séries:

a) 3, 4, 1, 3, 6, 5, 6 c) 43, 40, 42, 43, 47, 45, 45, 43, 44, 48 b) 82, 86, 88, 84, 91, 93, 88, 91 d) 70, 75, 76, 80, 82, 83, 90

2) Calcule para cada uma das distribuições abaixo sua respectiva média aritmética, a mediana e a moda.

a) xi 3 4 7 8 12 b) xi 10 11 12 13 fi 2 5 8 4 3 fi 5 8 10 6 3) Dadas as distribuições a seguir, calcular a média aritmética: a) Aluguel

($1000,00) 1,5 |—3,5 3,5|—5,5 5,5|—7,5 7,5|—9,5 9,5|—11,5

Nº de casas 12 18 20 10 5

b) Classes 68 |—72 72|—76 76|—80 80|—84 Fac 8 20 35 40

4) Uma máquina produz peças que são embaladas em caixas contendo 48 unidades. Uma pesquisa realizada com 59 caixas, revelou a existência de peças defeituosas segundo a tabela:

Nº de peças defeituosas por caixas Nº de caixas a) Determine o valor mediano da série.

b) Interprete o valor mediano.

0 1 2 3 4 5

20 15 12 6 4 2

5) Calcule a moda da série representativa da idade de 50 alunos de uma classe de primeiro ano de uma faculdade e a interprete.

Idade (anos) Nº de alunos 17 18 19 20 21

3 18 17 8 4

6) A distribuição abaixo representa o consumo, em kg de um produto colocado em oferta em um supermercado, que limitou o consumo máximo por cliente em 5kg.

Consumo em kg Nº de clientes Pede-se: Calcule a média aritmética, a mediana e a moda.

0 |— 1 1 |— 2 2 |— 3 3 |— 4 4 |— 5

12 15 21 32 54

4.4 SEPARATRIZES I) Quartis: Denomina-se quartis os valores de uma série que a dividem em quatro partes iguais.

II) Decis: São valores que dividem a série em dez (10) partes iguais.

12

III) Percentis: São as medidas que dividem a amostra em 100 partes iguais.

iPPi f

hfin

lPi

.100

⎟⎠⎞

⎜⎝⎛ −

+=∑

, i = 1, 2, 3, ... , 100.

Exemplo: Determinar o 72º percentil (P72) da seguinte distribuição:

Classes fi Fi

( ) 6,166,11417

5.208,281417

5.20100

40*72

1472 =+=−

+=⎟⎠⎞

⎜⎝⎛ −

+=P 4 |— 9 9 |— 14 14 |— 19 19 |— 24

8 12 17 3

8 20 37 40

Σ 40 -

Obs: Para calcular os quartis ou os decis, basta convertê-los em porcentis. 5. MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE

Servem para verificar a representatividade das medidas de posição, pois é muito comum encontrar séries que, apesar de terem a mesma média, são compostas de maneira distinta.

Exemplo: Sejam os seguintes conjuntos de valores: X: 70, 70, 70, 70, 70 Y: 68, 69, 70, 71, 72 Z: 5, 15, 50, 120, 160

Temos 70_________

=== ZYX , isto é, os três conjuntos apresentam a mesma média aritmética. Entretanto, nota-se que:

O conjunto X é mais homogêneo que os conjuntos Y e Z, já que todos os valores são iguais à média.

O conjunto Y, por sua vez, é mais homogêneo que o conjunto Z, pois há menor diversificação entre cada um de seus valores e a media representativa. Chama-se de DISPERSÃO ou VARIABILIDADE a maior ou menor diversificação dos

valores de uma variável em torno de um valor de tendência central tomado como ponto de comparação. No caso do exemplo dado, pode-se dizer que:

O conjunto X apresenta dispersão nula. O conjunto Y apresenta uma dispersão menor que o conjunto Z.

Portanto, para qualificar os valores de uma dada variável, ressaltando a maior ou menor dispersão, entre esses valores e a sua medida de posição, a Estatística recorre às MEDIDAS DE DISPERSÃO ou de VARIABILIDADE. Dessas medidas, serão estudadas: a amplitude total, o desvio médio, a variância, o desvio padrão e o coeficiente de variação. 5.1 Amplitude Total (At)

É a diferença entre o maior e o menor dos valores da série minmax XXAt −= Exemplo 1: Para a série 40, 45, 48, 52, 54, 62 ,70, temos 304070 =−=At Exemplo 2: Dada a distribuição a seguir

Estatura em cm (xi)

fi

150 |— 154 154 |— 158 158 |— 162 162 |— 166

4 9 11 8

16150166

=−=

AtAt

Σ 32 O valor da amplitude total afirma alguma coisa do grau de concentração. Quanto maior a

amplitude total, maior é a dispersão ou variabilidade dos valores da variável. A amplitude total tem o inconveniente de só levar em conta os dados extremos da série,

descuidando do conjunto de valores intermediários, o que quase sempre invalida a idoneidade do resultado. Ela é apenas uma indicação aproximada da dispersão ou variabilidade.

13

5.2 Desvio Médio (DM)

Na determinação de cada desvio ___XXd ii −= , medir-se-á a dispersão entre cada Xi e a

média ___X .

i

ii

i

ii

M ffd

f

fxxD

∑=

−= ∑∑ ..

___

Exemplo: Calcular e interpretar o DM da distribuição a seguir.

Classes fi xi xi.fi

ii fxx .___

2 |— 4 4 |— 6 6 |— 8

8 |— 10

5 10 4 1

3 5 7 9

15 50 28 9

10,50 1,00 7,60 3,90

Σ 20 102 23,00

Assim, 10,520

102.___==

∑= ∑

i

ii

ffx

X 15,12023

.___

==∑

−=∑

i

ii

M f

fxxD

Interpretação: Em média, cada elemento da série esta afastado de 5,10 por 1,15 unidades. 5.3 Variância e Desvio Padrão

Têm-se as seguintes situações: I – Dados não agrupados Variância populacional

n

xx

xi

2__

2 )(⎟⎟⎠

⎞⎜⎜⎝

⎛−∑

Desvio padrão populacional

2σσ =

Variância amostral

1)(

2__

2−

⎟⎟⎠

⎞⎜⎜⎝

⎛−∑

=n

xx

xsi

Desvio padrão amostral

2ss =

II – Dados agrupados Variância populacional

i

ii

f

fxx

x∑

⎟⎟⎠

⎞⎜⎜⎝

⎛−∑

=

2__

2 )(σ

Desvio padrão populacional

2σσ =

Variância amostral

1)(

2__

2−∑

⎟⎟⎠

⎞⎜⎜⎝

⎛−∑

=i

ii

f

fxx

xs

Desvio padrão amostral

2ss =

Exemplo 1: Calcule o desvio padrão da sequência X: 4, 5, 8, 5 (População)

5,54

224

5854__==

+++== ∑

nx

x i

14

25,2)5,54( 2 =− 25,0)5,55( 2 =− 25,6)5,58( 2 =− 22 25,0)5,55( u=−

25,249

425,025,625,025,2)(

2__

2 ==+++

=⎟⎟⎠

⎞⎜⎜⎝

⎛−∑

=n

xx

xi

σ (var.) u5,125,2 ==σ (d.p.)

Interpretação: Em média, cada elemento da série esta afastado de 5,5 por 1,15 unidades. Obs: Se a sequência em questão representasse apenas uma amostra:

339

1425,025,625,025,2

1)(

2__

2 ==−

+++=

⎟⎟⎠

⎞⎜⎜⎝

⎛−∑

=n

xx

xsi

(var.) us 73,13 == (d.p.)

Exemplo 2: Dada a distribuição a seguir, representante de uma população, teremos:

xi fi xi.fi fxxi

2__

⎟⎟⎠

⎞⎜⎜⎝

⎛− 65,3

2073__

===∑∑

i

iiffx

x

2

2__

2 9275,020

55,18)( uf

fxx

xi

ii

==∑

⎟⎟⎠

⎞⎜⎜⎝

⎛−∑

=σ (variância)

2 3 4 5

3 5 8 4

6 15 32 20

8,1675 2,1125 0,9800 7,2900

Σ 20 73 18,55

u963,09275,02

=== σσ (desvio padrão) Interpretação: Em média, cada elemento da população esta afastado de 3,65 por 0,9275 unidades.

Obs: Se a variável discreta fosse representativa de uma amostra:

2

2__

2 9763,019

55,181

)( uf

fxx

xsi

ii

==−∑

⎟⎟⎠

⎞⎜⎜⎝

⎛−∑

= (var.) uss 988,09763,02

===

Observações: I. No cálculo da variância, se os dados são expressos em metros, a variância é expressa em

metros quadrados.

I. Em alguns casos, a unidade de medida da variância não faz sentido. É o caso, por exemplo,

em que os dados são expressos em litros. A variância será expressa em litros quadrados.

Portanto, o valor da variância não pode ser comparado diretamente com os dados da série, ou

seja, variância NÃO TÊM INTERPRETAÇÃO.

15

5.4 Coeficiente de Variação

Trata-se de uma medida relativa de dispersão útil para a comparação em termos relativos do grau de concentração em torno da média de séries distintas. É dado por:

100*___X

CV σ= ou 100*__

x

SCV =

O coeficiente de variação é expresso em porcentagens. Exemplo: Numa empresa, o salário médio dos homens é de R$ 4.000,00, com desvio-padrão de R$ 1.500,00, e o das mulheres é em média de 3.000,00, com desvio-padrão de R$ 1.200,00. Então:

- Para os homens %5,37100*000.4500.1

__ ===x

CV σ

- Para as mulheres %40100*000.3200.1

__ ===x

CV σ

Logo, pode-se concluir que os salários das mulheres apresentam maior variabilidade (dispersão) que os dos homens.

Diz-se que a distribuição possui pequena variabilidade (dispersão) quando o coeficiente der até 10%; média dispersão quando estiver acima de 10% até 20%, e grande dispersão quando superar 20%. Alguns analistas consideram:

Baixa dispersão: %10≤CV Média dispersão: %20%10 <<CV Alta dispersão: %20≥CV

EXERCÍCIOS

1) Calcule a amplitude total e o desvio médio da sequência X: 2, 3, 7, 9, 11, 13. 2) Calcule a amplitude total e o desvio médio da sequência Y: 5, 12, 4, 20, 13, 17 3) Calcule a variância e o desvio padrão da sequencia a seguir, representativa de uma

população: Z: 15, 16, 17, 20, 21 4) Calcule a variância e o desvio padrão da sequencia a seguir, representativa de uma

amostra: T: 6, 5, 10, 12, 19 5) Calcule a variância e o desvio padrão da população:

Idade (anos) (xi) Nº de alunos (fi) 17 18 19 20 21

3 18 17 8 4

Σ 50

6) Calcule a variância e o desvio padrão para o número de acidentes diários, observados em cruzamentos, durante 40 dias (amostra).

Nº de acidentes por dia (xi)

Nº de dias (fi)

0 1 2 3 4

30 5 3 1 1

Σ 40

7) Calcule a variância e o desvio padrão para a distribuição de valores de 54 notas fiscais emitidas na mesma data, selecionadas em uma loja de departamentos (amostra).

16

Consumo por nota

(classes) Nº de alunos (Fi)

0 |— 50 50 |— 100 100 |— 150 150 |— 200 200 |— 250 250 |— 300

10 28 12 2 1 1

Σ 54

8) Calcule a variância e o desvio padrão para as alturas de 70 alunos de uma classe (amostra) altura (cm) Nº de alunos (Fi) 150 |— 160 160 |— 170 170 |— 180 180 |— 190 190 |— 200 200 |— 210

2 15 18 18 16 1

Σ 9) Interprete os valores obtidos na questão 6. 10) Interprete os valores obtidos na questão 7. 11) Um grupo de 85 moças tem estatura média de 160,6cm, com um desvio padrão igual a

5,97cm. Outro grupo de 125 moças tem uma estatura média de 161,9cm, sendo o desvio padrão igual a 6,01cm. Qual é o coeficiente de variação de cada um dos grupos? Qual o grupo mais homogêneo?

REFERÊNCIAS

COSTA, Sérgio Francisco. Introdução ilustrada à estatística. 3.ed. São Paulo: Herbra, 1998.

CRESPO, Antônio Arnot. Estatística fácil. São Paulo: Saraiva, 2002.

SILVA, Ermes Medeiros da; SILVA, ELIO Medeiros da; GONÇALVES, Valter; MUROLO, Afránio Carlos. Estatística para os cursos de: Economia, administração, ciências contábeis. 3.ed. São Paulo: Atlas, 2006.

TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro. Estatística básica. 2.ed. São Paulo: Atlas, 1985.

17

ANEXO – TABELAS E GRÁFICOS Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem

assumir, para que tenham uma visão global da variação dessa ou dessas variáveis. E isto ela consegue, inicialmente, apresentando esses valores em tabelas e gráficos, que irão nos fornecer rápidas e seguras informações a respeito das variáveis em estudo, permitindo-nos determinações administrativas e pedagógicas mais coerentes e científicas. 1. Tabela

Tabela é um quadro que resume um conjunto de observações. Uma tabela compõe-se de: a) TÍTULO: O título deve responder as seguintes questões:

O que? (Assunto a ser representado (Fato)); Onde? (O lugar onde ocorreu o fenômeno (local)); Quando? (A época em que se verificou o fenômeno (tempo)).

b) CABEÇALHO: parte da tabela na qual é designada a natureza do conteúdo de cada coluna. c) CORPO: parte da tabela composta por linhas e colunas. d) LINHAS: parte do corpo que contém uma seqüência horizontal de informações. e) COLUNAS: parte do corpo que contém uma seqüência vertical de informações. f) COLUNA INDICADORA: coluna que contém as discriminações correspondentes aos valores distribuídos nas linhas. g) CASA OU CÉLULA: parte da tabela formada pelo cruzamento de uma linha com uma coluna. h) ELEMENTOS COMPLEMENTARES (rodapé): Colocados no espaço abaixo da tabela – Fonte: é a indicação de entidade responsável pelo fornecimento dos dados ou sua elaboração; Notas: são informações de natureza geral, identificadas por algarismos romanos. Exemplo:

Para a apresentação da tabela, deve-se observar as regras:

a) O lado direito e esquerdo de uma tabela deve ser aberto; b) Use traços horizontais para separar os componentes (cabeçalho, total e as colunas); c) Use traços verticais internos somente se for necessário (para maior clareza); d) Use maiúscula somente na primeira letra da palavra inicial (vide na tabela a palavra Ano); e) Deve-se prestar atenção para os seguintes fatos:

- um traço horizontal (-), quando é apresentado um valor zero; - três pontos (...), quando há ausência de dados; - zero (0), quando o valor é muito pequeno;

18

- um ponto de interrogação (?), quando há dúvida quanto à exatidão de determinado valor; f) A informação do total não é obrigatória. Pode ser incluída, quando for importante, ou, ainda, quando for usada para alguma análise.

2. Gráficos

O gráfico estatístico é uma forma de apresentação dos dados estatísticos cujo objetivo é o de produzir, no investigador ou público em geral, uma impressão mais rápida e viva do fenômeno em estudo, já que os gráficos falam mais rápido à compreensão que as séries.

A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais, para ser realmente útil:

SIMPLICIDADE: O gráfico deve ser destituído de detalhes de importância secundariam, assim o como de traços desnecessários que possam levar o observador a uma análise morosa ou com erros. CLAREZA: O gráfico deve possibilitar uma correta interpretação dos valores representativos do fenômeno em estudo. VERACIDADE: O gráfico deve expressar a verdade sobre o fenômeno em estudo. Para a construção de gráficos, você deverá observar alguns itens que se fazem

necessários neles: - todo gráfico deve ter título (na parte superior) e fonte (no rodapé), para que o leitor não tenha a necessidade de voltar ao texto para saber do que se trata; - a escala do eixo horizontal deve ser escrita abaixo desse eixo e deverá crescer da esquerda para a direita; - a escala do eixo vertical deve ser escrita à esquerda do eixo e crescer de baixo para cima; - cada eixo deve ser identificado com o que está sendo medido ou representado; - não é necessário colocar linhas de grade (que saem das marcas das escalas

horizontais e verticais). Estas são opcionais. Exemplo:

Antigamente, os gráficos eram feitos “a mão”, com a ajuda de régua, compasso,

transferidor, esquadros e canetas ou giz coloridos. Hoje podemos contar com softwares específicos que auxiliam e facilitam na construção de gráficos e, muitas vezes, propiciam mais precisão e clareza. Além dos softwares específicos de Estatística, temos os programas aplicativos de escritório que incluem as chamadas planilhas eletrônicas.

Uma planilha eletrônica utiliza tabelas para a realização de cálculos e permite, também,

19

a criação de vários tipos de gráficos, o que facilita a representação e análise de dados estatísticos.

Os principais tipos de gráficos são os DIAGRAMAS, os CARTOGRAMAS e os PICTOGRAMAS.

Diagramas Os diagramas são gráficos geométricos de, no máximo, duas dimensões; para sua

construção, em geral, fazemos uso do sistema cartesiano (eixo X e Y). Os principais diagramas são os gráficos de linhas, colunas, barras, setores ou pizza e o gráfico polar. Veja cada um desses tipos: Gráfico de linhas: Gráfico de colunas:

Gráfico de barras:

Gráfico de setores ou pizza:

Gráfico de colunas múltiplas: Gráfico em barras múltiplas:

Gráfico polar: Pictograma:

20

Cartograma:

REFERÊNCIAS

COSTA, Sérgio Francisco. Introdução ilustrada à estatística. 3.ed. São Paulo: Herbra, 1998.

CRESPO, Antônio Arnot. Estatística fácil. São Paulo: Saraiva, 2002.