Estatística: Conceitos e Organização de Dados
IntroduçãoConceitosMétodo EstatísticoDados EstatísticosTabulação de DadosGráficos
Disciplina: Estatística Básica
Professor: Fabrício Bueno
Introdução
O que é Estatística?
– É a parte da matemática aplicada que se ocupa em obter conclusões a partir de dados observados
– É uma metodologia ou conjunto de técnicas que utiliza: Coleta de dadosColeta de dados Classificação de dados Classificação de dados Apresentação ou representação dos dadosApresentação ou representação dos dados Análise e interpretaçãoAnálise e interpretação
Introdução
Por que estudar?– Entender grandes volumes de informação (pesquisas
de mercado, índices populacionais, acessos a sites)– Qualidade de processos (CEP)– Previsões confiáveis (projeções financeiras e
populacionais, vida útil de equipamentos)– Planejamento (coleta de dados, definição de
amostras, planos de contingência)
Ramos da Estatística
Descritiva ou Dedutiva– Descreve e analisa grupos de observações
(amostras)– Uso de medidas e formas de representação (tabelas,
gráficos, curvas, ...)
Inferencial ou Indutiva
– Processo de generalização a partir da análise e interpretação de dados amostrais
Ramos da Estatística
Probabilidade
– Parte da Estatística que utiliza métodos e técnicas apropriadas para o estudo de processos com margem de incerteza
Pesquisa Social
A importância da pesquisa social
– Explicar e predizer o comportamento humano
– Examinar características do comportamento humano chamadas variáveis
➢ Variáveis: características que diferem ou variam de um indivíduo para o outro ou de um instante para o outro no decorrer do tempo
Variáveis
As variáveis são, basicamente:
– Dependentes (efeito)– Independentes (causa)
A relação entre variáveis dependentes e independentes se dá por testes de hipóteses
➢ Exemplo: Identificar a relação entre anos de estudo e número de dependentes químicos; Índice de delinquência e número de pais
Variáveis: outras classificações
Qualitativas ou nominais– valores expressos por atributos não numéricos (Ex:
cor, forma, profissão, ...)
Quantitativas– Valores expresso por números (Ex: resistência, peso,
idade, ...)
Conceitos
As variáveis quantitativas se dividem:
– Contínuas – variáveis podem assumir infinitos valores num intervalo (Ex: peso de uma pessoa, tamanho do pé de uma pessoa)
– Discretas – variáveis só podem finitos valores num intervalo (Ex: número de alunos numa sala, tamanho do calçado de uma pessoa)
Formas de Pesquisa
Experimento– Grau de controle; Manipulação de variáveis
independentes (grupo experimental e de controle)
Survey– Relatórios verbais; Questionários; Entrevistas; ....
Análise de conteúdo– Jornais, livros, cartas, desenhos, músicas, revistas,...
Observação participativa Análise secundária
– Dados preexistentes
Etapas do Método Estatístico
Definição do problema - hipótese passível de teste Planejamento - conjunto apropriado de instrumentos Coleta de Dados Apuração dos Dados Apresentação dos Dados Análise e interpretação
Coleta direta– Contínua– Periódica– Ocasional
Coleta indireta (inferência a partir da coleta direta)
Exemplo: Coleta de média de reprovação do ensino médio a partir da coleta dos registros
diários de frequência
Coleta de dados
Dados Estatísticos
O método estatístico é análogo à lapidação e polimento de pedras preciosas
Dados brutos numerosos/ matéria bruta com alta rugosidadeTabulação de dados /redução de rugosidadeAnálise estatística para obter informações desejadas/
lapidação para obter a forma desejadaApresentação gráfica/ polimento para obtenção de brilho
Dados Estatísticos
Organização
– Brutos – dados não organizados
– Rol – dados organizados em ordem crescente ou decrescente
Organização de Dados
Distribuição de frequências/Tabela de frequências Absoluta
– Frequência simples Relativa (%)
Absoluta
– Frequência Acumulada Relativa (%)
14,5 10 9,1% 10 9,1%
24,5 20 18,2% 30 27,3%
34,5 50 45,4% 80 72,7%
44,5 20 18,2% 100 90,9%
54,5 10 9,1% 110 100,0%
Custo de produção (em
m ilhões)
Frequência sim ples absoluta
Frequência sim ples relativa
Frequência acum ulada
absoluta
Frequência acum ulada
relativa
Organização de Dados
Intervalos de Classe– Forma de categorizar dados– Permite agrupar grandes volumes de dados– Auxilia na detecção de padrões– Mínimo recomendável: 4 classes– Máximo recomendável:20 classes
Tabela de frequência em classes
Organização de Dados
Você consegue enxergar um padrão nestes dados?
Medidas de uma peça na linha de produção
8,60 9,05 9,76 11,09 9,02 11,07 9,08 10,60 8,70 8,90 8,7011,01 10,04 9,02 10,00 11,08 11,07 12,01 11,07 11,10 8,03 8,079,07 9,10 10,04 11,02 8,90 10,04 12,01 11,04 12,05 8,70 9,8011,04 10,80 12,05 10,01 10,06 9,54 8,60 12,06 9,70 10,04 11,0911,04 9,70 9,09 10,60 12,09 11,10 8,90 8,02 12,05 11,09 12,0911,03 10,02 8,05 9,02 9,06 11,09 11,09 10,01 12,01 10,04 12,089,80 10,07 11,07 8,06 8,91 11,05 11,01 8,08 8,00 12,04 12,049,80 12,01 9,04 9,06 10,05 10,08 11,05 9,02 8,04 11,06 10,0410,00 8,90 12,01 12,04 8,02 9,60 8,02 9,05 11,05 9,02 12,1010,04 11,06 9,02 10,08 8,04 9,02 12,10 11,08 9,56 8,09 9,0411,08 9,60 8,01 9,04 8,03 8,76 12,00 10,80 11,00 12,08 9,059,70 10,05 12,00 10,00 9,03 11,10 10,00 12,07 10,03 12,08 10,909,70 10,04 9,02 9,09 12,03 9,80 11,04 12,01 8,90 9,70 9,708,80 10,70 10,07 9,55 8,02 9,03 9,70 9,10 9,03 8,08 12,0310,07 9,05 10,06 8,03 12,05 12,06 11,08 11,07 9,09 9,00 8,069,80 10,01 11,04 11,06 12,09 11,03 8,01 9,88 8,09 9,09 9,029,80 10,70 10,01 9,90 8,80 12,01 10,07 9,06 10,04 8,03 10,0711,04 10,05 10,05 9,00 9,00 10,00 11,02 10,00 10,80 8,03 10,708,01 9,60 9,05 9,01 9,04 10,00 8,08 10,70 10,80 10,80 8,559,70 8,70 9,87 9,07 9,70 11,01 8,05 11,02 9,04 10,04 8,90
Organização de Dados
Dicas para criar uma tabela de frequência
– O número de classes pode ser estimado pela fórmula
O intervalo de classe pode ser estimado pela fórmula
– Tradicionalmente, o limite inferior do intervalo de classe é múltiplo de seu tamanho
k= n
I=MAX −MIN
k
Organização de Dados
Seguindo as estimativas anteriores:– K=14,83– I=0,28– Classes:
8 |—8,28
8,28 |— 8,42
8,42 |— 8,70
.
.
.
Outra alternativa– K=8– I=0,5– Classes:
8 |—8,5
8,5 |— 9
9 |— 9,5
9,5 |— 10,0
10,0|— 10,5
10,5|— 11,0
11,0|— 11,5
11,5|—
Às vezes o bom senso pode ser
preferível, porém podem haver
perdas
Não há bom padrão visual,
embora estatisticamente
correto
Organização de Dados
Calcule as demais frequências!
8,0 8,50 258,5 9,00 179,0 9,50 389,5 10,00 25
10,0 10,50 3610,5 11,00 1211,0 11,50 3811,5 12,00 29
ClassesFrequência
SimplesAbsoluta
Frequência SimplesRelativa
Frequência Acumulada
Absoluta
Frequência Acumulada
Relativa|―|―|―|―|―|―|―|―
Organização de Dados
8,0 8,50 25 11,36% 25 11,36%8,5 9,00 17 7,73% 42 19,09%9,0 9,50 38 17,27% 80 36,36%9,5 10,00 25 11,36% 105 47,73%
10,0 10,50 36 16,36% 141 64,09%10,5 11,00 12 5,45% 153 69,55%11,0 11,50 38 17,27% 191 86,82%11,5 12,00 29 13,18% 220 100,00%
ClassesFrequência
SimplesAbsoluta
Frequência SimplesRelativa
Frequência Acumulada
Absoluta
Frequência Acumulada
Relativa|―|―|―|―|―|―|―|―
Outras formas de tabela
Pesquise– Componentes de uma tabela e suas funções
– Tabelas com séries históricas, geográficas, específicas e conjugadas (dê exemplos)
– Normas para confecção de tabelas
Organização de Dados
Índices: razões entre duas grandezas diferentes
Coeficientes:razão entre o número de ocorrências e o total
Taxas: Coeficientes multiplicados por uma potência de dez para facilitar leitura
renda per capta=renda
populacao
coeficientede inadinplência=inadinplentesclientes
taxa de inadinplência=coeficientede inadinplência∗100
Representação Gráfica
Gráficos estatísticos são formas de apresentação de dados com o objetivo de facilitar o entendimento dos fenômenos em estudo
A seguir são apresentados alguns tipos de gráficos
Representação Gráfica
Gráfico de Colunas – ideal para comparar dados agrupados em classes ou dados nominais
0
20
40
60
80
100
Abril Maio Junho Julho
Representação Gráfica
Gráfico de Barras – ideal para comparar dados com rótulos longos agrupados em classes ou dados nominais
20,4
50
20
80
0 20 40 60 80 100
Lazer
Saúde
Educação
Alimentação
Representação Gráfica
8,0 |― 8,50
8,5 |― 9,00
9,0 |― 9,50
9,5 |― 10,00
10,0 |― 10,50
10,5 |― 11,00
11,0 |― 11,50
11,5 |― 12,00
0 5 10 15 20 25 30 35 40
Medidas de peças em uma linha de produção
Distribuição de Frequências
Frequências
Ca
teg
ori
as
de
Me
did
a
Representação Gráfica
Gráfico de Linhas – ideal para indicar variações e tendências de valores de um determinado fenômeno
7568
20
110
0
20
40
60
80
100
120
1998 1999 2000 2001
Representação Gráfica
Gráfico em Setores ou Pizza – ideal para dados que representam quantidades ou percentuais
20%
15%
5%
60%
Saúde
Educação
Defesa
Administração
Representação Gráfica
Gráfico de Dispersão – ideal comparar pares de valores e distribuição de dados
20
5
6160
14
5047
50
20
5
6160
14
5047
27
0
10
20
30
40
50
60
70
0 1 2 3 4 5
Representação Gráfica
Pictograma – gráficos ilustrados de fácil entendimento, voltados para público em geral
Exemplo
Complete a tabela e construa os gráficos solicitados
Distribuição de alunos em faixas de peso
UFFS - 2010
Identifique nesta tabela os componentes: corpo, cabeçalho, coluna indicadora e título
Faixa de Peso
40 |– 60 40
60 |– 80 95
80 |– 100 60
100 |– 110 10
110 |– 8
Freqüência simples absoluta
Freqüência simples relativa
Freqüência acumulada
absoluta
Freqüência acumulada
relativa
População, amostra e amostragem População
– Maior conjunto tomado como referência na observação de um fenômeno
– Conjunto de entes portadores de, pelo menos, uma característica em comum
Amostra– Subconjunto não vazio da população– Excetuando-se a própria população– Seu uso gera economia e rapidez dos resultados– Deve ser representativa da população, ou seja, deve
possuir as mesmas características básicas da população
População, amostra e amostragem
Amostragem – Técnica para escolher amostras que garanta
o acaso na escolha
– Ou seja, qualquer elemento da população tem a mesma probabilidade de ser escolhido
– Uma boa técnica de amostragem garante representatividade da amostra
Tipos de amostragem:– Amostragem casual ou aleatória
Técnica de amostragem onde cada elemento da população tem a mesma probabilidade de ser incluído na amostra
Exemplo: sorteiosPode-se utilizar tabela de números aleatórios para
grandes amostras
População, amostra e amostragem
Tipos de amostragem:– Amostragem proporcional estratificada
Grupos heterogêneos entre si, mas homogêneos internamente
Quando a população é dividida em estratos e a amostragem é proporcional a eles
Ex: Uma amostra de 10% de alunos em uma classe de 40 homens e 60 mulheres, consistirá na escolha aleatória de 4 homens e 6 mulheres
População, amostra e amostragem
População, amostra e amostragem
Tipos de amostragem– Amostragem sistemática
Quando os elementos da população já estão ordenados, faz-se uma amostragem sistemática
Ex: Para se obter uma amostra de 50 elementos em 15 lotes de 100 produtos, temos os passos a seguir:
Exercício
Suponha uma linha de produção que produz, diariamente, 15 lotes de 100 produtos cada.
Faça uma amostragem sistemática de 10% da produção.
1) 15 X 100 = 1500 produtos
2)1500 X 10%= 150
3) 1500/150 = 10, logo será selecionado um produto a cada 10
unidades
4) Um número de 1 a 10 é escolhido aleatoriamente (por
exemplo, o número 7)
5) Serão escolhidos os produtos 7, 17, 27, 37, 47, ...
Atividade Prática
O formulário Pesquisa Estudantil, baseado em Levin & Fox (2004), trata-se de uma pesquisa sobre tabagismo
Obtenha uma amostra e colete os dados Organize-os em tabelas e gere os gráficos que
julgarem pertinentes
Estes dados serão utilizados para nos estudos de medidas de posição e dispersão