direÇÃo acadÊmica - famportalacademico.com.br · direÇÃo acadÊmica célia jussani direÇÃo...

63

Upload: dolien

Post on 16-Nov-2018

233 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL
Page 2: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

DIREÇÃO ACADÊMICACélia Jussani

DIREÇÃO GERALFlorindo Corral

DIREÇÃO ADMINISTRATIVAGustavo Azzolini

COORDENAÇÃO GERAL DE EADSandra Regina Giraldelli Ulrich

DIAGRAMAÇÃO E ARTE FINALReinado Silveira Carvalho

REVISÃO FINALMeire Terezinha Müller

PROBABILIDADEE ESTATÍSTICA

AUTORAEliana Mara Oliveira Lippe

Page 3: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

FICHA CATALOGRÁFICA

Elaborada pela Biblioteca Central da FAM

L742p

Lippe, Eliana Mara Oliveira

Probabilidade e estatística / Eliana Mara Oliveira Lippe ; diagramação e arte final de Reinaldo Silveira Carvalho ; revisão final de Meire Terezinha Müller. -- Americana, 2015. 93 f. : il. Apostila elaborada para a disciplina EAD Probabilidade e estatística - Faculdade de Americana. Núcleo Geral. 1. Estatística matemática. 2. Probabilidades. I. Carvalho, Reinaldo

Silveira. II. Müller, Meire Terezinha. III. Título.

CDU 311.1

Proibida a reprodução total ou parcial por meio de impressão, em forma idêntica, resumida

ou modificada em língua portuguesa ou qualquer outro idioma

1ª edição - 2015

1ª edição, 1ª reimpressão - 2016

Page 4: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

A Faculdade de Americana – FAM é mantida pela Associação Educacional Americanense, está

situada Endereço: Av. Joaquim Boer, 733 – Americana-SP; CEP 13477-360 e foi Credenciada pela Portaria

MEC nº 766/99 – DOU 18/05/1999.

A história da IES começou quando os dirigentes do então Colégio Bandeirantes, atual Instituto

Educacional de Americana, decidiram constituir uma nova entidade mantenedora, a Associação Educacional

Americanense, que tem como mantida a Faculdade de Americana.

O projeto de instalação da Faculdade de Americana – FAM foi resultado das condições econômico-

educacionais que a região de Americana apresenta, além de experiência dos seus dirigentes como

educadores atuantes.

A Associação Educacional Americanense entende que o ensino, a pesquisa e a extensão não

podem deixar de responder de forma dinâmica, eficiente e consequente aos problemas sociais que refletem

as necessidades da comunidade local, regional e nacional.

Para operacionalizar o projeto de criação dos cursos superiores, a entidade mantenedora consultou

especialistas das diversas áreas do conhecimento.

Assim, o projeto FAM foi idealizado com seriedade e acima de tudo com o compromisso de oferecer

a universalidade do saber: caráter substancial das instituições que justificam suas funções na comunidade

onde estão inseridas.

MISSÃO

A missão da FAM é produzir e disseminar o conhecimento nos diversos campos do saber, contribuindo

para o exercício pleno da cidadania mediante formação humanista, crítica e reflexiva, consequentemente

preparando profissionais competentes e atualizados para o mundo do trabalho presente e futuro.

VISÃO

"Tornar-se referência no ensino superior, promovendo o desenvolvimento da educação, cultura e

conhecimento nas regiões do polo têxtil e metropolitana de Campinas".

VALORES

• Ética, credibilidade e transparência;

• Visão humanista entre ensino, pesquisa e extensão;

• Compromisso social;

• Comprometimento com a qualidade;

• Gestão participativa;

• Profissionalismo e valorização de recursos humanos;

• Universalidade do conhecimento e fomento à interdisciplinaridade

Page 5: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

Prezado (a) Aluno (a),

Seja bem-vindo (a) à FAM – Faculdade de Americana!

Sentimo-nos orgulhosos em tê-lo fazendo parte da história que estamos construindo.

Aluno ingressante, que está dando início a esta fase tão importante, ou você que dá continuidade aos seus estudos, esteja certo de que o seu sonho é parte das nossas metas e que estaremos trabalhando, constantemente, para torná-lo um profissional capaz e um cidadão completo.

Uma equipe empenhada também está à sua disposição para esclarecer quaisquer dúvidas que permaneçam em relação ao curso.

Desejamos a todos bons estudos!

PROF. FLORINDO CORRALDireção GeralFAM I Faculdade de Americana

Page 6: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

SUMÁRIO

Amostragem 8

Variáveis 14

Tabela 19

UNIDADE 1

UNIDADE 2

UNIDADE 3

Gráficos 25

Moda 30

UNIDADE 4

Média 34

Mediana 37

Quartis 40

Percentis 43

Page 7: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

Intervalo de Classes 46

Desvio Padrão 53

UNIDADE 5

UNIDADE 6

Amplitudes de Variância 49

Coeficiente de Variação 56

Coeficiente de Correlação 60

Page 8: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

8

PROBABILIDADE E ESTATÍSTICAUnidade 1

Nesta aula, você estudará:

• Processo de amostragem.

•Definiçãodepopulação.

•Definiçãodosmétodosdeamostragem.

•Escolhadadimensãodaamostra.

Ao final, você deverá ser capaz de responder às seguintes questões:

•Definaoqueéamostragem.

•Comosedefineoprocessodeamostragem?

•Quaisosdiversostiposdeamostragem?

•ComosedefineointervalodeconfiançaparaoP?

Neste tema você verá as principais questões relacionadas à amostragem: o que é; em que circunstância é aplicada; como determinar. A ideia é compreender na teoria o que é o processo de amostragem e traduzi-lo para a prática diária.

Amostragem

Qual é o primeiro ponto a se pensar quando falamos em Amostragem? Seria relacionar esse conceito a partir de alguns itens de uma caixa que simbolizassem o total de itens, correto? Sim!

Definimos o conceito de amostragem como um conjunto de todos oselementosquesedesejaestudar. A este conjunto denominamos de população. Mas então como definiríamos o termo população? Seria uma coleção de todos os possíveis elementos, objetos ou medidas de interesse.

ConteúdoseHabilidades

LeituraObrigatória

UNIDADE 1TEMA 1:

AMOSTRAGEM

Amostragem é um conjunto de todos os elementos que se deseja estudar.

Page 9: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

9

PROBABILIDADE E ESTATÍSTICAUnidade 1

Alguns exemplos que melhor definem o termo população:

• Conjunto das rendas de todos os habitantes de São Paulo;

• Conjunto de todas as notas dos alunos de Estatística.

Como geralmente o conjunto das amostras é muito grande e dificultaria a combinação para fazer as análises, determinou-se que pode ser utilizada uma amostra, a fim de representar o todo que deveria ser analisado. Como então pode ser caracterizada uma amostra? É definida como uma porção ou parte de uma população de interesse.

Alguns exemplos que melhor definem a amostra nos dias de hoje seriam:

• Antes da eleição diversos órgãos de pesquisa e imprensa ouvem um conjunto selecionado de eleitores para ter uma ideia do desempenho dos vários candidatos.

• IBGE faz levantamentos periódicos sobre emprego, desemprego, inflação, etc.

• Em pesquisas científicas, pesquisadores utilizam deste recurso para determinar a performance reprodutiva dos animais.

Existe alguns riscosdeamostragem O risco é decorrência da quantidade das amostras analisadas. Pequenas quantidades analisadas podem não ser representativas do todo que deveria ser analisado. A teoriadaprobabilidade pode ser utilizada para fornecer uma ideia do risco envolvido, ou seja, o erro de usar uma amostra ao invés do todo.

Mas como é feita a escolha desta amostra? Os elementos que comporão a amostra devem ser escolhidos ao acaso, pois caso contrário seria considerada amostra viciada.

Baseados nestes conceitos, podemos definir Estatística IndutivaouInferencial como sendo a coleção de métodos e técnicas utilizados para se estudar uma população baseados em amostras probabilísticas (aleatória) desta mesma população. Porém quando podemos dizer que a amostra é probabilistica (aleatória)? Ocorre quando todos os elementos da população tiverem probabilidade conhecida - e não zero - de pertencer à amostra. Para isso, a amostra deve satisfazer o critério de amostraaleatóriasimples (aas).

Amostra é uma porção ou parte de uma população de interesse.

Representaçãovisualdeumprocessodeamostragem.

Fonte:Wikipedia

Page 10: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

10

PROBABILIDADE E ESTATÍSTICAUnidade 1

Melhor explicando: se N representa o tamanho da população e n<N o tamanho da amostra, então o número de amostras possíveis - de acordo com os critérios com e sem reposição - será:

a) Com reposição: k = número de amostras = Nn

b) Sem reposição: k = número de amostras =

Uma caracteristica da população é denominada parâmetro (P). Um parâmetro é uma constante, isto é, um número que representa uma característica única da população. Assim, se P é uma população, os principais parâmetros seriam:

• A média de P µP

• A variância de P δP2

• O desvio padrão de P δP

• A proporção de elementos de P que apresentam determinada caracteristica π

** Exemplos: para a população P = {1, 3, 5, 6} os parâmetros acima seriam:

µP = (1+3+5+6)/4 = 3,75

δP2 = (1+9+25+36)/4 = 3,69

δP = 1,9203 = 1,92

π = ¼ = 25%, onde o numerador representa o número de elementos pares na população.

Importante:

Se a população for infinita ou muito grande, então as retiradas com e sem reposição serão equivalentes, isto é, o fato de realocar o elemento retirado de volta na população não vai afetar em nada a probabilidade de extração do elemento seguinte.

Se, no entanto, a população for finita ou muito pequena, será necessário fazer uma distinção entre os dois procedimentos, pois na extração com reposição as diversas retiradas serão independentes, só não se alterando se for no processo sem reposição.

Page 11: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

11

PROBABILIDADE E ESTATÍSTICAUnidade 1

Um estimador é uma caracteristica da amostra. Como a amostra é aleatória, um estimador é uma variável aleatória. Assim, tudo o que foi visto em probabilidade sobre variáveis aleatórias, aplica-se aos estimuladores. A distribuição de probabilidade de um estimador é denominada distribuiçãoamostral.

Os principais estimadores são:

• A média da amostra, X que é um estimador da média da população: µ

• A variância amostral, S2 que é um estimador da variância populacional: δ2

• A proporção amostral, P, que é um estimador amostral da proporção populacional π.

Uma estimativa é um valor único de um estimador. Assim X = 2 é uma estimativa. O estimador é a expressão (fórmula) enquanto que a estimativa é o valor particular que ele assume (número).

O erropadrãodamédia mede a variabilidade entre as médias amostrais e dá a ideia do erro que se comete ao se subsitituir a média da população pela média da amostra. Se a população é grande ou infinita, não mais será possível pensar em construir tabelas para representar a distribuição das médias amostrais. Neste caso, é necessário procurar por modelos probabilísticos que descrevam a distribuição da média amostral. Neste caso, como já explicado acima, a distinção entre amostragem com e sem reposição não será necessário, pois o fator de correção será “aproximadamente um” e não necessitará ser utilizado.

O tipo de amostragem pode ser classificado em probabilístico ou não probabilistico. A classificação probabilistica ou aleatória é a mais utilizada. Dentro da amostragem não probabilistica temos: a amostragem a esmo, intencional e cotas. Já para a probabilistica, existem a amostragem simples ou ocasional, a sistemática, a estratificada ou por conglomerados. Entenda melhor analisando cuidadosamente o gráfico abaixo:

Um estimador é uma caracteristica da amostra.

O tipo de amostragem pode ser classificado em probabilístico ou não probabilistico.

Page 12: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

12

PROBABILIDADE E ESTATÍSTICAUnidade 1

a)Amostragemsimples é o processo mais utilizado. Todos os elementos da população têm a igual probabilidade de serem escolhidos (para um população finita o processo dever ser sem reposição). O importante é numerar todos os elementos e realizar um sorteio, utilizando a tabela de números aleatórios.

b)Amostragemsistemática trata-se de uma variação da amostragem aleatória simples, conveniente quando a população está naturalmente ordenada, como fichas em um fichário, lista telefônica, etc. Ela é utilizada frequentemente em pesquisas que obrigam que a seleção seja feita durante a etapa de coleta dos dados, por pessoas que não estão familiarizadas com tabelas de números aleatórios ou com uso de software.

c)Amostragemestratificada é um processo de amostragem usado quando nos deparamos com populações heterogêneas, nas quais pode-se distinguir subpopulações mais ou menos homogêneas, denominadas estratos. A partir destes estratos seleciona-se uma amostra aleatória de cada subpopulação, porém sempre guardando as devidas proporcionalidades.

Page 13: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

13

PROBABILIDADE E ESTATÍSTICAUnidade 1

O dimensionamento da amostra deve ser feito a partir da determinação do tamanho total da amostra. O importante, se possivel, é escolher sempre mais de uma váriavel. Verifique a mensuração da variável (se nominal, ordinal ou intervalar) e considere se a população é finita ou infinita.

Leia o artigo: A importância da estatística na formação do profissional pedagogo, do autor Aloisio Machado da Silva Filho. Disponível em: http://www.cairu.br/revista/arquivos/artigos/2014/Artigo%20A%20IMPORTANCIA%20DA%20ESTATISTICA.pdf. Acesso em 09 de setembro de 2014. O artigo propoe uma analise da função estatitica nas mais diversas formações profissionais, principalmente pedagogo.

Leia o artigo: Estatística através de rosas dos ventos para o aeródromo do galeão como auxílio à elaboração do código TAF, do autor Jéssica Motta Guimarães. Disponível em: http://www.redemet.aer.mil.br/Artigos/Estat%C3%ADstica_atrav%C3%A9s_de_rosas_dos_ventos_para_o_aeroporto_do_Gale%C3%A3o_como_aux%C3%ADlio_ao_TAF.pdf. Acesso em 09 de setembro de 2014. O artigo mais aplicado de estatitica com as suas variações.

Neste tema você aprendeu, brevemente, como podemos utilizar a amostragem nas mais variadas circunstâncias estatísticas. Aprendeu também como calculá-la e como diferenciá-la nos mais variados processos.

AmostragemPartes de um conjunto de todos os elementos que se deseja estudar.

ErropadrãodamédiaMede a variabilidade entre as médias amostrais e dá a ideia do erro que se comete ao se subsitituir a média da população pela média da amostra.

TipodeamostragemPode ser classificado em probabilístico ou não probabilístico.

IBGEInstituto Brasileiro de Geografia e Estatística.

EsmoEscolha aleatória.

LinksImportantes

Quando não se conhece o desvio padrão, deve-se utilizar um valor preliminar obtido por processos como fazer uma aproximação ou realizar um estudo piloto, iniciando o processo de amostragem pequeno. Pode-se utilizar este valor como desvio padrão populacional.

SaibaMais

Finalizando

Glossário

Page 14: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

14

PROBABILIDADE E ESTATÍSTICAUnidade 2

Nesta aula, você estudará:

• O que são variáveis.

• Tipos de variáveis.

• Níveis de mensuração.

• Relação entre as variáveis.

Ao final, você deverá ser capaz de responder às seguintes questões:

• O que são variáveis? Dê uma definição.

• Como ela são classificadas?

• Quais os principais tipos de variáveis?

• É possível relacionar a teoria com a prática aplicando o conceito de variáveis?

Neste tema você terá a oportunidade de aprofundar seus conhecimentos sobre variáveis e saber como aplicá-las. A ideia é compreender o conceito - na teoria - e relacioná-lo com a prática diária.

Qual é o primeiro ponto a se pensar quando falamos em Variáveis? São as mais variadas situações que devemos considerar em cada problema em questão.

Para que estudar variáveis? Para aprender a analisar os dados que precisam ser avaliados. Como podemos definir o conceito de variáveis? São características que são medidas, controladas ou manipuladas em uma pesquisa. Diferem em muitos aspectos, principalmente no papel que a elas é dado em uma pesquisa e na forma como podem ser medidas.

Alguns exemplos que melhor definem as variáveis:

• Em uma pesquisa científica sobre reprodução, deve-se considerar a quantidade de fêmeas por macho para o acasalamento;

• Em uma pesquisa sobre preferência do eleitor por candidatos – do tipo feita pelo IBOPE para as eleições - considerar todos os pontos a favor e contra os candidatos em questão para vencer as eleições.

ConteúdoseHabilidades

UNIDADE 2TEMA 2:

VARIÁVEIS

LeituraObrigatória

Variáveis são características que são medidas, controladas ou manipuladas em uma pesquisa.

Page 15: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

15

PROBABILIDADE E ESTATÍSTICAUnidade 2

A maioria das pesquisas empíricas pertencem claramente a uma dessas categorias gerais: em uma pesquisa correlacional (levantamento) o pesquisador não influencia (ou tenta não influenciar) nenhuma variável, mas apenas as mede e procura por relações (correlações) entre elas, como pressão sanguínea e nível de colesterol. Em uma pesquisaexperimental(experimento) o pesquisador manipula algumas variáveis e então mede os efeitos desta manipulação em outras variáveis; por exemplo, aumentar artificialmente a pressão sanguínea e registrar o nível de colesterol.

A análise dos dados em uma pesquisa experimental também calcula (calcula? Não seria analisa?) “correlações” entre variáveis, especificamente entre aquelas manipuladas e as que foram afetadas pela manipulação. Entretanto, os dados experimentais podem demonstrar conclusivamente relações causais (causa e efeito) entre variáveis. Por exemplo, se o pesquisador descobrir que sempre que muda a variável A também muda a varíavel B, então ele poderá concluir que A “influencia” B. Dados de uma pesquisa correlacional podem ser apenas “interpretados”em termos causais com base em outras teorias (não estatísticas) que o pesquisador conheça, mas não podem conclusivamente provar causalidade.

Os tiposdevariáveis são:

Variáveisindependentes - são aquelas manipuladas, enquanto que variáveis dependentes são apenas medidas ou registradas. Esta distinção confunde muitas pessoas que dizem que “todas as variáveis dependem de alguma coisa”. Entretanto, uma vez que se esteja acostumado a esta distinção, ela se torna indispensável. Os termos variável dependente e independente aplicam-se principalmente à pesquisa experimental, onde algumas variáveis são manipuladas, e neste sentido, são “independentes”dos padrões de reação inicial, intenções e características dos sujeitos da pesquisa (unidades experimentais). Espera-se que outras variáveis sejam “dependentes”da manipulação ou das condições experimentais. Ou seja, elas dependem “do que os sujeitos farão” em resposta. Contrariando um pouco a natureza da distinção, esses termos também são usados em estudos em que não se manipulam variáveis independentes, literalmente falando, mas apenas se designam sujeitos. Por exemplo, se em uma pesquisa compara-se a contagem de células brancas de homens e mulheres, sexo pode ser chamado de variável independente e célula branca de variável dependente.

Há obviamente algum erro em cada medida, o que determina o “montante de informação” que se pode obter, mas basicamente o fator que determina a quantidade de informação que uma variável pode prover é o seu tipo de mensuração. Sob este prisma as variáveis são classificadas como:

LogodoInstitutoBrasileirodeOpiniãoPúblicaeEstatística.

Fonte:Ibope.com.br

Em uma pesquisa experimental (experimento) o pesquisador manipula algumas variáveis e então mede os efeitos desta manipulação em outras variáveis.

Page 16: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

16

PROBABILIDADE E ESTATÍSTICAUnidade 2

• Nominais: permitem apenas classificação qualitativa. Seus valores possíveis são diferentes categorias não ordenadas, em que cada observação pode ser classificada. Exemplos: raça, nacionalidade, área de atividade.

• Ordinais: permitem ordenar os itens medidos em termos de qual tem menos e qual tem mais da qualidade representada pela variável, mas ainda não se permite que se diga “o quanto mais”. Também são variáveis qualitativas; seus valores possíveis são diferentes categorias ordenadas, em que cada observação pode ser classificada. Exemplos: classe social, nível de instrução.

• Discreta: São variáveis quantitativas. Seus valores possíveis são em geral resultados de um processo de contagem. Exemplos: número de filhos, número de séries escolares cursadas com aprovação.

• Contínua: Também são variáveis quantitativas. Seus valores possíveis podem ser expressos através de números reais e varrem uma escala contínua de medição. Exemplos: renda mensal, peso e altura.

• Intervalares: permitem não apenas ordenar em postos os itens que estão sendo medidos, mas também quantificar e comparar o tamanho das diferenças entre eles.

As variáveis discretas são obtidas mediante alguma forma de contagem, ao passo que os valores das variáveis contínuas resultam, em geral, de uma medição, sendo frequentemente dados em alguma unidade de medida. Outra diferença entre os tipos de variáveis quantitativas está na interpretação de seus valores. Assim, a interpretação de um valor de uma variável discreta é dada exatamente por este mesmo valor. Quando dizemos que um casal tem dois filhos, isso significa que o casal tem exatamente 2 filhos. A interpretação de um valor de uma variável contínua, ao contrário, é a de que se trata de um valor aproximado. Isso decorre do fato de não existirem instrumentos de medida capazes de oferecer precisão absoluta e, mesmo que existissem, não haveria interesse e nem sentido em se querer determinar uma grandeza contínua com todas as suas casas decimais. Logo, se ao executarmos a medição de algum valor de uma variável contínua estamos sempre fazendo uma aproximação, resulta que qualquer valor apresentado de uma variável contínua deverá ser interpretado como uma aproximação compatível com o nível de precisão e com o critério utilizado ao medir.

Duas ou mais variáveis quaisquer estão relacionadas se numa amostra de observação os valores dessas variáveis são distribuídos de forma consistente. Geralmente o objetivo principal de toda pesquisa ou análise científica é encontrar relações entre variáveis. A filosofia da ciência ensina que não há outro meio de representar “significado” exceto em termos de relações entre quantidades ou qualidades, e ambos os casos envolvem relações entre variáveis.

As variáveis diferem em “quão bem” elas podem ser medidas, isto é, em quanta informação seu nível de mensuração pode prover.

SaibaMais

Geralmente o objetivo principal de toda pesquisa ou análise científica é encontrar relações entre variáveis.

Page 17: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

17

PROBABILIDADE E ESTATÍSTICAUnidade 2

As duas propriedades formais mais elementares de qualquer relação entre variáveis são a magnitude (“tamanho”) e a confiabilidade da relação.

•Magnitude: é mais fácil de se medir do que confiabilidade. Por exemplo, se cada homem em nossa amostra tem uma contagem de células brancas maior do que o de qualquer mulher da amostra, poder-se-ia dizer que a magnitude da relação entre as duas variáveis é muito alta em nossa amostra.

•Confiabilidade: é um conceito muito menos intuitivo. Relaciona-se à “representatividade” do resultado encontrado em uma amostra específica de toda a populaçào. Em outras palavras, diz quão provável será encontrar uma relação similar se o experimento fosse feito com outras amostras retiradas da mesma população, lembrando que o maior interesse está na população. O interesse na amostra reside na informação que ela pode prover sobre a população. Se o estudo atender a certos critérios específicos, então a confiabilidade de uma relação observada entre variáveis na amostra pode ser estimada quantitativamente e representada usando uma medida padrão.

Porqueasignificânciadeumarelaçãoentrevariáveisdependedotamanhodaamostra?

Se há muito poucas observações, então há também poucas possibilidades de combinação dos valores das variáveis, e então a probabilidade de obter por acaso uma combinação desses valores que indique uma forte relação é relativamente alta.

Quando é feito um levantamento de dados a respeito de um determinado assunto, eles costumam ser representados em uma tabela de dados brutos, na qual cada linha corresponde a uma observação e cada coluna corresponde a uma variável.

Eventualmente em uma massa de dados há valores que foram coletados em condições anormais (falha do equipamento, queda da energia, erro do operador, erro de leitura, erro de digitação, etc). Esses valores, principalmente quando estão muito afastados dos demais (para mais ou para menos), infelizmente podem afetar de forma substancial o resultado das análises estatísticas. São chamadas observações discrepantes ou outliers. Assim sendo, é útil que tenhamos disponível um critério de detecção de observações discrepantes. Uma vez detectada a presença desta, poderá ser tomada a decisão de repetir aquele experimento, ou meramente expurgar aquele dado da amostra (ou mesmo mantê-lo, se for encontrada uma explicação plausível para aquela discrepância).

Page 18: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

18

PROBABILIDADE E ESTATÍSTICAUnidade 2

Leia o artigo: Apostila de Estatística, do autor Marcelo Beneti. Disponível em: http://www.administradores.com.br/artigos/negocios/apostila-de-estatistica/40665/. Acesso em 10 de setembro de 2014. A apostila fundamenta os principais conceitos relacionados às variáveis estatísticas, dentre outros tópicos.

Leia o artigo: Planejamento estatístico de experimento científico, do autor José Benício Chaves. Disponível em: http://www.dta.ufv.br/artigos/planestat.htm. Acesso em 10 de setembro de 2014. Definição de como determinar variáveis no campo científico e experimental.

Leia o artigo: A escolha do teste estatístico – um tutorial em forma de apresentação em Power Point, dos autores David Normando; Leo Tjaderhane; Catia Cardoso Quintão. Disponível em: http://www.scielo.br/pdf/dpjo/v15n1/12.pdf. Acesso em 10 de setembro de 2014. Definição de como determinar a escolha dos testes estatísticos envolvendo variáveis.

Neste tema você aprendeu, brevemente, como utilizar as variáveis e como classificá-las adequadamente nas mais variadas circunstâncias estatísticas.

VariáveisAmostragem como um conjunto de todos os elementos que se deseja estudar.

OrdinalMede a variabilidade entre as médias amostrais e dá a ideia do erro que se comete ao se subsitituir a média da população pela média da amostra.

IntervalaresPode ser classificado em probabilístico ou não probabilístico.

DiscrepanteFora do comum.

MagnitudeIdeia relacionada ao tamanho.

LinksImportantes

Finalizando

Glossário

Page 19: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

19

PROBABILIDADE E ESTATÍSTICAUnidade 3

Nesta aula, você estudará:

• Como preparar uma tabela.

• Como os dados devem ser ordenados.

• Quais os tipos de tabelas existentes.

• Comparação entre as tabelas e os dados obtidos com gráficos.

Ao final, você deverá ser capaz de responder às seguintes questões:

• Como é possível ordenar os dados em uma tabela de acordo com a amostragem?

• Quais os tipos de tabelas?

• É possível relacionar os dados obtidos a partir da tabela aos gráficos?

• Como é possível interpretar os resultados a partir dos dados obtidos com a tabela?

Neste tema você terá a oportunidade de aprofundar mais os seus conhecimentos sobre a preparação de tabelas e como trabalhar com os dados. A ideia é compreender na teoria e relacionar o conhecimento adquirido com a prática diária.

A estatística descritiva é a parte da estatística que desenvolve e disponibiliza métodos para resumo e apresentação de dados estatísticos, com o objetivo de facilitar a compreensão e a utilização das informações ali contidas.

Para melhor descrever o comportamento de uma variável que estudamos no capítulo anterior, é comum apresentar os valores que ela assume organizados sob a forma de tabelas que podem ser de frequências e gráficos.

ConteúdoseHabilidades

UNIDADE 3TEMA 3: TABELA

LeituraObrigatória

Na construção de tabelas de frequência e gráficos, as variáveis são tratadas de forma diferente de acordo com o tipo.

Page 20: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

20

PROBABILIDADE E ESTATÍSTICAUnidade 3

Qual é a diferença entre essas tabelas? Quando podemos utilizar os dados ordenados na forma de tabela ou gráfico? Qual é o mais representativo?

A reunião ou agrupamento de dados estatísticos, quando apresentados em tabelas, para apreciação ou investigação, determina o surgimento das sériesestatísticas. Estas séries resumem um conjunto ordenado de observações através de três fatores fundamentais:

a)Tempo: refere-se à data ou à época em que o fenômeno foi investigado;b)Espaço: refere-se ao local ou região onde o fato ocorreu;c) Espécie: refere-se ao fato ou fenômeno que está sendo invetigado e cujos valores numéricos estão sendo apresentados.

Elas podem ser classificadas de acordo com o fator que estiver variando, podendo ser simples ou mistas. Série simples: são aquelas em que apenas um fator varia. Podem ser de três tipos:

Série Histórica (temporal ou cronológica ou evolutiva): varia o tempo permanecendo fixos o espaço e a espécie do fenômeno estudado. Exemplo:

Série geográfica (territorial ou regional): varia o espaço permanecendo fixos o tempo e a espécie do fenômeno estudado. Exemplo:

Tabela1:CasosdevariolanotificadosnoBrasilde1993a1997.Fonte:AnuáriosEstatísticos-IBGE

Tabela2:Necessidadesmédiasdeenergiaemalgunspaíses,em1973.

Fonte:NecessidadesHumanasdeEnergia-IBGE

Page 21: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

21

PROBABILIDADE E ESTATÍSTICAUnidade 3

Série especificativa (qualitativa ou categórica): varia a espécie do fenômeno estudado, permanecendo fixos o tempo e o espaço.

Exemplo:

Sériemista: são aquelas em que mais de um fator varia ou um fator varia mais de uma vez.

Exemplos:

Série histórica geográfica

Série especificativa geográfica

Tabela3:Abatedeanimais,porespécies,noBrasil,em1993.

Fonte:NecessidadesHumanasdeEnergia-IBGE

Tabela4:Taxadeatividadefemininaurbana(empercentual)em3regiõesdoBrasil,1981/1990

Fonte:AnuáriosEstatísticosdoBrasil-1992

Tabela5:Consumopercapitadealgunstiposdealimentos,emalgumasregiõesmetropolitanasdoBrasil,noanode1998.

Fonte:AnuáreioestatísticosdoBrasil-1992

Page 22: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

22

PROBABILIDADE E ESTATÍSTICAUnidade 3

Série especificativa histórica

Sériedistribuiçãodefrequências: ocorre quando nenhum dos fatores varia. Nesta série os dados são agrupados em classes (intervalos com limites predeterminados) segundo suas respectivas frequências. Segundo a natureza dos dados, as distribuições de frequências podem ser de dois tipos :

- Para dados de enumeração.

- Para dados de mensuração.

A tabela é a forma não discursiva de apresentar informações, das quais o dado numérico se destaca como informação central. Sua finalidade é apresentar os dados de modo ordenado, simples e de facil interpretação, fornecendo o máximo de informação num mínimo de espaço.

Quaissãoosconjuntosdedadosquecompõemumatabela?

• Elementos da tabela

Uma tabela estatística é composta de elementos essenciais e elementos complementares. Os elementos essenciais são:

- Título: é a indicação que precede a tabela, contendo a designação do fato observado, local, época, etc.

- Corpo: é o conjunto de linhas e colunas onde estão inseridos os dados.

- Cabeçalho: é a parte superior da tabela, que indica o conteúdo das colunas.

- Coluna indicadora: é a parte da tabela que indica o conteúdo das linhas.

Tabela6:Taxademortalidade(%)demenoresdeumanonoBrasil,segundoastrêsprincipaiscausas,noperíodode1984a1987.Fonte:

InformeEpidemologicoSUS.

A tabela é a forma não discursiva de apresentar informações

Page 23: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

23

PROBABILIDADE E ESTATÍSTICAUnidade 3

Já os elementos complementares são:

- Fonte: entidade que fornece os dados ou elabora a tabela.

- Notas: informações de natureza geral, destinadas a esclarecer o conteúdo das tabelas.

- Chamada: informações específicas destinadas a esclarecer ou conceituar dados numa parte da tabela. Deverão estar indicadas no corpo da tabela, em números arábicos entre parênteses, à esquerda nas casas e à direita na coluna indicadora. Deve ser situada no rodapé da tabela.

• Número da tabela

Toda tabela deve ter sempre um número para identificá-la, assim como a sua localização. A numeração deve ser feita em números arábicos, de modo crescente, precedidos da palavra Tabela, podendo ou não estar subordinada a capítulos ou seções. Exemplo: Tabela 5.

•Apresentaçãodosdadosnuméricos

Toda tabela deve ter dado numérico para informar a quantificação de um fato específico observado, apresentado em números arábicos. No sistema inglês, a separação entre o milhar e a centena é feita por vírgulas e a separação da parte inteira decimal é feita por ponto, ou seja, inverso do sistema brasileiro.

• Arredondamento

Quando o algarismo que for abandonado for entre 0 e 4, fica inalterado o último algarismo; porém, quando o primeiro algarismo a ser abandonado estiver entre 5-9, aumenta-se uma unidade no último algarismo a aparecer.

Leia o artigo: Estatística Aplicada, da autora Edite Manuela Fernandes. Disponível em: http://www.norg.uminho.pt/emgpf/documentos/Aplicada.pdf Acesso em 29 de setembro de 2014. A apostila fundamenta os principais conceitos relacionados à preparação da tabela e suas aplicações, dentre outros tópicos.

Leia o artigo: Conceito de estatística aplicada, do autor Henrique Dantas Neder. Disponível em: http://www.ecn26.ie.ufu.br/TEXTOS_ESTATISTICA/NOTAS%20DE%20AULA%20DE%20ESTATISTICA.pdf. Acesso em 29 de setembro de 2014.

Toda tabela deve ter sempre um número para identificá-la, assim como a sua localização.

O corpo da tabela deve ser limitado, no mínimo, por três traços horizontais. Recomenda-se não delimitar as tabelas à direita e à esquerda por traços verticais. Se possuir muitas linhas e poucas colunas poderá ser apresentada em duas ou mais partes dispostas lado a lado e separadas por traços duplo.

SaibaMais

LinksImportantes

Page 24: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

24

PROBABILIDADE E ESTATÍSTICAUnidade 3

Neste tema você aprendeu, brevemente, como ocorrem os elementos da tabela e como classificá-las adequadamente nas mais variadas circunstâncias estatísticas.

SérieRefere-se à classificação para a formação da tabela.

IBGEInstituto Brasileiro de Geografia e Estatística.

AnuáriosÉ uma publicação anual que registra informações sobre um ou vários ramos de atividade, tais como, ciências, artes, literatura, profissões, economia, etc.

MistoAssume a identidade de duas classificações.

CabeçalhoNa terminologia da informática, o headre – ou, simplesmente, cabeçalho – consiste na parte que contém as informações suplementares colocados no começo de um bloco de dados que estão armazenados ou transmitidos.

Finalizando

Glossário

Page 25: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

25

PROBABILIDADE E ESTATÍSTICAUnidade 3

Nesta aula, você estudará:

• Como preparar gráficos.

• Como os dados devem ser ordenados.

• Quais os tipos de gráficos existentes.

• Comparação com os dados obtidos com as tabelas.

Ao final, você deverá ser capaz de responder às seguintes questões:

• Como é possível ordenar os dados em gráficos de acordo com a amostragem?

• Quais os tipos de gráficos?

• É possível relacionar os dados obtidos com a tabela aos gráficos?

• Como é possível interpretar os resultados a partir dos dados obtidos com o gráfico?

Neste tema você terá a oportunidade de aprofundar mais os seus conhecimentos sobre a preparação de gráficos e como trabalhar com os dados. A ideia é compreender os conteúdos na teoria e relacioná-los com a prática diária.

O primeiro passo para se descrever graficamente um conjunto de dados observados é verificar as frequências dos diversos valores existentes da variável.

Definimos frequência de um dado valor de uma variável (qualitativa ou quantitativa) como o número de vezes que esse valor foi observado. Denotaremos a frequência do i-ésimo valor observado for fi. Sendo n o número total de elementos observados, verifica-se imediatamente.

ΣΚ i = fi = n

Onde: Κ é o número de diferentes valores existentes da variável.

GRÁFICOS

ConteúdoseHabilidades

LeituraObrigatória

A frequência é uma grandeza física ondulatória que indica o número de ocorrências de um evento (ciclos, voltas, oscilações, etc) em um determinado intervalo de tempo.

Page 26: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

26

PROBABILIDADE E ESTATÍSTICAUnidade 3

A associação das respectivas frequências a todos os diferentes valores observados define a distribuição de frequências do conjunto de valores observados. Alternativamente, poderemos usar as frequências relativas. Definimos a frequência relativa, ou proporção de um dado valor de uma variável (qualitativa ou quantitativa), como o quociente de sua frequência pelo número total de elementos observados. Ou seja, denotamos por pi a frequência relativa ou proporção do i-ésimo elemento observado. Para melhor descrever o comportamento de uma variável que estudamos no capítulo anterior, é comum apresentar os valores que ela assume organizados sob a forma de tabelas. Elas podem ser de frequências e gráficos.Qual é a diferença entre os gráficos? Quando podemos utilizar os dados ordenados na forma de tabela ou gráfico? Qual é o mais representativo? Na construção de tabelas de frequência e gráficos, as variáveis são tratadas de forma diferente de acordo com o tipo. No caso de variáveis qualitativas, a descrição gráfica é muito simples, bastando computar as frequências relativas das diversas classificações existentes, elaborando, a seguir, um gráfico conveniente. Esse gráfico poderá ser um diagrama de barras, um diagrama circular ou outro qualquer tipo de diagrama equivalente.Tomaremos, por exemplo, 135 candidatos a vagas em um curso de pós-graduação, classificados segundo sua formação específica de graduação, conforme a tabela 1.

Esses dados podem ser graficamente representados de diversas formas. Assim, aqui eles serão representados por meio de um diagrama de barras.

Diagrama ou gráfico circular (pie chart), também chamado diagrama de setores, é uma representação gráfica, utilizada essencialmente para dados qualitativos, que tem por base um círculo, dividido em setores circulares, tantos quantas as categorias apresentadas pelos dados em estudo. As amplitudes dos ângulos dos setores são proporcionais às frequências das categorias que representam. Assim, o círculo representa a forma como o total dos dados se distribui pelas categorias e cada setor representa uma fração do total dos dados.

Page 27: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

27

PROBABILIDADE E ESTATÍSTICAUnidade 3

A vantagem da representação gráfica está em possibilitar uma rápida impressão visual de como se distribuem as frequências ou as frequências relativas no conjunto de elementos examinados. Entretanto, há que se mencionar ainda a possibilidade de considerarmos distribuições segundo outros critérios que não propriamente a frequência ou a frequência relativa das observações. Como exemplo, tomemos as superfícies das cinco regiões geográficas que compoem o Brasil, apresentadas na tabela 2, conforme dados do IBGE (Instituto Brasileiro de Geografia e Estatística). Calculando-se as porcentagens correspondentes, pode-se construir o diagrama circular dado na Figura 2.

No caso das variáveis quantitativas discretas, a representação gráfica será também, normalmente, feita por meio de um diagrama de barras. A construção do diagrama de barras é feita semelhantemente ao exemplo anterior, desde que se disponha da tabela de frequências. Esta, por sua vez, pode ser facilmente construída se conhecemos todos os valores da variável no conjunto de dados. Como iremos marcar no eixo das abscissas os valores da variável, resulta que, nesse caso, as barras do diagrama serão verticais. Vamos ao título do exemplo: representar graficamente o conjunto dado a seguir, constituído hipoteticamente por vinte valores da variável “número de defeitos por unidade”, obtidos a partir de aparelhos retirados de uma linha de montagem. Sejam os seguintes os valores obtidos:

2 4 2 1 2 3 1 0 5 1 0 1 1 2 0 1 3 0 1 2

Usando a letra x para designar os diferentes valores da variável, podemos construir a distribuição de frequência dada na tabela 3, a partir da qual elaboramos o diagrama de barras correspondentes, dado pela fig 3.

Tabela2:RegiõesgeográficasdoBrasil

Page 28: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

28

PROBABILIDADE E ESTATÍSTICAUnidade 3

O diagrama de barras, conforme já mencionamos, mostra a distribuição das frequências no conjunto de dados. Tratando-se de variáveis quantitativas, uma outra forma de representação gráfica é também possível, tendo as vezes, interesse, com base nas frequências acumuladas, as quais denotaremos por “F”.

A frequência acumulada, em qualquer ponto do eixo das abscissas, é definida como a soma das frequências de todos os valores menores ou iguais ao valor correspondente a esse ponto. Analogamente, teríamos as frequências relativas acumuladas.

Leia o artigo: Estatística Aplicada, da autora Edite Manuela Fernandes. Disponível em: http://www.norg.uminho.pt/emgpf/documentos/Aplicada.pdf Acesso em 29 de setembro de 2014. A apostila fundamenta or principais conceitos relacionados a preparação da tabela e suas aplicações, dentre outros tópicos.

Leia o artigo: Conceito de estatítisca aplicada, do autor Henrique Dantas Neder. Disponível em: http://www.ecn26.ie.ufu.br/TEXTOS_ESTATISTICA/NOTAS%20DE%20AULA%20DE%20ESTATISTICA.pdf. Acesso em 29 de setembro de 2014.

Neste tema você aprendeu, brevemente, quais são e como ocorrem os elementos do gráfico, além de aprender como classificá-los adequadamente nas mais variadas circunstâncias estatísticas.

Tabela3:DistribuiçãodeFrequência

LinksImportantes

Finalizando

Page 29: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

29

PROBABILIDADE E ESTATÍSTICAUnidade 3

FrequênciaNúmero de vezes que esse valor foi observado.

IBGEInstituto Brasileiro de Geografia e Estatística.

AnuáriosÉ uma publicação anual que registra informações sobre um ou vários ramos de atividade, tais como ciências, artes, literatura, profissões, economia, etc.

MistoAssume a identidade de duas classificações.

CabeçalhoNa terminologia da informática, o headre – ou, simplesmente, cabeçalho – consiste na parte que contém as informações suplementares colocadas no começo de um bloco de dados que estão armazenados ou transmitidos.

Glossário

Page 30: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

30

PROBABILIDADE E ESTATÍSTICAUnidade 4

Nesta aula, você estudará:• Como encontrar a moda.• Como rearranjar os dados para encontrar a moda.• Como pode ser aplicada.

• Comparação entre as diferentes moda.

Ao final, você deverá ser capaz de responder às seguintes questões:

• Todos os dados podem ser utilizados para compor a moda?• É possível extrair a moda a partir de tabelas?• Como aplicar a moda correta?

• Quais exemplos práticos podemos aplicar para compor a moda?

Em estatística denominam-se medidas de tendência central: a média, a mediana e a moda. Essas medidas dependem da definição de centro de um conjunto de valores ou de uma distribuição que pode ser interpretada de várias maneiras. A moda é o valor mais típico e representativo de uma distribuição. Ela representa o seu valor mais provável. Como a mediana, a moda também não é influenciada pelos valores extremos da distribuição e não permite manipulações algébricas como a fórmula da média.

Existem algumas relações entre as diversas medidas de posição:

1) Para qualquer série, exceto quando no caso de todas as observações coincidirem em um único valor, a média aritmética é sempre maior que a média geométrica, a qual, por sua vez, é maior que a média harmônica.

2) Para uma distribuição simétrica e unimodal, média = mediana = moda

3) Para uma distribuição positivamente assimétrica, média > mediana > moda. A distância entre a mediana e a média é cerca de um terço da distância entre a moda e a média.

UNIDADE 4TEMA 5:MODA

ConteúdoseHabilidades

LeituraObrigatória

A moda é o valor mais típico e representativo de uma distribuição. Ela representa o seu valor mais provável.

Page 31: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

31

PROBABILIDADE E ESTATÍSTICAUnidade 4

4) Para uma distribuição negativamente assimétrica, média < mediana < moda. A distância entre a mediana e a média é cerca de um terço da distância entre a moda e a média.

A moda de uma distribuição de frequência pode muitas vezes ser aproximada pelo ponto médio de uma classe modal – a classe com maior densidade de frequência. É possível calcular os valores aproximados da mediana e da moda para dados agrupados quando o último intervalo de classe tem limite superior indeterminado. No caso da mediana isso é imediato e no caso da moda, o seu cálculo somente pode ser feito se a última classe não for a classe modal sendo necessário primeiramente calcular as densidades de frequência.

Infelizmente em algumas situações não é possível calcular a média e temos que contar apenas com a mediana como medida de posição (ou de tendência central) de uma distribuição estatística.

Exemplo1:

Os dados abaixo se referem à idade de 20 alunos de uma turma de 6o. Ano.

Idade: {12, 11,12,13,12,11,13,12,12,11,14,13,13,12,11,12,13,14,11,14}

A moda deste conjunto de dados será a idade que mais aparece, ou seja, 12, pois é a idade que aparece mais vezes no conjunto.

Frequência: Em estatística, a frequência (ou frequência absoluta) de um evento i é o número n_i de vezes que o evento ocorreu em um experimento ou estudo.1 :12-19 Essas frequências são normalmente representadas graficamente em histogramas.

Exemplo2

A tabela abaixo apresenta as notas em matemática de uma turma de 30 alunos.

Page 32: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

32

PROBABILIDADE E ESTATÍSTICAUnidade 4

Na coluna da esquerda temos as notas na disciplina de matemática e na coluna da direita, quantos alunos obtiveram a respectiva nota. Dessa forma, podemos observar que a nota que mais aparece nesse conjunto de dados é 7. Portanto a Mo =7.

Exemplo3

Os dados abaixo são referentes ao número dos calçados vendidos em uma loja num determinado dia.

{35,33,36,35,37,36,39,40,43,35,36,42}

Nesse caso, existem dois números de sapatos que aparecem mais vezes: 35 e 36. Logo, a moda pode ser: Mo=35 ou 36. Quando isso ocorre dizemos que o conjunto de dados é bimodal.

Importante

1) seu valor é afetado pelo número de observações e como elas estão distribuídas mas ela não é afetada pelos valores das observações externas

2) sua fórmula não é passível de manipulação algébrica

3) seu valor pode ser obtido, como vimos, em distribuições, com limites superiores indeterminados para a sua última classe

Leia o artigo: Estatística Aplicada, da autora Edite Manuela Fernandes. Disponível em: http://www.norg.uminho.pt/emgpf/documentos/Aplicada.pdf Acesso em 29 de setembro de 2014. A apostila fundamenta or principais conceitos relacionados a preparação da tabela e suas aplicações, dentre outros tópicos.

Leia o artigo: Conceito de estatítisca aplicada, do autor Henrique Dantas Neder. Disponível em: http://www.ecn26.ie.ufu.br/TEXTOS_ESTATISTICA/NOTAS%20DE%20AULA%20DE%20ESTATISTICA.pdf. Acesso em 29 de setembro de 2014.

Neste tema você aprendeu, brevemente, como calcular a moda adequadamente nas mais variadas circunstâncias estatísticas.

Finalizando

LinksImportantes

Page 33: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

33

PROBABILIDADE E ESTATÍSTICAUnidade 4

MédiaSomatória dos dados dividida pelo número total de elementos.

MedianaÉ o valor do item central da série quando estes são arranjados em ordem de magnitude.

FinitoNúmero determinado.

GeométricoÉ um ramo da matemática preocupado com questões de forma, tamanho e posição relativa de figuras e com as propriedades do espaço.

Glossário

Page 34: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

34

PROBABILIDADE E ESTATÍSTICAUnidade 4

Nesta aula, você estudará:

• Como encontrar as médias.

• Que tipo de dados podem ser utilizados para compor a média.

• Como pode ser aplicada.

• Comparação entre as diferentes médias.

Ao final, você deverá ser capaz de responder às seguintes questões:

• Todos os dados podem ser utilizados para compor a média?

• É possível extrair a média a partir de tabelas?

• Como aplicar a média correta?

• Quais exemplos práticos podemos aplicar para compor a média?

Ajunçãodedadosparacomporamédia.

Existem vários tipos de média. Um exemplo é a médiaariméticanãoponderada, que é definida como a soma das observações dividida pelo número de observações. Para que ela possa ser utilizada, devem ser verificadas algumas propriedades, como:

- A média é um valor típico, ou seja, um ponto de equilíbrio. Seu valor pode ser substituído pelo valor de cada item na série de dados sem mudar o total.

- A soma dos desvios das observações em relação à média é igual a zero.

- A soma dos desvios elevados ao quadrado das observações em relação à média é menor que qualquer soma de quadrados de desvios em relação a qualquer outro número.

Segundo Neder, a ideia básica de selecionar um número tal que a soma dos quadrados dos desvios em relação a este número é minimizada tem grande importância na teoria estatística. Foi denominado de o “princípio dos mínimos quadrados”. Ela é, por exemplo, a base racional do método dos mínimos quadrados que é usado para ajustar a melhor.

ConteúdoseHabilidades

TEMA 6:MÉDIA

LeituraObrigatória

Page 35: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

35

PROBABILIDADE E ESTATÍSTICAUnidade 4

Um outro tipo é a média aritmética ponderada. Nesta, todos os valores observados foram somados atribuindo-se o mesmo peso a todas as observações. A soma dos pesos não pode ser igual a zero. Fora disto, não existe restrição para os valores dos pesos. Se todos os pesos forem iguais a 1, a média ponderada recai em seu caso particular: a média aritmética não ponderada. O mesmo ocorre se todos os pesos forem iguais a uma constante. Portanto, a média aritmética não ponderada na realidade é uma média artimética ponderada com pesos iguais.

Frequentemente encontramos populações cujas unidades elementares podem ser classificadas em duas categorias: uma que tem certo atributo e outra que não tem esse atributo. Nesse caso, estamos interessados na proporção de casos que possuem esse atributo. Uma proporção comumente é pensada como uma fração ou porcentagem, mas também pode ser pensada como um caso especial de média.

A média geométrica de uma amostra é definida como a raiz enésima do produto nos valores amostrais. A média aritmética é maior do que a média geométrica para qualquer série de valores positivos, com exceção do caso em que os valores da série são todos iguais, quando as duas médias coincidem. O cálculo da média geométrica é simples, porém a interpretação e suas propriedades tornam-se mais evidentes quando reduzimos a fórmula à sua forma logarítmica.

A conclusão a que chegamos é que o logaritmo da média geométrica é igual à média aritmética dos logaritmos dos valores da série. Verifica-se que a média geométrica somente tem significado quando todos os valores da série são positivos.

A mais importante aplicação da média geométrica refere-se talvez ao cálculo de taxas de crescimento médias, desde que essas possam ser corretamente medidas somente por esse método.

Leia o artigo: Estatística Aplicada, da autora Edite Manuela Fernandes. Disponível em: http://www.norg.uminho.pt/emgpf/documentos/Aplicada.pdf Acesso em 29 de setembro de 2014. A apostila fundamenta or principais conceitos relacionados a preparação da tabela e suas aplicações, dentre outros tópicos.

Leia o artigo: Conceito de estatítisca aplicada, do autor Henrique Dantas Neder. Disponível em: http://www.ecn26.ie.ufu.br/TEXTOS_ESTATISTICA/NOTAS%20DE%20AULA%20DE%20ESTATISTICA.pdf. Acesso em 29 de setembro de 2014.

LinksImportantes

Page 36: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

36

PROBABILIDADE E ESTATÍSTICAUnidade 4

Neste tema você aprendeu, brevemente, como ocorreram os elementos do gráfico e como classificá-los adequadamente nas mais variadas circunstâncias estatísticas.

MédiaSomatória dos dados dividida pelo número total de elementos.

AritméticaÉ o ramo da matemática que lida com números e com as operações possíveis entre eles.

PonderadaParâmetro utilizado para atribuir a maior ou a menor grandeza, evidenciando o valor ponderado.

GeométricoÉ um ramo da matemática preocupado com questões de forma, tamanho e posição relativa de figuras, e com as propriedades do espaço.

Finalizando

Glossário

Page 37: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

37

PROBABILIDADE E ESTATÍSTICAUnidade 4

Nesta aula, você estudará:

• Como encontrar a mediana.

• Como rearranjar os dados para encontrar a mediana.

• Como pode ser aplicada.

• Comparação entre as diferentes medianas.

Ao final, você deverá ser capaz de responder às seguintes questões:

• Todos os dados podem ser utilizados para compor a mediana?

• É possível extrair a mediana a partir de tabelas?

• Como aplicar a mediana correta?

• Quais exemplos práticos podemos aplicar para compor a mediana?

A mediana é o valor numérico que separa a metade superior de uma amostra de dados, uma população ou uma distribuição de probabilidade, a partir da metade inferior. A mediana de uma lista finita de números pode ser encontrada a partir do valor mais baixo para o valor mais alto, sempre pelo meio. Exemplo: {1,3,5,7,11} – a mediana é 5. Se houver número par, não existe mediana, sendo então definido como a média dos valores os dois valores do meio. Exemplo: {1,3,5,7} – a mediana neste caso é a média dos dois valores do meio: (3+5/2)=4. Para estatísticas robustas, ela é fundamental, já que é resistente. Ela é independente de qualquer distância métrica, já uma média geométrica é definida em qualquer número de dimensão.

Uma aplicação da mediana é utilizá-la como medida de localização quando a distribuição é desviada, quando os valores finais não são conhecidos ou quando se exige reduzida importância para ser anexado, por exemplo, uma vez que podem existir erros de medição.

Em termos de notação, alguns autores representam a mediana de uma variável x ou como notação padrão μ1/2

1 por vezes também M3 . Não há um símbolo amplamente aceito para a mediana, de modo que o uso destes ou outros símbolos para o mediano deve ser explicitamente definido quando eles são introduzidos.

ConteúdoseHabilidades

TEMA 7:MEDIANA

LeituraObrigatória

A mediana é o valor numérico que separa a metade superior de uma amostra de dados, uma população ou uma distribuição de probabilidade, a partir da metade inferior.

Page 38: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

38

PROBABILIDADE E ESTATÍSTICAUnidade 4

A mediana então é o valor que ocupa a posição central da série de observações de uma variável, em rol, dividindo o conjunto em duas partes iguais, ou seja, a quantidade de valores inferiores à mediana é igual 1a quantidade de valores superiores à mesma.

Este procedimento pode tornar-se inadequado quando o conjunto de dados for composto por muitos elementos.

Ela pode ser representada por Md, sendo a medida que divide um conjunto de dados ordenado em duas partes iguais: 50% dos valores ficam abaixo e 50% ficam acima da mediana. Existem dois casos diferentes para o cálculo da mediana, mas em ambos o primeiro passo a ser tomado é a ordenação dos dados.

1º. caso: quando o n é ímpar:Determinamos, primeiramente, a posição mais central (p) do conjunto de dados ordenado

p = n+1/2

A mediana será o valor do conjunto de dados que ocupa a posição p, ou seja, Md = xp

Exemplo:Se X = tempo (h)Para xi = 4, 5, 7, 9, 10, temos:

p = n+1/2 –> 5+1/2 = 3, logo

Md = xp = x3 = 7h

2. caso: quando o n é par:Neste caso, temos duas posições centrais no conjunto de dados ordenado, denotadas por p1 e p2. Ao utilizarmos a expressão p = n+1/2, obtemos um valor não inteiro. As posições p1 e p2 são os dois inteiros mais próximos do valor de p. A mediana será a média aritmética simples dos valores do conjunto de dados que ocupam as posições p1 e p2, ou seja,

Md = xp1 + xp2/2

Exemplo:Se X = tempo (h)Para x1 = 4, 5, 7, 9, 10, 12, temos:

p = n+1/2 = 6+1/2 = 3,5 (p1 = 3 e p2 = 4), logo

Md – xp1 + xp2/2 = X3+x4/2 = 7+9/2 = 8h

Page 39: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

39

PROBABILIDADE E ESTATÍSTICAUnidade 4

Importante

1) seu valor é afetado pelo número de observações e como elas estão distribuídas mas ela não é afetada pelos valores das observações externas

2) sua fórmula não é passível de manipulação algébrica

3) seu valor pode ser obtido, como vimos, em distribuições, com limites superiores indeterminados para a sua última classe

4) a mediana é a estatística mais adequada para descrever observações que são ordenadas ao invés de medidas.

Leia o artigo: Estatística Aplicada, da autora Edite Manuela Fernandes. Disponível em: http://www.norg.uminho.pt/emgpf/documentos/Aplicada.pdf Acesso em 29 de setembro de 2014. A apostila fundamenta or principais conceitos relacionados a preparação da tabela e suas aplicações, dentre outros tópicos.

Leia o artigo: Conceito de estatítisca aplicada, do autor Henrique Dantas Neder. Disponível em: http://www.ecn26.ie.ufu.br/TEXTOS_ESTATISTICA/NOTAS%20DE%20AULA%20DE%20ESTATISTICA.pdf. Acesso em 29 de setembro de 2014.

Neste tema você aprendeu, brevemente, como calcular a mediana adequadamente nas mais variadas circunstâncias estatísticas.

MédiaSomatória dos dados dividida pelo número total de elementos.

MedianaÉ o valor do item central da série quando estes são arranjados em ordem de magnitude.

FinitoNúmero determinado.

GeométricoÉ um ramo da matemática preocupado com questões de forma, tamanho e posição relativa de figuras e com as propriedades do espaço.

LinksImportantes

Finalizando

Glossário

Page 40: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

40

PROBABILIDADE E ESTATÍSTICAUnidade 4

Nesta aula, você estudará:

• Como encontrar o percentis.

• Quais ferramentas são necessárias para encontrar o percentis.

• Como pode ser aplicado.

• Comparação entre os diferentes percentis.

Ao final, você deverá ser capaz de responder às seguintes questões:

• Todos os dados podem ser utilizados para encontrar o percentil?

• É possível extrair o percentil a partir de tabelas?

• Como aplicar o percentil nas mais variadas situações ?

• O percentil é o ponto final do dado que pode ser obtido ?

A mediana é o valor que divide a amostra em duas partes iguais, deixando exatamente 50% das observações de cada lado. Também poderíamos dividir em quatro partes iguais, cada uma contendo 25% dos dados. Nesse caso cada uma das partes seria um quartil.

O primeiro quartil escreve-se abreviadamente Q1/4 correspondendo a 25% dos dados. O segundo quartil Q2/4, corresponde à mediana. O terceiro quartil Q3/4, corresponde a 75% das observações. O seu cálculo é análogo ao da mediana. Começa-se por determinar a respectiva classe observando as frequências relativas acumuladas.

ConteúdoseHabilidades

TEMA 8:QUARTIS

LeituraObrigatória

Page 41: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

41

PROBABILIDADE E ESTATÍSTICAUnidade 4

A amostra também pode ser dividida em 10 partes de 10% cada, originando os decis ou em 100 partes de 1% obtendo-se os percentis.

Denomina-se quartis os valores de uma série que a dividem em quatro partes iguais. Precisamos, portanto, de 3 quartis (Q1, Q2 e Q3) para dividir a série em quatro partes iguais. O quartil 2 (Q2) sempre será igual a mediana da série. O método mais prático é utilizar o principio do cálculo da mediana para os 3 quartis. Na realidade serão calculadas “3 medianas” em uma mesma série.

Exemplo1:

Calcule os quartis da série: {5,2,6,9,10,13,15} .

O primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos valores: {2,5,6,9,10,13,15}. O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md=9 que será = Q2. Temos agora {2,5,6} onde o Q1=5 e {10,13,15} e o Q3=13, como sendo os dois grupos de valores iguais proporcionados pela mediana (quartil 2). Para o cálculo do quartil 1 e 3 basta calcular as medianas das partes iguais provenientes da verdadeira Mediana da série (quartil 2).

Page 42: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

42

PROBABILIDADE E ESTATÍSTICAUnidade 4

Exemplo2:

Calcule os quartis da série: {1,1,2,3,5,5,6,7,9,9,10,13}

- Quarti 2 = Md = (5+6)/2 = 5,5

- Quartil 1 será a mediana da série à esquerda de Md: {1,1,2,3,5,5,} → Q1 = (2+3)/2 = 2,5

- Quartil 3 será a mediana da série à direita de Md: {6,7,9,,9,10,13} → Q3 = (9+9)/2 = 9

Importante

1) seu valor é afetado pelo número de observações e como elas estão distribuídas mas ela não é afetada pelos valores das observações externas

2) para facilitar encontrar o quartil, divida o valor por quatro e encontrará: Q1; Q2; Q3;Q4.

Leia o artigo: EstatísticaAplicada, da autora Edite Manuela Fernandes. Disponível em: http://www.norg.uminho.pt/emgpf/documentos/Aplicada.pdf Acesso em 29 de setembro de 2014. A apostila fundamenta or principais conceitos relacionados a preparação da tabela e suas aplicações, dentre outros tópicos.

Leia o artigo: Conceito de estatítisca aplicada, do autor Henrique Dantas Neder. Disponível em: http://www.ecn26.ie.ufu.br/TEXTOS_ESTATISTICA/NOTAS%20DE%20AULA%20DE%20ESTATISTICA.pdf. Acesso em 29 de setembro de 2014.

QuartilÉ o valor obtido a partir da divisão por quatro.

VariânciaÉ o agrupamento de dados.

MédiaaritméticaMédia de todos os dados da amostra.

PopulaçãoÉ o agrupamento de dados.

LinksImportantes

Glossário

Page 43: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

43

PROBABILIDADE E ESTATÍSTICAUnidade 4

Nesta aula, você estudará:

• Como encontrar o percentis.

• Quais ferramentas são necessárias para encontrar o percentis.

• Como pode ser aplicado.

• Comparação entre os diferentes percentis.

Ao final, você deverá ser capaz de responder às seguintes questões:

• Todos os dados podem ser utilizados para encontrar o percentil?

• É possível extrair o percentil a partir de tabelas?

• Como aplicar o percentil nas mais variadas situações ?

• O percentil é o ponto final do dado que pode ser obtido ?

O percentil é uma ferramenta da matemática e da estatistica muito uitlizada em pediatria, que serve para comparar individualmente uma criança, com um grupo modelo de outras 100 crianças com a mesma idade (Per cem = per cento = por cem = porcento). As curvas de percentis são representações gráficas com linhas que permitem fazer estas comparações. Os devios no posicionamento de um indivíduo numa curva de percentil, não devem ser interpretados como presença de doença. Os percentis são só e apenas, o modo de comparar em relação a determinados parâmetros, indivíduos do mesmo sexo e com a mesma idade.

O crescimento é um importante indicador do bem estar de uma criança e está sujeito a muitas influências. Entre elas destacam-se a genética da própria criança, a sua alimentação e a ausência de doenças. Uma alteração de qualquer de um destes fatores isoladamente ou em conjunto, vai influenciar e modificar o seu crescimento. As curvas de percentis usam-se na idade pediátrica mais do que qualquer outra idade, de modo a monitorar o crescimento e os desvios, para que se possa intervir em caso de necessidade. Há diversas tabelas e curvas de percentis para além do crescimento. As curvas de percentis são difíceis de se construir e por esta razão nem todos os países têm as suas próprias curvas.

ConteúdoseHabilidades

TEMA 9:PERCENTIS

LeituraObrigatória

Page 44: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

44

PROBABILIDADE E ESTATÍSTICAUnidade 4

• Um percentil indica que há x% de dados inferiores, ou seja, os percentis dividem o conjunto de dados em 100 partes iguais;

• Há, portanto, 99 percentis;

• Os valores devem estar ordenados;

Para calcular a qual percentil pertence um dado valor

Percentil do valor x = número de valores inferiores a x . 100 número total de valores

Ele também é válido para outros tipos de dados. O nome genérico dos quartis, decis e percentis é separatrizes.

Denominamos percentis ou centis como sendo os noventa e nove valores que separam uma série em 100 partes iguais.

O percentil de ordem px100 (9<p<1), em um conjunto de dados de tamanho n, é o valor da variável que ocupa a posição px (n+1) do conjunto de dados ordenados. O percentil de ordem p (ou p-quantil) deixa px100% das observações abaixo dele na amostra ordenada.

Casosparticulares:

•Percentil50= mediana, segundo quartil (md, Q2, q(0,5))

•Percentil25= primeiro quartil (Q1), q(0,25)

•Percentil75 = terceiro quartil (Q3), q(0,75)

Exemplo:15,5,3,8,10,2,7,11,12 → n=9

ordenamos: 2<3<5<7<8<10<11<12<15

P1= 1/18; p2=3/18; p3=5/18; p4=7/18; p5=1/2; p6=11/18; p7=13/18; p8=15/18; p9=17/18

Posição Md : q(0,5) =8

Posição de Q1 : q(0,25) = 4,5

Posição de Q3 : q(0,75) = 11,25

Leia o artigo: EstatísticaAplicada, da autora Edite Manuela Fernandes. Disponível em: <http://www.norg.uminho.pt/emgpf/documentos/Aplicada.pdf> Acesso em 29 de setembro de 2014. A apostila fundamenta or principais conceitos relacionados a preparação da tabela e suas aplicações, dentre outros tópicos.

LinksImportantes

Page 45: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

45

PROBABILIDADE E ESTATÍSTICAUnidade 4

Leia o artigo: Conceito de estatítisca aplicada, do autor Henrique Dantas Neder. Disponível em: <http://www.ecn26.ie.ufu.br/TEXTOS_ESTATISTICA/NOTAS%20DE%20AULA%20DE%20ESTATISTICA.pdf.> Acesso em 29 de setembro de 2014.

DesvioPadrãoÉ a medida de espalhamento de valores.

VariânciaÉ o agrupamento de dados.

MédiaaritméticaMédia de todos os dados da amostra.

PopulaçãoÉ o agrupamento de dados.

Referência bibliográfica básica

COSTA NETO, Pedros Luís de Oliveira. Estatística. 2.ed. rev. e atual. São Paulo: Blucher, 2002. 264p., il. ISBN 85-212-0300-4.

CRESPO, Antônio Arnot. Estatística fácil. 19. ed. atual. São Paulo: Saraiva, 2009. 218p. ISBN 978-85-02-08106-2.

SILVA, Ermes Medeiros da et al. Estatística para os cursos deeconomia, administração e ciências contábeis. 3.ed. São Paulo: Atlas, 1999-2007. 2v. ISBN 85-224-2236-2.

Referência bibliográfica complementar

BUSSAB, Wilton O.; MORETTIN, Pedro A. Estatísticabásica. 5.ed. São Paulo: Atual, 2003. 526p. (Métodos quantitativos). ISBN 85-02-03497-9.

LEVINE, David M. et al. Estatística: teoria e aplicações usando o microsoft excel em português. 3.ed. Rio de Janeiro: Livros Técnicos e Científicos, 2005. 819p., il. ISBN 85-216-1419-5. + CD-ROM.

SPIEGEL, Murray R. Estatística: Coleção Schaum e McGraw-Hill. São Paulo: Makron Books, 1993.

STEVENSON, W.J. EstatísticaAplicadaàAdministração. São Paulo: Harbra, 1996.

VIEIRA, Sonia. Elementosdeestatística. 3.ed. São Paulo: Atlas, 1999. 145p. ISBN 85-224-2163-3.

Glossário

Referências

Page 46: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

46

PROBABILIDADE E ESTATÍSTICAUnidade 5

Nesta aula, você estudará:

• Como encontrar o intervalo de classes.• Quais ferramentas são necessárias para encontrar o intervalo de classes.• Como pode ser aplicado o intervalo de classes.

• Comparação entre os diferentes intervalos existentes.

Ao final, você deverá ser capaz de responder às seguintes questões:• Todos os dados podem ser utilizados para encontrar o intervalo de classe?• É possível extrair o intervalo de classe a partir de gráficos e tabelas?• Como aplicar o intervalo de classe nas mais variadas situações? • O intervalo de classe é o ponto final do dado que pode ser obtido?

O intervalo de classe faz parte dos elementos de uma distribuição de frequência. As classes são intervalos de variação de uma variável. As classes são representadas simbolicamente por i, sendo i=1,2, ..., κ, onde κ é o número total de classes. O número total de valores é simbolicamente por n. Assim no exemplo, o intervalo 154 -158 define a segunda classe (i=2), o intervalo 166-170 define a quinta classe (i=5) e assim por diante. Como a distribuição tem seis classes, logo κ=6, a variável x assume 40 valores, logo n=40.

Os limites de classes são os extremos de cada classe. Para uma determinada classe i, o limite inferior é simbolizado por l1 e o limite superior por L1. O limite inferior da segunda classe é escrito como l2 = 154, enquanto o limite superior da segunda classe é escrito como L2 = 158. De acordo com o IBGE as classes devem ser escritas como desta qualidade até menor que aquela usando para isso o simbolo -. Assim, l1-L1 significa inclusão de l1, e exclusão de L1. O indivíduo com estatura 158 cm estaria na terceira classe (i=3) e não na segunda.

ConteúdoseHabilidades

UNIDADE 5TEMA 10:

INTERVALO DE CLASSES

LeituraObrigatória

O intervalo de classe faz parte dos elementos de uma distribuição de frequência.

Page 47: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

47

PROBABILIDADE E ESTATÍSTICAUnidade 5

A amplitude de um intervalo de classe ou simplesmente intervalo de classe é o tamanho do intervalo que define a classe. O intervalo de classe i é simbolizado por h1 e é obtido pela diferença entre os seus limites.

h1 = L1-l1

No exemplo que usamos, o tamanho do intervalo da segunda classe (h2) vale

h2 = L2-l2 = 158-154 = 4cm

Todos as outras classes do exemplo também têm intervalo de 4cm, pois este é o intervalo entre cada um dos limites inferiores e os limites superiores correspondentes. Quando dispomos de uma tabela primitiva ou de um rol, precisamos estabelecer a quantidade e o intervalo das classes que vamos criar; de outro modo, a distribuição de frequência pode não ser util para a nova análise. Uma das maneiras de determinar o número de classes é usando a Regra de Sturges que determina κem função de n:

κ ± 1+3,3 log(n), onde κ é o número de classes e o n é o número de dados. O limite superior não é computado na classe em que aparece, isto é, a frequência desse elemento é incluída na classe onde ele é inferior. Observe que o limite superior de uma classe é o limite inferior da classe seguinte. Numa distribuição de frequência (tabela) temos a chamada amplitude total (AT) que é obtida fazendo-se L(max)-Lmin, se a distribuição estiver organizada em intervalos de classe (os dados estiverem agrupados) ou simplesmente subtraindo-se o menor valor do maior da sequência, se a distribuição estiver sem intervalo de classe (os dados não estiverem agrupados).

Dessa forma, sugerimos que quando uma sequência de dados estatísticos é tal que não seja possível fazer uma distribuição de frequência (tabela) com, aproximadamente, até dez classes pode não ser necessário utilizar o recurso de intervalos de classes. A menos que se agrupar por faixa etária, por exemplo, não há necessidade de se trabalhar com intervalos quando o número de classes não exceder a dez. Recomenda-se também que o número não ultrapasse 20 classes e nem seja menor do que 5.

Há circunstâncias, porém, que se torna imperioso fazer agrupamentos dos dados em intervalos de classe, seja pela quantidade deles, seja pela forma como aparecem (forma decimal, por exemplo). As variáveis quantitativas contínuas devem ser trabalhadas com intervalos de classe.

A amplitude de um intervalo de classe ou simplesmente intervalo de classe é o tamanho do intervalo que define a classe.

As variáveis quantitativas contínuas devem ser trabalhadas com intervalos de classe.

Page 48: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

48

PROBABILIDADE E ESTATÍSTICAUnidade 5

Leia o artigo:EstatísticaAplicada, da autora Edite Manuela Fernandes. Disponível em: http://www.norg.uminho.pt/emgpf/documentos/Aplicada.pdf Acesso em 29 de setembro de 2014. A apostila fundamenta or principais conceitos relacionados a preparação da tabela e suas aplicações, dentre outros tópicos.

Leia o artigo: Conceito de estatítisca aplicada, do autor Henrique Dantas Neder. Disponível em: http://www.ecn26.ie.ufu.br/TEXTOS_ESTATISTICA/NOTAS%20DE%20AULA%20DE%20ESTATISTICA.pdf. Acesso em 29 de setembro de 2014.

Neste tema você aprendeu, brevemente, como calcular o intervalo de classes adequadamente nas mais variadas circunstâncias estatísticas.

DesvioPadrãoÉ a medida de espalhamento de valores.

VariânciaÉ o agrupamento de dados.

CoeficienteTermo determinado para ajustar a amostra.

CelsiusEscala de temperatura.

LinksImportantes

Finalizando

Glossário

Page 49: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

49

PROBABILIDADE E ESTATÍSTICAUnidade 5

Nesta aula, você estudará:

• Como encontrar a amplitude de variância.

• Quais ferramentas são necessárias para encontrar a amplitude de variância.

• Como pode ser aplicada.

• Comparação entre as diferentes amplitudes de variância existentes.

Ao final, você deverá ser capaz de responder às seguintes questões:

• Todos os dados podem ser utilizados para encontrar a amplitude de variância?

• É possível extrair a amplitude de variânciaa partir de gráficos e tabelas?

• Como aplicar a amplitude de variância nas mais variadas situações?

• A amplitude de variância é o ponto final do dado que pode ser obtido?

Quando usamos uma “medida de tendência central, a média, a mediana ou a moda, para caracterizar uma amostra, esquecemo-nos de dizer se existe muita variabilidade dos individuos ou não. Por exemplo, saber que o rendimento per capita médio dos EUA (U$31338) é igual ao rendimento per capita médio da Islândia (U$31342), não nos permite saber se existe uma maior percentagem de pobres nos EUA do que na Islândia.

A amplitude traduz a diferença máxima observada entre dois individuos da população (em termos de variável estatística). Depois de ordenados os individuos, a amplitude quantifica-se pela diferença entre o “maior” indivíduo e “menor” indivíduo:

ConteúdoseHabilidades

TEMA 11:AMPLITUDE DE VARIÂNCIA

LeituraObrigatória

A amplitude traduz a diferença máxima observada entre dois individuos da população (em termos de variável estatística).

Page 50: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

50

PROBABILIDADE E ESTATÍSTICAUnidade 5

A = x(n) - x(1)

A principal desvantagem da amplitude é que é muito sensível aos indivíduos extremos, sendo muito influenciáveis por outliers. Outra desvantagem é não levar em consideração todos os indivíduos, mas apenas os dois extremos. Finalmente, quando a variável estatística é discreta (classes), desde que exista pelo menos um indivíduo nas classes extremas, a amplitude é sempre máxima, independentemente da heterogeneidade da amostra.

● A amplitude de uma população formada por individuos iguais é zero.

● A amplitude do produto de uma constante (diferente de zero) por uma variável estatística é igual ao produto da constante pela amplitude da variável estatística.

● A amplitude da soma de uma constante com uma variável estatística é igual à amplitude da variável estatística

A variância amostral quantifica a distância ao quadrado média dos indivíduos ao ponto central (desvio quadrático médio). Sendo X o ponto central então a variância amostral, S2, vem dada por:

A variância amostral representa na física a dificuldade de um corpo alterar a velocidade de rotação (mede a inércia angular do corpo material). A sua importância deriva de, em termos teóricos, o comportamento dinâmico de dois corpos serem idênticos se tiverem a mesma inércia angular (variância) e o mesmo centro de massa (ponto médio). Por semelhança com o sistema físico, duas populações serão semelhantes se tiverem a mesma média e a mesma variância.

Em outras palavras, a amplitude é uma medida rápida da variabilidade. Ela consiste na diferença entre o mais alto e o mais baixo valor de um determinado conjunto de dados (ou seja, de um determinado campo numérico da tabela Oracle). No entanto, na prática a amplitude não é uma medida muito boa. Ela tem a vantagem de ser simples e rápida de calcular. Porém tem a desvantagem de depender apenas de dois valores de toda a distribuição (o menor valor e o maior valor). Com isso, ela pode ser claramente influenciada por um único valor. Precisamos então de medidas que levem em conta todos os valores da distribuição. Essas medidas são a variância e o desvio padrão.

A amplitude é uma medida rápida da variabilidade.

Page 51: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

51

PROBABILIDADE E ESTATÍSTICAUnidade 5

Para entendermos a variância, inicialmente precisamos apresentar o conceito de desvio que consiste na distância de um valor arbitrário ao valor médio da variável. A variância considera todos os valores da distribuição, oferecendo uma vantagem sobre a amplitude que considera somente dois valores. Por isso, ela é mais sensível ao grau de desvio da distribuição de escores. No entanto, um problema da variância é a sua interpretação difícil. Como no numerador da fórmula, os valores dos desvios são elevados ao quadrado, a unidade original de medida acaba sendo alterada. Por exemplo, de número de jogos, para número de jogos ao quadrado, ou seja, o valor 1,333 para a variância significa 1,333 jogos ao quadrado.

Leia o artigo: EstatísticaAplicada, da autora Edite Manuela Fernandes. Disponível em: http://www.norg.uminho.pt/emgpf/documentos/Aplicada.pdf Acesso em 29 de setembro de 2014. A apostila fundamenta or principais conceitos relacionados a preparação da tabela e suas aplicações, dentre outros tópicos.

Leia o artigo: Conceito de estatítisca aplicada, do autor Henrique Dantas Neder. Disponível em: http://www.ecn26.ie.ufu.br/TEXTOS_ESTATISTICA/NOTAS%20DE%20AULA%20DE%20ESTATISTICA.pdf. Acesso em 29 de setembro de 2014.

DesvioPadrãoÉ a medida de espalhamento de valores.

VariânciaÉ o agrupamento de dados.

CoeficienteTermo determinado para ajustar a amostra.

CelsiusEscala de temperatura.

LinksImportantes

Glossário

Page 52: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

52

PROBABILIDADE E ESTATÍSTICAUnidade 5

Referênciabibliográficabásica

COSTA NETO, Pedros Luís de Oliveira. Estatística. 2.ed. rev. e atual. São Paulo: Blucher, 2002. 264p., il. ISBN 85-212-0300-4.

CRESPO, Antônio Arnot. Estatística fácil. 19. ed. atual. São Paulo: Saraiva, 2009. 218p. ISBN 978-85-02-08106-2.

SILVA, Ermes Medeiros da et al. Estatística para os cursos deeconomia, administração e ciências contábeis. 3.ed. São Paulo: Atlas, 1999-2007. 2v. ISBN 85-224-2236-2.

Referênciabibliográficacomplementar

BUSSAB, Wilton O.; MORETTIN, Pedro A. Estatísticabásica. 5.ed. São Paulo: Atual, 2003. 526p. (Métodos quantitativos). ISBN 85-02-03497-9.

LEVINE, David M. et al. Estatística: teoria e aplicações usando o microsoft excel em português. 3.ed. Rio de Janeiro: Livros Técnicos e Científicos, 2005. 819p., il. ISBN 85-216-1419-5. + CD-ROM.

SPIEGEL, Murray R. Estatística: Coleção Schaum e McGraw-Hill. São Paulo: Makron Books, 1993.

STEVENSON, W.J. EstatísticaAplicadaàAdministração. São Paulo: Harbra, 1996.

VIEIRA, Sonia. Elementosdeestatística. 3.ed. São Paulo: Atlas, 1999. 145p. ISBN 85-224-2163-3.

Referências

Page 53: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

53

PROBABILIDADE E ESTATÍSTICAUnidade 6

Nesta aula, você estudará:

• Como encontrar o desvio padrão.

• Quais ferramentas são necessárias para encontrar o desvio padrão.

• Como pode ser aplicado.

• Comparação entre os diferentes desvios padrões.

Ao final, você deverá ser capaz de responder às seguintes questões:

• Todos os dados podem ser utilizados para encontrar o desvio padrão?

• É possível extrair o desvio padrão a partir de tabelas?

• Como aplicar o desvio padrão nas mais variadas situações ?

• O desvio padrão é o ponto final do dado que pode ser obtido ?

Embora tenha sido ultimamente pouco discutido, o cálculo da média aritmética e do desvio padrão de produtos e quocientes apresenta grande interesse estatístico. O desvio padrão de uma distribuição de probabilidade, de uma variável aleatória ou população é uma medida do espalhamento dos seus valores. Ele é definido com a raiz quadrada da variância.

Para entender o desvio padrão, lembre-se que a variância é a média das diferenças ao quadrado entre os pontos dados e a média. A variância está tabulada em unidades quadradas. O desvio padrão, sendo a raiz quadrada daquela quantidade, portanto, mede o espalhamento dos dados ao redor da média, medida na mesma unidade que os dados.

Por exemplo, na população {4,8}, a média é 6 e os desvios da média são {-2,2}. Estes desvios quadráticos são {4,4) a média dos quais é 4. Portanto o desvio padrão é 2. Neste caso 100% dos valores da população estão a um desvio padrão da média. O desvio padrão é a medida mais comum da dispersão estatística, medindo quão largamente

ConteúdoseHabilidades

UNIDADE 6

TEMA 12:DESVIO PADRÃO

LeituraObrigatória

O desvio padrão de uma distribuição de probabilidade, de uma variável aleatória ou população é uma medida do espalhamento dos seus valores.

Page 54: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

54

PROBABILIDADE E ESTATÍSTICAUnidade 6

estão espalhados os valores num conjunto de dados. Se muitos pontos dados estão próximos à média, então o desvio padrão é pequeno; se muitos pontos dados estão longe da média, então o desvio padrão é grande. Se todos os valores forem iguais, então o desvio padrão é zero.

Para uma população, o desvio padrão pode ser estimado por um desvio padrão modificado de uma amostra.

* Suponha que desejamos encontrar o desvio padrão do conjunto dos números 4 e 8.

• Passo 1: Encontre a média aritmética (ou média) de 4 e 8 = 6

• Passo 2:Encontre a diferença entre cada número e a média

4-6 = -28-6 = 2

• Passo 3: Eleve ao quadrado cada uma das diferenças

(-2)2 = 422 = 4

• Passo 4: Some as diferenças obtidas → 4 + 4 = 8

• Passo 5: Divida a soma pela quantia de pontos (aqui temos dois números) → 8/2 = 4

• Passo 6: Tome a raiz quadrada não negativa do quociente → RAIZ4 = 2

** Assim o desvio padrão é 2

Nem todas as variáveis aleatórias têm desvio padrão, pois estes valores esperados não precisam existir. Por exemplo, o desvio padrão de uma variável aleatória que segue uma distribuição de Cauchy é indefinida.

A distribuiçãodeCauchy-Lorentz, assim chamada em homenagem a Augustin Cauchy e Hendrik Lorentz, é a distribuição de probabilidades dada pela função densidade de probabilidade

A sua média não é definida, logo ela também não tem desvio padrão. O seu segundo cumulante é infinito.

A distribuição de Cauchy pode ser simulada como a razão entre duas normais independentes.

O desvio padrão é a medida mais comum da dispersão estatística, medindo quão largamente estão espalhados os valores num conjunto de dados.

Page 55: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

55

PROBABILIDADE E ESTATÍSTICAUnidade 6

No mundo real, encontrar o desvio padrão de uma população toda não é realística, exceto em certos casos, tais como standardized testing, onde cada membro de uma população é tirado da amostra. Na maioria dos casos, o desvio padrão de uma população é estimado examinando uma amostra aleatória tirada da população.

Importante

1) seu valor é afetado pelo número de observações e como elas estão distribuídas, mas ela não é afetada pelos valores das observações externas;

2) é difícil encontrar o desvio padrão de uma população geral, o ideal é selecionar bem a amostra.

3) seu valor pode ser obtido, como vimos, em distribuições, com limites superiores indeterminados para a sua última classe;

Leia o artigo: EstatísticaAplicada, da autora Edite Manuela Fernandes. Disponível em: http://www.norg.uminho.pt/emgpf/documentos/Aplicada.pdf Acesso em 29 de setembro de 2014. A apostila fundamenta or principais conceitos relacionados a preparação da tabela e suas aplicações, dentre outros tópicos.

Leia o artigo: Conceito de estatítisca aplicada, do autor Henrique Dantas Neder. Disponível em: http://www.ecn26.ie.ufu.br/TEXTOS_ESTATISTICA/NOTAS%20DE%20AULA%20DE%20ESTATISTICA.pdf. Acesso em 29 de setembro de 2014.

DesvioPadrãoÉ a medida de espalhamento de valores.

VariânciaÉ o agrupamento de dados.

MédiaaritméticaMédia de todos os dados da amostra.

PopulaçãoÉ o agrupamento de dados.

LinksImportantes

Glossário

Page 56: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

56

PROBABILIDADE E ESTATÍSTICAUnidade 6

Nesta aula, você estudará:

• Como encontrar o coeficiente de variação.

• Quais ferramentas são necessárias para encontrar o coeficiente de variação.

• Como pode ser aplicado.

• Comparação entre os diferentes coeficientes existentes.

Ao final, você deverá ser capaz de responder às seguintes questões:

• Todos os dados podem ser utilizados para encontrar o coeficiente de variação?

• É possível extrair o coeficiente de variação a partir de gráficos e tabelas?

• Como aplicar o coeficiente de variação nas mais variadas situações ?

• O coeficiente de variação é o ponto final do dado que pode ser obtido?

O coeficiente de variação é uma medida de dispersão relativa empregada para estimar a precisão de experimentos e representa o desvio-padrão expresso como porcentagem da média. Sua principal qualidade é a capacidade de comparação de distribuições diferentes. Ele pode ser obtido pela razão entre o desvio-padrão e a média e indica-se a variância por S2. O primeiro passo, entretanto, é encontrar primeiro o desvio padrão.

Apenas relembrando:

Coeficiente de Variação

ConteúdoseHabilidades

TEMA 13:COEFICIENTE DE VARIAÇÃO

LeituraObrigatória

O coeficiente de variação é uma medida de dispersão relativa empregada para estimar a precisão de experimentos e representa o desvio-padrão expresso como porcentagem da média.

Page 57: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

57

PROBABILIDADE E ESTATÍSTICAUnidade 6

O desvio-padrão é calculado pela raiz quadrada da variância e é representado por S, sendo também considerado uma medida de dispersão, relativo à média e como duas distribuições podem ter médias/valores médios diferentes, o desvio-padrão dessas duas distribuições não é compatível. O coeficiente de variação é ainda multiplicado por 100, passando a ser expresso como percentagem.

Exemplo:

O coeficiente de variação é dado pela fórmula:

Onde,

Cv → é o coeficiente de variação

s → é o desvio padrão

X̅→ é a média dos dados

O coeficiente de variação é dado em %, por isso a fórmula é multiplicada por 100.

O coeficiente de variação em uma carteira de ativos serve como medida de risco para cada unidade de ativo. O uso do coeficiente de variação é usualmente recomendado para variáveis quantitativas do tipo razão (na qual exista um zero absoluto), tais como altura, peso e velocidade.

Se a variável não é do tipo razão (exemplo, temperatura em graus Celsius), o coeficiente de variação poderá assumir valores negativos (caso a média seja negativa) a sua interpretação dependerá do ponto de referência (ponto considerado como 0 na escala), levando a interpretações equivocadas e relativas.

Uma outra definição do coeficiente de variação é que é a medida da variabilidade. É independente da unidade da medida utilizada, sendo que – mesmo que a unidade dos dados observados seja diferente, seu valor não será alterado. O coeficente de variação (CV) é o desvio padrão expresso como uma porcentagem média.

CV =100.(s/média)(%)

Vejamos um exemplo onde se pretende comparar dois conjuntos de dados quanto às suas variabilidades. O primeiro conjunto de 84 famílias possui um desvio padrão para o salário de casa de s1 – R$28,04. O segundo composto também por 84 familias possui um desvio padrão para o gasto diário de s2 = R$61,00. É dificil uma comparação racional entre esses valores, pois os desvios só podem ser devidamente avaliados

O coeficiente de variação em uma carteira de ativos serve como medida de risco para cada unidade de ativo.

A palavra razão, vem do latim ratio, e significa “divisão”. Como no exemplo anterior, são diversas as situações em que utilizamos o conceito de razão.

Page 58: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

58

PROBABILIDADE E ESTATÍSTICAUnidade 6

quando comparados entre a mesma grandeza. Assim, sabendo-se que a média de salário das familias foi a média = R$405,83 e considerando que o gasto médio diário no segundo conjunto foi de R$241,00, os coeficientes de variação são respectivamente:

CV1 = 100 x 28,04/405,83

CV2 = 100 x 6/24 = 25%

Verifica-se que o CV para o gasto médio diário é muito maior do que para o salário de casa. Logo, concluímos através do CV de cada grupo, que o CV do grupo 2 é muito maior que o do grupo 1. O coeficiente de variação tem aplicações na pesquisa para comparar a precisão de diferentes experimentos. Entretanto, a qualificação de um coeficiente como alto ou baixo requer familiaridade com o material que é objeto da pesquisa.

Uma pergunta que pode surgir é: o desvio padrão calculado é grande ou pequeno? Esta questão é relevante, por exemplo, na avaliação da precisão de métodos. Um desvio padrão pode ser considerado grande ou pequeno dependendo da ordem da grandeza da variável.

Um CV é considerado baixo (indicando um conjunto de dados razoavelmente homogêneo) quando for menor ou igual a 25%. Entretanto, esse padrão varia de acordo com a aplicação. Por exemplo, em medidas vitais (batimento cardíaco, temperatura corporal, etc) espera-se CV muito menor do que 25% para que os dados sejam considerados homogêneos. Pode ser dificil classificar um coeficiente de variação como baixo, médio, alto ou muito alto, mas este pode ser bastante útil na comparação de duas variáveis ou dois grupos que a princípio não são comparáveis.

Importante

1) O CV é interpretado como a variabilidade dos dados em relação à média. Quanto menor o CV mais homogêneo é o conjunto de dados

2) Adimensional, isto é, um número puro, que será positivo se a média for positiva; será zero quando não houver variabilidade entre os dados

3) Usualmente expresso em porcentagem, indicando o percentual em que o desvio padrão é menor (100%CV<100%) ou maior (100%CV>100%) do que a média.

Page 59: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

59

PROBABILIDADE E ESTATÍSTICAUnidade 6

Leia o artigo: EstatísticaAplicada, da autora Edite Manuela Fernandes. Disponível em: http://www.norg.uminho.pt/emgpf/documentos/Aplicada.pdf Acesso em 29 de setembro de 2014. A apostila fundamenta or principais conceitos relacionados a preparação da tabela e suas aplicações, dentre outros tópicos.

Leia o artigo: Conceito de estatítisca aplicada, do autor Henrique Dantas Neder. Disponível em: http://www.ecn26.ie.ufu.br/TEXTOS_ESTATISTICA/NOTAS%20DE%20AULA%20DE%20ESTATISTICA.pdf. Acesso em 29 de setembro de 2014.

DesvioPadrãoÉ a medida de espalhamento de valores.

VariânciaÉ o agrupamento de dados.

CoeficienteTermo determinado para ajustar a amostra.

CelsiusEscala de temperatura.

LinksImportantes

Glossário

Page 60: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

60

PROBABILIDADE E ESTATÍSTICAUnidade 6

Nesta aula, você estudará:

• Como encontrar o coeficiente de correlação.

• Quais ferramentas são necessárias para encontrar o coeficiente de correlação.

• Como pode ser aplicado.

• Comparação entre os diferentes coeficientes existentes.

Ao final, você deverá ser capaz de responder às seguintes questões:

• Todos os dados podem ser utilizados para encontrar o coeficiente de correlação?

• É possível extrair o coeficiente de correlação a partir de gráficos e tabelas?

• Como aplicar o coeficiente de correlação nas mais variadas situações?

• O coeficiente de correlação é o ponto final do dado que pode ser obtido?

O coeficiente de correlação também é chamado de “coeficiente de correlação produto-momento” ou simplesmente de “ρ” e mede o grau de correlação (e a direção dessa correlação – se positiva ou negativa) entre duas variáveis de escala métrica (intervalar ou de razão).

Esse coeficiente, normalmente representado por ρ assume apenas valores entre -1 e 1.

ρ= 1, significa uma correlação perfeita positiva entre as duas variáveis

ρ= -1, significa uma correlação negativa perfeita entre as duas variáveis, isto é, se uma aumenta, a outra diminui

ρ = 0, significa que as duas variáveis não dependem linearmente uma da outra. No entanto, pode existir uma dependência não linear. Assim, o resultado ρ = 0 deve ser investigado por outros meios.

ConteúdoseHabilidades

TEMA 14:COEFICIENTE DE CORRELAÇÃO

LeituraObrigatória

Page 61: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

61

PROBABILIDADE E ESTATÍSTICAUnidade 6

O tamanho da variável indica força da correlação:

- 0,70 para mais ou para menos indica uma forte correlação

- 0,30 a 0,7 positivo ou negativo indica correlação moderada

- 0 a 0,30 indica fraca correlação (de acordo com o gráfico abaixo)

Usamos o termo correlação positiva quando r>0 e nesse caso à medida que X cresce também cresce y e a correlação negativa quando r<0, e nesse caso à medida que o X cresce y decresce (em média). Quanto maior o valor de r (positivo ou negativo) mais forte a associação. No extremo, se r=1 ou r=-1 então todos os pontos no gráfico de dispersão caem exatamente numa linha reta. No outro extremo, se r=0 não existe nenhuma associação linear. Note que correlações não dependem da escala de valores de x ou y. Por exemplo, obteríamos o mesmo valor se medíssemos altura e peso em metros e kilograma ou em pés e libras.

Considerando que o CV é útil para comparação, em termos relativos do grau de concentração em torno da média

Se CV é menor ou igual a 15% ocorre baixa dispersão tornando a amostra homogênea e estável; já se estiver entre 15 a 30% considera-se uma dispersão média e se estiver maior que 30% considera-se de alta dispersão e heterogênea. Um exemplo é o que está a seguir:

Page 62: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

62

PROBABILIDADE E ESTATÍSTICAUnidade 6

Os valores tomados individualmente no correr de um processo podem parecer todos distintos e estarem dentro dos requisitos mínimos; como um grupo, entretanto, eles tendem a formar padrões que podem ser descritos como uma distribuição que pode ser caracterizada pelos seguintes fatores:

Localização: valor específico da distribuição

Dispersão: a extensão de variação do menor valor ao maior

Forma: define o padrão de variação – simétrica, obliqua, etc

Importante

1) O CV é interpretado como a variabilidade dos dados em relação à média. Quanto menor o CV mais homogêneo é o conjunto de dados

2) Adimensional, isto é, um número puro, que será positivo se a média for positiva; será zero quando não houver variabilidade entre os dados

3) Usualmente expresso em porcentagem, indicando o percentual que o desvio padrão é menor (100%CV<100%) ou maior (100%CV>100%) do que a média.

Leia o artigo:EstatísticaAplicada, da autora Edite Manuela Fernandes. Disponível em: <http://www.norg.uminho.pt/emgpf/documentos/Aplicada.pdf>. Acesso em 29 de setembro de 2014. A apostila fundamenta or principais conceitos relacionados a preparação da tabela e suas aplicações, dentre outros tópicos.

Leia o artigo: Conceito de estatítisca aplicada, do autor Henrique Dantas Neder. Disponível em: <http://www.ecn26.ie.ufu.br/TEXTOS_ESTATISTICA/NOTAS%20DE%20AULA%20DE%20ESTATISTICA.pdf>. Acesso em 29 de setembro de 2014.

LinksImportantes

Page 63: DIREÇÃO ACADÊMICA - famportalacademico.com.br · DIREÇÃO ACADÊMICA Célia Jussani DIREÇÃO GERAL Florindo Corral DIREÇÃO ADMINISTRATIVA Gustavo Azzolini COORDENAÇÃO GERAL

63

PROBABILIDADE E ESTATÍSTICAUnidade 6

DesvioPadrãoÉ a medida de espalhamento de valores.

VariânciaÉ o agrupamento de dados.

CoeficienteTermo determinado para ajustar a amostra.

CelsiusEscala de temperatura.

Referência bibliográfica básica

COSTA NETO, Pedros Luís de Oliveira. Estatística. 2.ed. rev. e atual. São Paulo: Blucher, 2002. 264p., il. ISBN 85-212-0300-4.

CRESPO, Antônio Arnot. Estatística fácil. 19. ed. atual. São Paulo: Saraiva, 2009. 218p. ISBN 978-85-02-08106-2.

SILVA, Ermes Medeiros da et al. Estatística para os cursos deeconomia, administração e ciências contábeis. 3.ed. São Paulo: Atlas, 1999-2007. 2v. ISBN 85-224-2236-2.

Referência bibliográfica complementar

BUSSAB, Wilton O.; MORETTIN, Pedro A. Estatísticabásica. 5.ed. São Paulo: Atual, 2003. 526p. (Métodos quantitativos). ISBN 85-02-03497-9.

LEVINE, David M. et al. Estatística: teoria e aplicações usando o microsoft excel em português. 3.ed. Rio de Janeiro: Livros Técnicos e Científicos, 2005. 819p., il. ISBN 85-216-1419-5. + CD-ROM.

SPIEGEL, Murray R. Estatística: Coleção Schaum e McGraw-Hill. São Paulo: Makron Books, 1993.

STEVENSON, W.J. EstatísticaAplicadaàAdministração. São Paulo: Harbra, 1996.

VIEIRA, Sonia. Elementosdeestatística. 3.ed. São Paulo: Atlas, 1999. 145p. ISBN 85-224-2163-3.

Glossário

Referências