unip - campus paraiso - curso ciência da computação e sistemas de informação disciplina:...
TRANSCRIPT
UNIP - Campus Paraiso -
Curso Ciência da Computação e Sistemas de Informação
Disciplina: Estatística&Probabilidade
Prof. Celso Guidugli
Introdução
Nova Era (Informação X conhecimento)
União entre as três grandes áreas - Humanas - Biológicas - Exatas.
Definição
Estatística ensina como: - coletar/organizar/analisar - interpretar (Dados / Informações) Para Tomadas de Decisões.
Estatística Descritiva<> coleta, organiza e tabela os dados brutos e efetua os primeiros cálculos dos dados.
Estatística Indutiva<>analisa,infere, testa e valida dados e informações
Estatísticas no cotidiano
Empresas de pesquisa em geral:Ibope, Folha SP, Estadão, infográficos dos periódicos etc.
Vacinação em massa: dengue, tétano, gripe.
Esportes: futebol, vôlei, basquete. Mercado de capitais/Bolsa de Valores. Acidentes em geral. Evolução da economia: preços, salários,
nível da renda, emprego, PIB. Produção de bens e serviços. Eleição etc.
Amostras
População é o todo
Amostra é a parte - tem que ser representativa - significativa - “espelho da população” - tem que ter critérios de escolha - quanto maior a amostra maior a certeza
das análises.
Amostras
População é o todo
Amostra é a parte - tem que ser representativa - significativa - “espelho da população” - tem que ter critérios de escolha - quanto maior a amostra maior a certeza
das análises.
Conceitos
População é o todo
Amostra é a parte ou subconjuntos
Parâmetros são medidas com base na população
Estimativas são medidas com base em amostras.
Dados
Dados são informações coletadas de medições, pesquisas, contagens, levantamentos em geral, que serão tratados estatisticamente para dai serem analisados e interpretados. Como
Daí a coleta dos dados se pautar por algumas características do grupo a ser estudado.
Dados são valores da variável em estudo Cada uma destas características ou
unidades de estudo denomina-se Variável.
Amostras
População é o todo
Amostra é a parte - tem que ser representativa - significativa - “espelho da população” - tem que ter critérios de escolha - quanto maior a amostra maior a certeza
das análises.
Técnicas de amostragens
Casual simples ou aleatória(Todos tem a mesma chance; sorteios)
Amostra estratificada(Separar em classes)
Amostra sistemática(seguir uma ordem preestabelecida)
Variáveis e sua Classificação
São dados que caracterizam o conjunto de elementos de interesse no estudo de um determinado grupo .
Variável Qualitativa Nominal: os dados/ valores são expressos por atributos e não por números. EX.:cor dos olhos, da pele, religião, curso, nacionalidade , vc pratica qual esporte?...
Variável Qualitativa Ordinal:não podendo ser medida, a variável segue uma ordem. Ex.:escolaridade, função, cargo, critério, avaliação – ótimo-bom-regular-péssimo, com qual intensidade vc pratica esporte?
Variáveis e sua Classificação
Variável Quantitativa Discreta > números / valores inteiros.
Variável Quantitativa Contínua > números/valores fracionários dentro de certos limites.
Instrumentos para Levantamento de Dados
Tipos de levantamento: Contínuo: Sempre realizado quando
determinados eventos acontecem. Basta um novo caso ocorrer. Ex.:registro de meningite em Minas ou da dengue em Campinasetc.
Periódico: Ocorre de forma cíclica, como o caso do recenseamento no Br a cada dez anos; ou pesquisa de eleição.
Ocasional: Ocorre sem preocupação de continuidade ou periodicidade
Interatividade
Um aluno estava fazendo o seu TCC (trabalho de conclusão de curso) e resolveu fazer uma pesquisa de campo. O tema do seu trabalho era “A UTILIZAÇÃO DA CAMINHADA NO CONTROLE GLICÊMICO DO DIABETES TIPO-II”. Para isso, ele pesquisou a população e verificou que uma amostra de 40 indivíduos era suficiente. Com base no texto podemos afirmar:
a) A população são todos os diabéticos da região sul do país
b) A população deve ser composta por cinco mil diabéticos
c) A amostra é igual a populaçãod) A amostra é composta por 40 indivíduose) Num trabalho científico deve sempre utilizar a
população para análise.
Coleta de Dados
As três técnicas mais conhecidas de coleta de dados são:
Questionário
Formulário
Entrevista.
Questionário
É uma das técnicas mais usadas
Perguntas de forma clara, objetivas e logicamente estruturadas
Perguntas abertas ou fechadas
Pode ser enviada por e-mail, correio ou entregue ao respondente
Tem suas limitações, pois não abrange (analfabetos; deficientes visuais)
Deve possuir um cabeçalho contendo OBJETIVO E JUSTIFICATIVA
Deve possuir também orientações de preenchimento.
Formulário
Mais informal
Resultante de observações ou interrogações
Preenchimento feito pelo próprio investigador
Uniformidade na interpretação dos dados
Exemplo: Anamnese.
Entrevista
Não é simples conversa Planejamento / Organização Dados mais qualificados (expressões e
comportamentos) Mais demorada e cara Equipe qualificada
Não manipular a pergunta
Exemplo: Você gosta muito da aula de bioestatística?
Organização e Apresentação de dados
Apuração é a organização dos dados coletados
Três técnicas: -Listas ou Rol -Tabelas -Gráficos
Lista = Peso de cinco pacientes em Kg (73, 81, 55, 71, 105)
Rol = (55, 71, 73, 81, 105)
Tabelas
Nível de ensino N. alunos
Ensino Fundamental 19.286
Ensino Médio 1.681
Ensino Superior 234
TOTAL 21.201
MATRÍCULAS NAS ESCOLAS DO MUNICÍPIO DE MIRASOL 2002
Fonte:IBGE
Nota: os dados do ensino superior são de origem da Capes.
Título
Cabeçalho
Coluna indicadora
Corpo
Processo Estatístico
Passos:1. Definir o objeto do estudo, as
populações e as amostras envolvidas.2. Coletar os dados amostrais. (brutos)3. Tabular e representar os dados colhidos
na forma de tabelas e gráficos.4. Calcular os parâmetros estatísticos.
Esses passos correspondem à estatística descritiva.
5. Indução de parâmetros amostrais em parâmetros populacionais ou vice-versa.Esses passos correspondem à estatística indutiva.
Coletar os dados amostrais
Atividade de campo Dados brutos: exatamente como
foram colhidos.
Organização dos dados: sequência de procedimentos que organizam e resumem os dados.
Tabela 1.1 – Dados brutos de uma amostra de alunos de uma universidade
Ordem Nome do aluno
Estado Civil
Curso matriculado
Qualidade atribuída à instituição
Sexo Idade em anos
Renda Familiar
Nº de DPs
1 Daiane solteiro Jornalismo Ótima F 19 R$ 3.220,00 2
2 Alberto solteiroAdministra-ção Boa M 20 R$ 4.050,00 0
3 Rui casado Direito Regular M 25 R$ 1.950,00 44 Carolina casado Engenharia Ruim F 21 R$ 1.682,00 6
Dados não agrupados
Tabela de frequências ou distribuição de frequências para dados não agrupados.Variáveis qualitativas e variáveis quantitativas discretas.
Dados Agrupados em Classes
Tabela de frequências ou distribuição de frequências para dados agrupados. Variáveis quantitativas contínuas.
Número de classes.
Limites de classes.
Intervalos de classes.
Elementos de uma Distribuição de Frequência - #1
Classe> representada por i descreve cada intervalo ou linha de uma tabela de frequência. O total das classes de uma tabela é representado por k.
Para se determinar o k (número de classes) usa-se a fórmula:
k=√n, onde n é o Ʃf somatório das frequências. No exemplo anterior k=√42= 6,48,
arredondando=k=7classes.
Tipos de Frequência – f - #1
Frequência simples: f -número de vezes que um mesmo valor se repete na distribuição estudada.
Há 11 alunos casados na tabela, logo, a frequência simples de casados é 11.
Frequência total: ∑f - somatório de todas as frequências simples. No caso 42
Frequência relativa: fr - frequência simples dividida pela ∑f .
Como existem 11 alunos casados num total de 42, a frequência relativa é
11.100÷42= 26,2%.
Tipos de Frequência - #2
Frequência Acumulada –Fi - é a soma das frequências simples desde o valor inicial até a classe indicada.
Frequência Relativa Acumulada – Fr – descreve a soma das frequências simples desde seu valor inicial, representados porcentualmente.(%) ou
Fr = Fi.100 ÷ Ʃfi = ____% . Ex.: Tabela 3 – Fr da 2ª. Classe=13+11=24 Fr=24.100 ÷ 42 = 57,14% .
Elementos de uma Distribuição de Frequência - #2 Limites de Classes> são representados
por I e L e descrevem os extremos de cada classe. Ver no exemplo
Amplitude de Classe> representada por h, descreve a medida do intervalo de classe, calculada: h = L – l = limite superior (L) menos o l (limite inferior).
Numa distribuição com intervalos de classe, a amplitude é a mesma para todas as classes. No ex.:Ls-Ii=1.373.
Amplitude Amostral> representada por AA, é a diferença entre o valor máximo e o mínimo da amostra. Para isso o ROL é necessário. AA do ex.:10.567–956 =9.611.
Interatividade: Mapa de casos de Dengue em Monte Azul
Os porcentuais : fr e Facr de dez/2012 respectivamente são:a) 20,7 %e 33,8%.;
b) 29,8% e49,0%;
c) 9,2% e 33,3%;
d) 12,3% e 44,8%e) 38,7 % e 87,7%.
MÊS f fr(%) Fac Facr
Novem/2011 110 9,2% 110 9,2%
Dezem/2011 170 ?% 280 ?%
Janeiro/2012 220 38,7% 500 87,7%
Fever/2012 70 12,3% 570 100,%
∑f 570 100,% -.- -.-
Apresentação dos Gráficos Estatísticos
A apresentação de tabulações dos dados coletados permite uma rápida e mais dinâmica visão e leitura para interpretação do que se pretende analisar.
A figura geométrica utilizada enseja uma percepção representativa, coerente do que se quer expor. Há que respeitar, contudo:
Simplicidade > facil entendimento. Clareza > correta interpretação. Veracidade > valores verdadeiros.
Interatividade
O gráfico de linhas é um gráfico muito utilizado na área da saúde, economia e nas eleições. Este gráfico é mais indicado para:
a) Verificar partes referentes a um todo
b) Fazer comparaçõesc) Verificar a evolução de um
fenômeno no tempod) Simbolizar o fenômeno e ser mais
atrativoe) mostrar tópicos
Resposta
a) Verificar partes referentes a um todob) Fazer comparaçõesc) Verificar a evolução de um fenômeno no
tempod) Simbolizar o fenômeno e ser mais
atrativoe) mostrar tópicos
InteratividadeA partir do gráfico abaixo, podemos afirmar que a porcentagem dos trabalhadores na área de produção dessa empresa é de:a)24%.b)9%. c)6%.d)33%.e)16%.
Medidas de tendência central
A análise sobre o estudo da frequência mostra ser possível interpretar os grupos dos dados/valores que uma variável pode assumir.
Dentro de uma determinada distribuição de valores, é possível saber como seus grupos de valores se distribuem.
Tais grupos podem estar localizados no início, no meio ou no fim ou se existe uma distribuição homogênea dos valores.
Como traduzir essas tendências.
Medidas de Tendência Central
São as medidas que se aproximam ao centro. As mais utilizadas:
Media aritmética Media ponderada Mediana Moda
Medidas de Variabilidade ou Dispersão> Amplitude Total Variância Desvio Padrão Coeficiente de Variação
Medidas de Assimetria e Curtose
Média Aritmética
É a soma de todos os elementos dividida pela quantidade de elementos.
Exemplo: A lista abaixo representa o tempo (em
minutos) de 10 consultas realizadas em um pronto-socorro no período da manhã.
(16, 9, 11, 16, 20, 18, 7, 9, 16, 14)
µ = 136/10= 13,6
Média Aritmética Simples e Ponderada
Média: valor equidistante (intermediário) entre os valores de todos os elementos da amostra. Imagine uma gangorra: é o ponto de equilíbrio dos valores dos dados de uma amostra.
Média simples: quando a frequência de todos os elementos é igual a 1.
Média ponderada: quando o peso de cada elemento (ou a frequência) da amostra possue mais de um elemento.
Média Ponderada
É a soma de todos os elementos, multiplicados pelos seus respectivos pesos e dividida pela soma dos pesos.
Exemplo: Imagine uma avaliação onde conste
trabalho e prova. A prova tem peso 1 e o trabalho peso 2. Caso o indivíduo tire 4 na prova e 10 no trabalho. Qual é a média?
µp= 4x1+10x2=24/3=8
Média Aritmética Simples - Mas
Cálculo: Somatório dos valores de todos os elementos dividida pelo número de elementos.Exemplo: qual é a média da amostra abaixo?S = {8;2; 10; 6 e 4} ROL=2;4;6;8;10.Mas= ∑xi ÷ n onde xi são os valores dos dados da série e n o número (qtd) dos dados.
65
305
108642
XXX
Desvio em Relação à Média
É a diferença entre cada elemento de um conjunto de valores e a média aritmética.
Exemplo: A idade das crianças atendidas diariamente num posto de vacinação: 6,9,11,7,5 e 4 > Rol> 4,5,6,7,9,11.
Média=4+5+6+7+9+11÷6= 42÷6= Média=7. Desvio Médio:d1= x1-m= 4-7=-3d2= x2-m= 5-7=-2d3= x3-m= 6-7=-1d4= x4-m= 7-7= 0d5= x5-m= 9-7= 2d6= x6-m=11-7= 4.Soma dos desvios = 0.
Propriedades da Média
1ª – A soma algébrica dos desvios tomados em relação à média é nula. Veja o exemplo.
2ª- Somando-se ou subtraindo-se uma constante (c) de todos os valores de uma variável, a média do conjunto fica aumentada ou diminuida dessa constante.
3ª - Caso multiplique-se ou divida-se todos os valores de uma variável por uma constante (c), a média do conjunto fica multiplicada ou dividida por essa constante.
Média para Dados Agrupados Semintervalo de Classe peso/frequênciaCálculo: Somatório da multiplicação de cada dado pela respectiva frequência de dividida pelo somatório das frequência.Mp =Ʃxi.fi ÷ Ʃfi. Exercício: Qual a Média:
VALOR=xi
FREQUÊNCIA SIMPLES=fi
xi.fi
2 20 40
4 25 100
6 18 108
8
10 80
10 5 50
T OTALƩfi=78 Ʃxi.fi=378
5
966292,478
378
X
XX
Média para Dados Com Intervalo de Classe
Todos os valores incluidos em um determinado intervalo de classe, tendem a coincidir com seu ponto médio da classe (pmi), e a partir daí é que se calcula a média aritmética ponderada.
Fórmula para o cálculo da média para dados com intervalo de classe:
M= Ʃxi.fi ÷ Ʃfi onde xi é o ponto médio (pmi) de cada intervalo.
Média para Dados Com Intervalo de Classe
Exemplo: calcular a média da distribuição:A B C D E=(C+D)/2 F=D x E
ClasseLimites de classe Frequência
simples
Ponto médio de classe
Frequência x ponto médio
li ls fi pmi fi x pmi1 0 |---- 10 25 5 1252 10 |---- 20 32 15 4803 20 |---- 30 40 25 10004 30 |---- 40 19 35 6655 40 |---| 50 7 45 315
∑fi 123
∑f1.pmi 2585
Interatividade
Em uma prova de estatística, três alunos obtiveram a nota 8,2; outros três obtiveram a nota 9,0; cinco obtiveram a nota 8,6; um obteve a nota 7,0 e um a nota 8,9. Calculando-se a média, esta será:a)Uma média aritmética com valor 8,0.b)Uma média aritmética com valor 8,5.c)Uma média aritmética simples com valor 7,0.d)Uma média ponderada com valor 8,0.e)Uma média aritmética simples com valor 8,3.
Mediana - Md
É o valor que divide um conjunto de valores ordenados exatamente em duas metades. Exemplo:1.Calcular a mediana do conjunto abaixo:
S = {2;4;6;8;10}
Md = 62.Calcular a mediana do conjunto abaixo:
S = {2;4;6;8;10;12} Md = 7
5,32
162
1
EmdNEmd
32
152
1
mdE
NEmd
Mediana (dados agrupados)
O valor da mediana, portanto, é: Me = 366,1
ClasseLimites de classe Frequência
simplesFrequência acumulada
li ls fi fac
1 250 |---- 300 8 8
2 300 |---- 350 10 18
3 350 |---- 400 14 32
4 400 |---- 450 8 40
5 450 |---| 500 4 44
hffEliMe
Me
acantmeMe
50
14185,22350
Me
Mediana (dados não agrupados)
3. Calcular a mediana da distribuição.A classe da mediana é:
Valor Frequência simples
Frequência acumulada
xi fi fac
2 26 26
4 24 50
6 18 68
8 12 80
10 9 89
4452
902
1
MdNEmd
Emprego da Mediana
Na obtenção de um ponto referencial que divide a distribuição em duas partes iguais.
A média pode estar afetada por valores extremos que , até certo ponto mascaram a própria média.
Geralmente a variável em estudo é salário.
Moda - Mo
É o valor que mais vezes se repete na amostra; o valor de maior frequência. Exercício: S = {2;2;3;3;3;4;5;5;6} Mo = 3S = {2;2;2;3;3;3;4;5;6} Mo = 2 e 3 > BimodalS = {2;3;5;6;7;9;10;11} Mo não existe > Amodal.
Mo = 2
Valor Frequência simples
xi Fi2 264 246 188 1210 9
Moda
A tabela ao lado representa uma pesquisa com 100 meninas, entre 18 a 25 anos de um determinado bairro, na cidade de São Paulo.Elas foram questionadas do que ela gostariam de ganhar no dia dos namorados.Qual a moda?
Ganhar %FloresChocolatePerfumeJóiasCarroApartamentoM.R.
1135101565
Moda (dados agrupados)
A classe modal é a 3ª. (maior frequência).
ClasseLimites de classe Frequência simples
li ls fi
1 1000 |---- 1500 8
2 1500 |---- 2000 10
3 2000 |---- 2500 14
4 2500 |---- 3000 8
5 3000 |---| 3500 4
2,2222500810
82000
MoMo
hff
fliMo
postant
postMo
Posição Relativa da Média
Simétrica > é a posição de uma distribuição em que as 3 medidas:Média, Moda e Mediana coincidem.
Assimetria > acontece quando não há coincidência numa distribuição de em nenhuma das três medidas
Numa distribuição em forma de sino:M=Md=Mo <> curva simétricaMo<Md<M <> curva assimétrica positivaM<Md<Mo <> curva assimétrica negativa
Separatrizes
Mediana<> Trata-se de uma medida de tendência central que define exatamente dois grupos com os mesmos números de valores.
Quartis (Q)<> São valores de uma série que a dividem em 4 partes iguais:
Primeiro Quartil (Q1) é a parte (25%) menor.Segundo Quartil (Q2=Md) é justamente a
parte que coincide com a Mediana Terceiro Quartil (Q3) é o valor (25%) da
distribuição situado na parte superior.Percentis<> são os 99 valores que separam
a distribuição em 100 partes iguais.
Interatividade
Em uma prova de estatística, três alunos obtiveram a nota 8,2; outros três obtiveram a nota 9,0; cinco obtiveram a nota 8,6; um obteve a nota 7,0 e uma nota 8,9. Calculando-se a média, esta será:
a) Uma média aritmética com valor 8,0;b) Uma média aritmética com valor 8,5;c) Uma média aritmética simples com
valor 7,0;d) Uma média ponderada com valor 8,0;e) Uma média aritmética simples com
valor 8,3.
Medidas de variabilidade
As medidas de variabilidade verificam se esses elementos são iguais ou não.
As mais utilizadas são:
Amplitude Variância Desvio padrão Coeficiente de variação
Interatividade
Calcular a média, a moda e a mediana da distribuição (rol é importante):
32,9,9,13,17,12, 10,15,23. Média—Moda—Medianaa) 15,5 9 13b) 13,8 13 9c) 18,3 17 17d) 17,7 9 14 e) 15,5 13 14
Estatística Indutiva ou Inferência Estatística
Estatística indutiva é a parte da estatística que obtém conclusões e previsões da população através de amostras.
Exemplo: Pesquisa política
Medidas de dispersão ou de variabilidade
Medidas de dispersão absolutas: Amplitude Total = diferença entre os
extremos dos valores coletados; a diferença entre o limite superior e o inferior dos elementos da amostra.
Desvio Médio = é o somatório das diferenças entre o valor de cada dado e a média apurada, dividida pelo número de elementos.
Variância = S² Desvio-padrão = √variância = S
Medidas de dispersão relativas: Coeficiente de Variação.
Amplitude
É a diferença entre o maior e o menor elemento.
Exemplo:Numa maternidade, em um determinado dia, nasceram de parto cesariana 4 crianças, com os respectivos pesos ao lado:Qual a amplitude?
A = 5,310 – 2,550A= 2,760
Peso kg3,1012,5502,6405,310
Desvios (revisão)
Conceito de desvio: a diferença (positiva ou negativa) entre o valor de um determinado elemento e a medida de posição da amostra, no caso da média.
Por exemplo: você tirou nota 7,5 numa prova em que a nota média dos alunos foi 4,5. Significa que você tem um desvio positivo, em relação à amostra, de 3 pontos:
Medidas de dispersão são tratamentos estatísticos dados a todos os desvios da amostra.
0,35,45,7 iiii ddXxd
Desvio-padrão
É a mais importante das medidas de dispersão.
É a raiz quadrada da soma de todos os desvios ao quadrado dividida pelo número de elementos menos um.
Exemplo: calcular o desvio-padrão de: S = {2;4;6;8;10}, cuja média é 6.Desvios: di = {-4;-2;0;2;4}Desvios ao quadrado: di2 = {16;4;0;4;16} =Soma dos desvios = 40 ÷ amostra = 5 – 1,
portanto:
2,31015
40
SSS
Desvio-padrão (dados não agrupados)
Exemplo: calcular o desvio-padrão.
Valor Frequência simples
Valor x frequência Desvios Desvios ao
quadrado
Desvios ao quadrado x frequência
xi fi xi x fi di di2 fi x di2
1 20 20 -3,3 10,6 213,03 30 90 -1,3 1,6 47,95 20 100 0,7 0,5 10,97 15 105 2,7 7,5 112,49 10 90 4,7 22,4 224,4
Somas 95 405 608,4Média: 4,3 Desvio-padrão 2,5
5,21954,608
1
SSN
fdS ii
Desvio-padrão (dados agrupados)
Exemplo: calcular o desvio-padrão.
ClasseLimites de classe
Frequência
simples
Ponto médio de
classe
Valor x frequência
Desvios
Desvios ao
quadrado
Desvios ao quadrado x frequência
li ls fi xi xi x fi di di2 fi x di2
1 10 |---- 20 10 15 150 -16,8 281,1 2810,62 20 |---- 30 20 25 500 -6,8 45,8 915,23 30 |---- 40 25 35 875 3,2 10,5 261,74 40 |---- 50 8 45 360 13,2 175,2 1401,45 50 |---| 60 5 55 275 23,2 539,9 2699,4
Som 68 2160 8088,2 Média: 31,8 Desvio-padrão 11,0
0,111682,8088
1
SSN
fdS ii
Variância
Variância (S²): é o quadrado do desvio-padrão; mesmo cálculo, interrompido antes
de se extrair a raiz quadrada. Assim sendo:
se a variância de uma amostra for 625, o desvio-padrão é √625 = 25;
se o desvio-padrão de uma amostra for 13, a variância é 13² = 169.
Variância (S2)
É a soma da diferença de cada elementopela sua média elevado ao quadrado
dividida pelo número de elementos menos 1
1
)(1
2
2
n
XXs
n
ii
Exemplo:Uma paciente diabética mede sua glicemia 4 vezes por dia, conforme os dados abaixo: 70, 120, 230, 120) Calcule a Variância ?
Variância
Resolução:1º calcula-se a média.A média é 1352º (X-média)2
(70 - 135)2 =4225 (120-135)2 =225 (230-135)2 =9025 (120-135)2 =2253º ∑ =137004º 13700/n-1 13700/4-1 13700/3 = 4566,66Então a variância é 4566,66.
Variância
Exemplo:Uma paciente diabética mede sua glicemia 4 vezes por dia, conforme os dados abaixo: (70, 120, 230, 120) Calcule a Variância ?
1
)(1
2
2
n
XXs
n
ii
Desvio Padrão
Exemplo:Uma paciente diabética mede sua glicemia 4
vezes por dia, conforme os dados abaixo:
(70, 120, 230, 120) mg/dl Variância = 4566,66 mg/dl
Desvio Padrão = 67,57 mg/dl
Coeficiente de Variação (Cv%)
O coeficiente de variação é a razão entre desvio padrão e a média, multiplicado por 100.
XSCV
Coeficiente de variação
Exemplo: Uma paciente diabética mede sua
glicemia 4 vezes por dia, conforme os dados abaixo:
(70, 120, 230, 120) mg/dl Variância = 4566,66 mg/dl
Desvio Padrão = 67,57 mg/dl
Cv= 67,57/135= 0,50 x 100 = 50%
Interatividade
Imagine a seguinte situação.Duas pacientes diabéticas:
Paciente A Paciente B
Média 120mg/dl 120mg/dl
Desvio 30mg/dl 50mg/dl
Com base nos dados assinale a alternativa correta:
a) A paciente A e B possuem a mesma variabilidade
b) A paciente A esta com a glicemia mais equilibrada que B
c) A paciente B esta com a glicemia mais equilibrada que A
d) As duas pacientes não possuem variabilidade em relação a glicemia
e) A paciente B é a que varia menos em relação a glicemia
Correlação Linear simples
É o grau de associação entre duas variáveis. Não significa dependência.
Exemplos:
Existe relação entre mortes por doenças respiratórias e níveis de poluição?
O diabetes está relacionado com a obesidade?
Existe relação entre obesidade infantil e tempo despendido na frente da televisão?
Fórmula do Coeficiente de correlação
A fórmula para r é:
xy (x) . ( y)
x2 _ (x)2 y2 _ (y)2
r =n.
n. n.
-
.
Classificação
Propriedade: -1 r 1
Casos particulares:
r = 1 correlação linear positiva e perfeitar = -1 correlação linear negativa e perfeitar = 0 inexistência de correlação linear
Exemplo de cálculo do coeficiente de correlação
x y x2 y2 x.y 1 1 2 2 3 4 4 5 5 8 X= número de casos de obesidadeY= número de casos de diabetes
Exemplo de cálculo do coeficiente de correlação (continuação)
x y x2 y2 x.y 1 1 1 1 1 2 2 4 4 4 3 4 9 16 12 4 5 16 25 20 5 8 25 64 40 15 20 55 110 77 Σx= Σy= Σx.y=Σx2= Σy2=
Exemplo de cálculo do coeficiente de correlação (continuação)
77 ( 15 ) . ( 20 )
55 _ (15)2 110 _ (20)2
r =5.
5. 5.
-
.
xy (x) . ( y)
x2 _ (x)2 y2 _ (y)2
r =n.
n. n.
-
.
Σy= Σx.y=Σx2= Σy2=Σx= 15 20 55 110 77
= 0,98
Regressão Linear
Regressão não é adivinhação. Ela apenas representa uma tendência
Serve para fazer previsões
A partir dos valores de x se obtém y
Exemplo
Imagine uma situação em um determinado hospital:Se considerarmos o número de casos de obesidade(X) e o número de casos de diabetes (Y), calculando a equação de regressão teríamos:
Casos de obesidade
Casos de diabetes
2 4
3 6
4 8
5 10
Y =2x
Interatividade
Com base na figura, assinale a alternativa incorreta:a) o gráfico apresenta uma correlação perfeita com coeficiente igual a r = 1b) o gráfico apresenta correlaçãoc) a correlação é positivad) o coeficiente pode variar entre -1 e 1e) quanto mais próximos estes pontos se aproximarem da reta mais forte a correlação vai ser.
comprimento (cm) x peso (kg)
10,012,014,016,018,020,022,024,026,028,030,0
90 95 100 105 110
comprimento
peso
Resposta
a) o gráfico apresenta uma correlação perfeita com coeficiente igual a r = 1
b) o gráfico apresenta correlaçãoc) a correlação é positivad) o coeficiente pode variar entre -1 e 1e) quanto mais próximos estes pontos se
aproximarem da reta mais forte a correlação vai ser.
Probabilidade
P = Є/S P = nº de casos favoráveis / nº de casos
possíveis
Exemplo:Acertar um exercício teste:a)b)c)d)e) P= 1/5 ou seja 20%
Probabilidade
Teorema da soma ou regra do “ou”
Exemplo:Chance de ter uma criança menina ou
menino.
P = ½ + ½ = 2/2 = 1 ou seja 100%
Teorema do produto ou regra do “e”
Exemplo:Chance do primeiro filho ser menino e o
segundo também ser menino.
P= ½ x ½ = ¼ = 25%
Exemplo
Um professor de anatomia queria verificar como seus alunos foram na prova. Ele verificou que a prova seguiu uma normalidade. Então calculou a média que é 7, com desvio padrão igual a 2. Sabendo que essa classe tem 100 alunos, determine:
a) Quantidade de alunos que tiraram entre 7 e 9
b) Quantidade de alunos que tiraram abaixo de 9
c) E aqueles que tiraram acima de 9.
Resolução
Usando a fórmula temos:Z = 9-7 = 2/2 = 1Área entre 0 e 1 é 34,13%, ou seja, 34 alunos tiraram entre 7 e 9.Abaixo de 9, (34% +50%) =84% ,ou seja, 84 alunosE 16 alunos acima de 9.
Interatividade
De uma classe com 30 alunos, dos quais 14 são meninos, um aluno é escolhido ao acaso. Qual a probabilidade de o aluno escolhido ser uma menina?
a) 14/30b) 1c) 16/30d) 1/30e) 1/14
Teste de Hipótese
Hipótese é uma resposta provisória para uma questão
Exemplos: A dieta de carboidratos é melhor do que
proteínas
O risco de doenças é maior em mulheres fumantes do que em homens fumantes
O baixo peso ao nascer é maior quando a mãe faz uso continuado de drogas ilícitas durantes a gestação.
Teste de hipótese
As hipóteses podem ser falsas ou verdadeiras
Proceder levantamento de dados e aplicar um teste de hipótese
Existem duas hipóteses:
Hipótese Nula (H0) afirma que não há diferenças
Hipótese Alternativa (Ha) afirma que existe diferença e não é por causa do erro amostral
Teste de hipótese
Nível de significância representa a probabilidade com que a hipótese nula pode ser rejeitada com segurança
O mais usual é o nível de 0,05 (5%), ou seja, queremos ter 95% de certeza de que não houve erro na amostra
Teste de hipótese
Erro Tipo I é quando rejeitamos a hipótese nula sendo que esta deveria ser aceita
Erro do tipo II é quando não rejeitamos a hipótese nula, sendo que a mesma deveria ser rejeitada
Teste de hipótese
Os testes podem ser divididos em:
- Paramétricos – exigem uma série de pré-requisitos para sua aplicação
Exemplo: teste t e ANOVA
- Não Paramétricos – exigem menos, por isso tem menor poder de decisão
Exemplo: Teste qui-quadrado e Mann- Whitney.
Passos para realizar um Teste de Hipóteses:
Passo 1 : Definição da Hipótese O primeiro passo é o estabelecimento das
hipóteses: hipótese nula e hipótese alternativa
Hipótese Nula (Ho): É um valor suposto para um parâmetro.Se os resultados da amostra não forem muito diferentes de Ho, ela não poderá ser rejeitada.
Hipótese Alternativa(Ha) : É uma hipótese que contraria a hipótese nula. Essa hipótese somente será aceita se os resultados forem muito diferentes de Ho.
Passos para realizar um Teste de Hipótese
Passo 2: Calcular a estatística do Teste
É o valor calculado a partir da amostra, que será usado na tomada de decisão. Para tomar uma decisão é necessário comparar o valor tabelado com a estatística do teste.
Para o caso de testes de médias, a estatística do teste é a variável padronizada Z:
)n()X(Zcal
Passos para realizar um Teste de Hipótese
Passo 3. Regra de Decisão: Se o valor da estatística do teste cair na região crítica, rejeita-se Ho. Ao rejeitar a hipótese nula (Ho) existe uma forte evidência de sua falsidade.
Ao contrário, quando aceitamos, dizemos que não houve evidência amostral significativa no sentido de permitir a rejeição de Ho.
Exemplo
Um Diretor de um hospital desconfia que o tempo médio de espera para atendimento de seus pacientes é superior a 20 minutos. Para testar essa hipótese ele entrevistou 20
pessoas e questionou quanto tempo demorou para ser atendido. O resultado dessa pesquisa aparece a seguir:
min20 :min20 :
1
HHo min 8,21X min40,1S
75,520/40,1208,21
/
nSXt o
o
729,1 75,5 19,05,00 tt
Rejeita-se Ho
Interatividade
Uma nutricionista quer comparar o efeito de duas dietas alimentares para perda de peso.
Para isso, ela criou duas hipóteses: H0= as perdas de peso são as mesmas Há= as dietas determinam perdas de peso
diferentes
Quando acontece o erro do tipo I ?
a) É quando não rejeitamos a hipótese nula, sendo que a mesma deveria ser rejeitada
b) É quando rejeitamos a hipótese nula sendo que esta deveria ser aceita
c) É quando não identificamos o nível de significância
d) É quando não usamos critérios definidose) É quando utilizamos o teste errado
Resposta
a) É quando não rejeitamos a hipótese nula, sendo que a mesma deveria ser rejeitada
b) É quando rejeitamos a hipótese nula sendo que esta deveria ser aceita
c) É quando não identificamos o nível de significância
d) É quando não usamos critérios definidose) È quando utilizamos o teste errado