estatística básica

Upload: nagib-yassin

Post on 14-Jul-2015

2.953 views

Category:

Documents


6 download

TRANSCRIPT

Prof. Nagib Yassin Rio Verde-Go 2012 2 ESTATSTICA BSICA 3 UNIVERSIDADE DE RIO VERDE PR-REITORIA DE GRADUAO PLANO DE ENSINO 1. IDENTIFICAO Professor: Nagib Yassin Disciplina: Estatstica Bsica Ano: 2012 Carga horria: 72h Semestre letivo: 2012/1 Pr-requisitos: Clculo Diferencial e Integral Oferecido para o curso: Biologia, Matemtica, Medicina Veterinria 2. EMENTA EstatsticaDescritiva,ElementosdeProbabilidadeedeInfernciaEstatstica,Base conceitual, Mtodos e Aplicaes da Estatstica em Cincia e Tecnologia. 3. OBJETIVOS 3.1. Objetivo geral Habilitaroestudanteparaacompreensodabaseconceitualemetodolgicada estatstica requerida no planejamento, anlise de dados e interpretao de resultados de pesquisa cientfica. 3.2. Objetivos especficos Fundamentao estatstica para o estudo de disciplinas do ciclo profissional. 4. CONTEDO PROGRAMTICO I. Introduo Histria, conceito, funes e aplicaes da estatstica; estatstica na pesquisa cientfica; Conceito de populao e amostra; tipos de variveis e escalas de mensurao; II. Estatstica Descritiva Organizao e Apresentao de dados; 4 Tabelas de freqncias; histograma e polgono de freqncias; resumo de cinco pontos; diagrama de ramo e folhas; grfico de caixas (Box-Plot); SnteseNumrica:Medidasdetendnciacentral(mdiasaritmtica,harmnicae geomtrica, moda e mediana); Medidas separatrizes: quartis, decis e percentis; Medidas deVariabilidade(amplitude,amplitudeinterquartlica,varincia,desvio-padroe coeficiente de variao); III. Elementos de Probabilidade Introduoaosprincipaisconceitosdeprobabilidade:Experimentoaleatrio,espao amostral e eventos. Definio clssica e frequentista de probabilidade; Probabilidade Condicional e Independncia de eventos. Variveisaleatriasunidimensionaisdiscretasecontnuas;ModeloBinomial,de Poisson. E modelos Normais; IV. Inferncia Estatstica Introduo aos principais conceitos de Inferncia Estatstica; Distribuio amostral da mdia e da proporo; teorema central do limite; Estimaopontualeporintervalodamdiaeproporopopulacional:conceitos; mtodos de estimao; propriedades dos estimadores; Testedehiptese:conceitos;hipteseestatstica;errosdedeciso;nvelde significncia e potncia do teste; Testedehiptesereferentemdiadeumapopulaonormal;testedehiptesede igualdade de mdias e teste de hiptese da igualdade de varincias de duas populaes normais; testes de hipteses referentes s propores. 5. METODOLOGIA Adisciplinaserconduzidaatravsdaexposiodamatria,discussodocontedo programtico e de exemplos ilustrativos. Eventualmente, tpicos no expostos em classe seroassinaladosparaestudoextraclasse.Semprequepossvel,asexposiessero auxiliadas com recursos visuais, especialmente providos Porprojetoresdetransparnciasedeslides.Exercciosparadesenvolvimentodo tirocnioseroassinaladospararesoluoextraclasse.Algunsminutosdecadaaula serodedicadosparaoesclarecimentodedvidasedificuldadesencontradaspelo estudante.Osestudantestambmterodisponvel,paraessesesclarecimentos, atendimentoextraclasse,providopelodocenteemonitordadisciplina,emhorrios 5 apropriados,previamenteestabelecidos.Textoprprioelaboradopelaequipedocente ser colocado disposio do estudante, para auxlio ao estudo da disciplina. 6. ESTRATGIAS DE AVALIAO A mdia de aproveitamento (MA) ser obtida, calculando:( ) ( ) + +=73 NP3 NT4(MEP)MASendo: (NP) Nota de uma nica prova (NT) Nota referente a um trabalho mensal (MEP) Nota referente a 4 listas menais de exerccios. TrabalhosObs:As notas de NT e de MEP no daro direito ao aluno requerer 2a chamada A freqncia compor o sistema de avaliao (5% a menos para cada falta e/ou captulo) 7. MATERIAL DIDTICO Textos redigidos pelo corpo docente e bibliografia existente na biblioteca da Universidade de Rio Verde. Coleo de exerccios versando sobre o contedo programtico. 8. BIBLIOGRAFIA RECOMENDADA BLACKWELL, D. Estatstica Bsica. So Paulo: McGraw-Hill do Brasil Ltda. 1974. 143p. BOTELHO,E.M.D.;MACIEL,A.J.EstatsticaDescritiva(UmCursoIntrodutrio). Viosa: Imprensa Universitria, Universidade Federal de Viosa. 1992. 65p. BUSSAB, W.O.; MORETTIN, P.A. Estatstica Bsica. So Paulo: Atual Editora. 1987. HOEL, P.G. Estatstica Elementar. So Paulo: Editora Atlas S.A. 1980. IEMMA, A.F. Estatstica Descritiva. Piracicaba: Fi Sigma R Publicaes. 1992. 182p. MEYER, P.L. Probabilidade, Aplicaes Estatstica. Rio de Janeiro; Ao Livro Tcnico S.A. 1976. MORETTIN,P.A.IntroduoEstatsticaparaCinciasExatas.SoPaulo:Atual Editora Ltda. 1981. 211p. 6 PARADINE,C.G.;RIVETT,B.H.P.MtodosEstatsticosparaTecnologistas.So Paulo: Ed. Polgono/ Editora da Universidade de So Paulo. 1974. 350p. PIMENTELGOMES,F.IniciaoEstatstica.6ed.SoPaulo;LivrariaNobelS.A. 1978.211p. SILVA,J.G.C.da.EstatsticaBsica.Versopreliminar.InstitutodeFsicae Matemtica, Universidade Federal de Pelotas. Pelotas, 1992. 173p. SILVEIRA,Jr.,P.S.,MACHADO,A.A.,ZONTA, E.P.,SILVA,J.B.CursodeEstatstica, vol.1. Pelotas: Editora Universitria, UFPEL. Pelotas, 1989.135p. SILVEIRA,Jr.,P.S.,MACHADO,A.A.,ZONTA, E.P.,SILVA,J.B.CursodeEstatstica, vol.2. Pelotas: Editora Universitria, UFPEL. Pelotas, 1992.234p. SPIEGEL, M.R. Estatstica. So Paulo: McGraw-Hill do Brasil. 1975.580p. TRIOLA, M. F. Introduo Estatstica, 9 ed. So Paulo: LTC. 2005. 662p. 7 Sumrio 1. INTRODUO12 1.1. Diviso da estatstica13 1.1.1. Estatstica Descritiva:13 1.1.2. Estatstica Indutiva ou Inferencial.13 2. POPULAO E AMOSTRA15 2.1. Populao ou universo15 2.2. Amostra16 2.3. Tcnicas de Amostragem18 2.3.1.Amostragem aleatria simples19 2.3.2. Amostragem sistemtica20 2.3.3.Amostragem estratificada20 2.3.4.Amostragem por conglomerados21 2.3.5.Amostragem de convenincia (no-probabilstica)21 3. Varivel 23 3.1. Classificao das variveis23 3.2. Contnuas23 3.3. Discretas23 3.4. Nominais ou categricas23 3.5. Ordinais24 4. Escalas de Mensurao25 5. Anlise Exploratria de Dados26 5.1.Introduo26 5.2.Tabelas27 6. SRIES E GRFICOS ESTATSTICOS29 6.1. Introduo29 6.1.1.Sries Estatsticas29 6.1.1.1. Sries Histricas, Cronolgicas, Temporais ou Marchas29 6.1.1.2. Sries Geogrficas, Espaciais, Territoriais ou de Localizao30 6.1.1.3. Sries Conjugadas e Tabela de Dupla Entrada30 6.1.1.4. Sries Especficas ou Categricas31 6.2.Grficos Estatsticos32 6.2.1. Grficos de linha 32 6.2.2. Grfico de colunas e grfico de barras 32 6.2.3. Grfico em setores (pizza) 33 6.2.4.Outros tipos de grficos34 6.2.4.1. Cartograma34 6.2.4.2. Estereograma34 6.2.4.3. Pictograma34 7. DISTRIBUIO DE FREQNCIAS35 7.1. Introduo35 7.2. Distribuies por ponto ou valores.35 8 7.3. Distribuies por classes ou intervalos36 7.4. Elementos de uma distribuio de frequncias37 7.4.1. Classes37 7.4.2. Limites de classe37 7.4.3. Amplitude de um intervalo de classe, ou, simplesmente, intervalo de classe 37 7.4.4. Amplitude total da distribuio (AT) 38 7.4.5. Amplitude amostral (AA) 38 7.4.6. Ponto mdio de uma classe (xi) 38 7.4.7. Freqncia simples ou freqncia absoluta ou, simplesmente, freqncia de uma classe ou de um valor individual 38 7.5. Tipos de frequncias38 7.5.1.Freqncias simples ou absolutas (fi)38 7.5.2. Freqncias relativas (fri)39 7.5.3. Freqncia acumulada (Fi)39 7.5.4. Freqncia acumulada relativa (Fri) de uma classe 39 7.6. Apresentao de uma distribuio de freqncias39 7.6.1. Distribuio de freqncias por pontos ou valores.39 7.6.2. Distribuio de freqncias por classes ou intervalos40 7.7. Grficos de distribuies de frequncias41 7.7.1. Histograma de frequncias41 7.7.2.Polgono de frequncia42 7.7.3. Polgono de frequncia acumulada43 7.7.4. Grfico stem-and-leaf (tronco e folhas)43 8. MEDIDAS DE POSIO45 8.1. Mdia aritmtica45 8.1.1. Mdia nas sries de dados no agrupados45 8.1.2. Mdia nas sries de dados agrupados sem intervalo de classe46 8.1.3. Mdia nas sries de dados agrupados com intervalos de classes47 8.2.1. Moda nas sries de dados agrupados sem intervalos de classes48 8.2.2. Moda nas series de dados com intervalos de classe48 8.3. Mediana (Md)49 8.3.1. Medianas nas series de dados sem intervalos de classe49 8.3.2. Mediana nas sries de dados com intervalos de classe50 8.4. Medidas de ordenamento e posio51 8.4.1. Quartis51 8.4.2. Centil ou Percentil52 8.5. Que promdio usar?53 9.MEDIDAS DE DISPERSO54 9.1 Varincia54 9.2. Desvio padro56 9.2.1. Desvio padro nas sries de dados no agrupados56 9.2.1.1. Desvio padro nas sries de dados agrupados sem intervalo de classe57 9.2.1.2 Desvio padro nas sries de dados agrupados com intervalos de classe58 9 9.3. Coeficiente de variao59 9.5. Amplitude entre quartis59 9.6. Box-and-Whisker plots60 Exerccios 61 Exerccios diversos63 10.PROBABILIDADES73 10.1. Entendendo a probabilidade74 10.2. Experimento aleatrio74 10.3. Clculo de probabilidades76 10.4 Eventos mutuamente exclusivos77 10.5. Eventos independentes78 10.6.Regras das probabililidades78 10.6.1. Regras da multiplicao79 10.6.2. Regras da adio79 10.7. Probabilidade condicional81 10.8. Permutaes82 10.9. Combinaes83 Exerccios85 11. Distribuies de probabilidade87 11.1. Distribuies discretas de probabilidade88 11.2. Distribuio binomial88 11.2.1. Hipteses do modelo Binomial88 11.2.2. Propriedades da distribuio binomial91 11.3. Distribuio de Poisson93 11.3.1.Propriedades da distribuio de Poisson96 11.4.Relao entre as distribuies Binomial e Poisson96 Exerccios 98 11.5. Distribuies contnuas de probabilidade100 11.5.1. Distribuio normal ou Gaussiana100 11.5.2 - Propriedades da Distribuio Normal100 11.5.3 - Distribuio Normal Padronizada101 12.Distribuio amostral das mdias103 12.1. Teorema central do limite104 12.2. Desvio padro da mdia104 12.3. Distribuio t de "Student" 105 12.3.1. Propriedades da distribuio t de "Student"106 Exerccios Diversos107 13 ESTIMAO ESTATSTICA116 13.1. Estimao de parametros populacionais116 13.2. Intervalo de confiana para a mdia populacional117 13.2.1. Intervalo de confiana para a mdia populacional () com o desvio padro () conhecido117 10 13.2.2.Intervalodeconfianaparaamdiapopulacional()comodesviopadro() desconhecido.118 13.3. Duas amostras independentes119 13.3.1. Intervalo de confiana para a diferena entre duas mdias populacionais121 13.4. Teste t emparelhado124 13.5. Determinao do tamanho da amostra125 Exerccios126 Exercicios diversos128 14. TESTES DE HIPTESES132 14.1. Hiptese estatstica132 14.2. Regra de deciso133 14.3. Erros de deciso134 14.4. Probabilidade dos erros de deciso134 14.5. Valor P136 14.6. Significncia estatstica versus importncia cientfica136 14.7. Testes unicaudal e bicaudal137 14.8. Execuo do teste de hiptese138 Exerccios139 15 TESTES PARA A COMPARAO ENTRE DUAS MDIAS 140 15.1. Fundamento dos testes de significncia140 15.2. Teste do valor da mdia141 15.3. Comparao entre a mdia de uma amostra e a mdia da populao (conhecido)142 15.4. Regio crtica:143 15.5. Teste t 144 15.6. Comparao entre a mdia de uma amostra ea mdia da populao145 15.7. Comparao entre duas varincias testes de Fisher (F)147 15.8. Comparao entre as medias de duas amostras independentes149 15.9. Duas amostras de mesmo tamanho149 15.10. Duas amostras de tamanhos diferentes151 15.11. Comparao entre mdias de duas amostras emparelhadas153 15.12. Resumo da aplicao de testes para comparar duas sries de dado156 15.13. Tamanho da amostra 156 Exerccios158 Exerccios diversos160 16. CORRELAO E REGRESSO167 16.1. Correlao167 16.1.1. Introduo167 16.2. Padres de associao167 16.3. Indicadores de associao168 16.4.Coeficiente de correlao171 16.5. Hipteses bsicas171 16.7. Distribuio amostral de r (quando = 0)172 11 16.8. Distribuio amostral de r (quando 0)174 16.9. Propriedades de R175 16.20. Regresso175 16.21. Estimativa dos parmetros de regresso178 16.22. Estimativa da varincia do termo erro179 16.23. Distribuies das estimativas182 16.23.1. Distribuio do estimador b182 16.24. Decomposio da soma dos quadrados184 16.24.1. Decomposio dos desvios184 16.24.2. Clculo das variaes185 16.25. Intervalos de confiana185 16.25.1. Intervalo para o coeficiente linear ()185 16.25.2. Intervalo para o coeficiente angular ()185 16.25.3. Intervalo para previses186 16.26. Testes de hipteses187 16.26.1. Teste para a existncia da regresso188 16.26.2. Teste para o coeficiente linear188 16.27. Coeficiente de determinao ou de explicao189 Exerccios190 12 1.INTRODUO Objetivos 1.Definir estatstica 2.Listar algumas razes para o estudo da estatstica 3.Definir varivel 4.Distinguir entre: Estatstica descritiva e inferencial Varivel dependente e varivel independente 5.Definir variveis nominal, ordinal, intervalar e de razo. 6.Conceituar varivel aleatria7.Distinguir entre: Variveis qualitativas s quantitativas Variveis discretas e contnuas Por onde quer que se olhe ou escute uma coleo de nmeros so normalmente enunciados como estatsticas. Estes nmeros referem-se aos mais diversos campos de atividades: esportes, economia, finanas, etc. Assim tem-se, por exemplo: * O nmero de carros vendidos no pas aumentou em 30%. * A taxa de desemprego atinge, hoje, 7,5%. * As aes da Telebrs subiram R$ 1,5, hoje. * Resultados do Carnaval no trnsito: 145 mortos, 2430 feridos. Um nmero denominado uma estatstica (singular). No fechamento da bolsa as aes da Vale foram cotadas a R$ 45.50. As vendas de uma empresa no ms constituem umaestatstica.Jumacoleodenmerosoufatosdenominadodeestatsticas (plural).Porexemplo,AsvendasdaempresaPicunhastotalizaram:2,5milhesem janeiro, 2,7 em fevereiro e 3.1 em maro. No entanto o termo Estatstica tem um sentido muito mais amplo, do que apenas nmeros ou coleode nmeros. A Estatstica pode ser definida como: A cincia de coletar, organizar, apresentar, analisar e interpretar dados numricos com o objetivo de tomar melhores decises. 13 Assim como advogados possuem regras de evidncia e contabilistas possuem prticas comumenteaceitas,pessoasquetratamcomdadosnumricosseguemalguns procedimentos padres. Algunsdestesmtodosserovistosnestadisciplinaeoutrosemumasegunda disciplina.NoesquecendoquemesmoduasdisciplinasdeEstatsticanoesgotamo assunto,ouseja,elasdoapenasumaidiadosprocedimentosetcnicasexistentes para se lidar com dados numricos. 1.1. Diviso da estatstica A estatstica divide-se em trs (quatro) grandes reas de conhecimento: Teoria da Amostragem,MtodosDescritivoseInfernciaEstatsticaaquartagrandereaa Probabilidade, porm, segundo alguns autores, Probabilidade no parte da Estatstica, mas sim um ramo da Matemtica. TodaaEstatsticabaseadaemeventosaleatriosesuaocorrncia baseada emprobabilidades.DestemodoimpossvelestudaraEstatsticasempossuir conhecimentos probabilsticos. 1.1.1.Estatstica descritiva: Os procedimentos usados para organizar, resumir e apresentar dados numricos. Conjuntos de dados desorganizados so de pouco ou nenhum valor. Para que os dados se transformem em informao necessrio organiz-los, resumi-los e apresent-los. O resumodeconjuntosdedadosfeitoatravsdasmedidaseaorganizaoe apresentao atravs das distribuies de freqncias e dos grficos ou diagramas. 1.1.2.Estatstica Indutiva ou Inferencial. Consisteeminferir(deduziroutirarconclusesarespeitodas)propriedadesde um universo a partir de uma amostra. O processo de generalizao, que caracterstico do mtodo indutivo, est associado a uma margem de incerteza. A medida da incerteza tratada mediante tcnicas e mtodos que se fundamentam na Teoria das Probabilidades. Dessaforma,poderamosresumirospassosnecessriosparaseatingirbons resultados ao realizar um experimento: Planejar o processo amostral e experimental. Obter inferncias sobre a populao. 14 Estabelecer nveis de incerteza envolvidos nessas inferncias Tcnicas de Amostragem

Anlise Descritiva

Inferncia Estatstica Populao caractersticas Amostra Informaes contidas nos dados Concluses sobre as caractersticas da populao 15 2.POPULAO E AMOSTRA Objetivos 1.Distinguir entre: Populao e amostra Parmetro e estatstica 2.Explicar porque o mtodo de seleo de uma amostra importante 3.Explicar as razes para o uso de amostras 4.Definir amostra aleatria 5.Selecionar uma amostra empregando a tabela de nmeros aleatrios Paraarealizaodeinfernciaestatsticaeimprescindveloconhecimentode doisconceitosbsicos:apopulaoeaamostra.apartirdelesquesoextradosos dadosquedoorigemaosclculosestatsticosequepermitemdescrev-lassob diferentes aspectos. 2.1.Populaoouuniverso:Consisteemtodooconjuntodeindivduos(pessoas, animaisoucoisas)queapresentamumaoumaiscaractersticasemcomum susceptveisdeseremobservadase/oudeterminadas.Porexemplo,pesodos habitantes de uma cidade. Cada habitante tem um peso. O conjunto de pesos de todososseushabitantesconstituiuma"populaodepesos".Emestatstica,a populao se refere a um conjunto de seres ou a um conjunto de observaes. Os valoresdescritivoseverdadeirosdapopulaosochamadosparmetros.Os valoresdosparmetrosdevemserestimadosapartirdosdadosdasamostras. Sosimbolizadosporcaracteresgregos:=mediadapopulao. =desvio padrodapopulao.Assim,apopulaodepesquisaumconjuntode indivduos delimitados por caractersticas como: 1. O conjunto das rendas de todos os habitantes de Rio Verde-GO; 2. O conjunto de todas as notas dos alunos de Estatstica; 3. O conjunto das alturas de todos os alunos da Universidade de Rio Verde; etc. Umlevantamentoefetuadosobretodaumapopulaoditodelevantamento censitrio ou simplesmente censo. 16 Fazerlevantamentos,estudos,pesquisas,sobretodaumapopulao(censo), em geral, muito difcil. Isto se deve a vrios fatores. O principal o custo. Um censo custa muitocaroedemandaumtempoconsidervelparaserrealizado.Assim,normalmente, se trabalha com partes da populao denominadas de amostras. Uma amostra pode ser caracterizada como: Uma poro ou parte de uma populao de interesse. 2.2.Amostra:umsubconjuntoselecionadodapopulaonaqualsepretende estudarsuascaractersticas,Apesquisabiomdicausualmenterealizadaem amostras. Os dados de observao registrados na amostra fornecem informaes sobreapopulao.Oprocessopeloqualsetiraconclusessobreapopulao, com base em resultados obtidos da amostra, chamado inferncia estatstica. Os valoresobtidosnaamostra,calculadosouestimados,sodenominados estatsticas.Aestatsticaumaestimativadovalorverdadeirodapopulao (parmetro).Assimamdiacalculadadaamostraeumaestatsticaecomotal, umaestimativadamdiaverdadeiradapopulao.Asestatsticasso simbolizadas por caracteres latinos. Oprocessopeloqualoparmetropopulacionalestimadopelaestatstica chamadoestimao,Emvirtudedavariaodentrodapopulao,diferentesamostras tiradasdeumamesmapopulaodiferemumasdasoutras.Porisso,combasenuma nicaamostra,possvelapenasestimarosatributosdepopulaes;oinvestigador jamais os conhecer exatamente os valores dos parmetros, a no ser que examine toda a populao. Uma estimao eficiente do parmetro requer uma estatstica no viciada. Vcio (vis, biased, tendenciosidade) um processo em qualquer sistematicamente dos valores verdadeiros. Naestimaodeparmetrospopulacionais,entreosmuitoscuidadosaserem observados, dois so de particular importncia. 3.Definirapopulaoaseramostrada:Aabrangnciadeumapopulao determinadapelascaractersticasdofenmeno estudado.Essadefiniodeveser criteriosa, caso contrario a amostra poder ser inadequada. s vezes essa definio relativamente fcil, por exemplo, a populao de trabalhadores que exercem suas atividadesemdeterminadafbrica.Maiscomplexaasituaoparaseestudar 17 diabticos que procuram postos de sade para fazer controle. 4.Utilizaramostrasrepresentativasdapopulao:Asamostrasdevempossuiras mesmascaractersticasbsicasdapopulao,noquedizrespeitoaofenmeno que se deseja estudar. Para atender a esse requisito, usam-se amostras aleatrias representativas da populao (v adiante). Procedendo-se dessa forma, elimina-se a tendenciosidade (vis) pessoal na constituio das amostras, eliminando a escolha intencionalparaacomprovaodecertahiptese.Noentanto,deveserlembrado queoprocessodeamostragem,mesmobemelaboradoeexecutado, trazemsia possibilidade do erro amostral devido variabilidade, por obra do acaso e ao fato de apenas parte da populao ser examinada. Utilizaramostrasparaseterconhecimentosobrepopulaesrealizado intensamentenaAgricultura,Poltica,Negcios,Marketing,Governo,etc.,comose podem ver plos seguintes exemplos: Antesdaeleiodiversosrgosdepesquisaeimprensaouvemumconjunto selecionadodeeleitoresparaterumaidiadodesempenhodosvrios candidatos nas futuras eleies. Umaempresametal-mecnicatomaumaamostradoprodutofabricadoem intervalosdetempoespecificadosparaverificarseoprocessoestsob controle e evitar a fabricao de itens defeituosos. OIBGEfazlevantamentosperidicossobreemprego,desemprego,inflao, etc. RedesderdioeTvseutilizamconstantementedosndicesdepopularidade dos programas para fixar valores da propaganda ou ento modificar ou eliminar programas com audincia insatisfatria. Bilogosmarcampssaros,peixes,etc.paratentarprevereestudarseus hbitos. Oprocessodeescolhadeumaamostradapopulaodenominadode amostragem. Os problemas de amostragem podem ser mais ou menos complexos, dependendo daspopulaesedasvariveisquesedesejaestudar.Naindstria,paraefeitode controledequalidade,asamostrassofreqentementeretiradasdosprodutose materiais.Nelaosproblemasdeamostragemsomaissimplesderesolver.Poroutro 18 lado, em pesquisas sociais, econmicas ou de opinio, a complexidade dos problemas de amostragemnormalmentebastantegrande.Emtaiscasos,deve-seterextremo cuidadoquantocaracterizaodapopulaoeaoprocessousadoparaselecionara amostra,afimdeevitarqueoselementosconstituamumconjuntocomcaractersticas fundamentalmente distintas das da populao. Em resumo, a obteno de solues adequadas para o problema de amostragem exige, em geral, muito bom senso e experincia. Alm disso, muitas vezes conveniente que o trabalho de elaborao do plano de amostragem seja baseado em informaes de um especialista do assunto em questo.Cuidadoespecialdevesertomadonasconclusesemsituaesemquea amostracoletadanosejaextradaexatamentedapopulaodeinteresse(populao alvo)esimdeumapopulaomaisacessvel,conveniente,nessecasochamadade populao amostrada. Veja os exemplos: 1) Suponha que um socilogo deseja entender os hbitos religiosos dos homens com 20 anos de idade em certo pas. Ele extrai uma amostra de homens com 20 anos de uma grande cidade para estudar. Neste caso, tem-se: Populao alvo homens com 20 anos do pas; Populao amostrada homens com 20 anos da cidade grande amostrada. Ento, ele pode fazer concluses vlidas apenas para os elementos da grande cidade (populao amostrada), mas pode usar o seu julgamento pessoal para extrapolarosresultadosobtidosparaapopulaoalvo,commuitacautelae certas reservas. 2)Umpesquisadoragrcolaestestudandoaproduodecertavariedadedetrigoemdeterminadoestado.Eletemasuadisposiocincofazendas espalhadaspeloestado,nasquaiselepodeplantartrigoeobservara produo.Apopulaoamostrada,nestecaso,consistedasproduesde trigo nas cinco fazendas, enquanto a populao alvo consiste das produes de trigo em todas as fazendas do estado. 2.3.Tcnicas de Amostragem Existemdoistiposdeamostragem:probabilsticaeno-probabilstica.A amostragemserprobabilsticasetodososelementosdapopulaotiverem probabilidade conhecida, e diferente de zero, de pertencer amostra.19 Casocontrrio,aamostragemserno-probabilstica.Umaamostragemno-probabilstica obtida quando o acesso a informaes no to simples ou os recursos forem limitados, assim o pesquisador faz uso de dados que esto mais a seu alcance, a chamada amostragem por convenincia. Porexemplo,podemosrealizarumestudoparaavaliaraqualidadedoservio prestadoporumaoperadoradetelefoniacelular.Casotenhamosrecursossuficientes, podemosrealizarumplanoamostralbastanteabrangentedetodaapopulaode usuriosdoservio.Issocaracterizaumaamostraprobabilstica.Masseporrestries oramentriasoudeoutraordemnoforpossvelobterumaamostratonumerosaou elasejadedifcilacesso,podemosrestringirnossaamostraaumapequenaregio delimitadadefcilacessoedecustoreduzido,usuriosdeumacidade,porexemplo. Essa uma amostragem no-probabilstica. Segundoessadefinio,aamostragemprobabilsticaimplicasorteiocomregras bem determinadas, cuja realizao s ser possvel se a populao for finita e totalmente acessvel. A utilizao de uma amostragem probabilstica a melhor recomendao que se deve fazer no sentido de garantir a representatividade da amostra, pois o acaso o nico responsvel por eventuais discrepncias entre populao e amostra. No caso em que a nicapossibilidadeousodeumaamostragemno-probabilstica,deve-setera conscincia de que as concluses apresentam alguma limitao. Aseguir,apresentamosalgumasdasprincipaistcnicasdeamostragem probabilstica. 2.3.1.Amostragem aleatria simples Esse tipo de amostragem, tambm chamada simples ao acaso, casual, elementar, randmicaetc.,equivalenteaumsorteiolotrico.Nela,todososelementosda populao tm igual probabilidade de pertencer amostra e todas as possveis amostras tm igual probabilidade de ocorrer. SendoNonmerodeelementosdapopulaoenonmerodeelementosda amostra, cada elemento da populao tem probabilidade n/N de pertencer amostra. A essarelaon/Ndenomina-sefraodeamostragem.Poroutrolado,sendoa amostragemfeitasemreposio,supomos,emgeral,queexistem Nn| | |\ possveis amostras, todas igualmente provveis. 20 Naprtica,aamostragemsimplesaoacasopodeserrealizadanumerando-sea populaode1aN,sorteando-se,aseguir,pormeiodeumdispositivoaleatrio qualquer, n nmeros dessa seqncia, os quais correspondem aos elementos sorteados para a amostra. 2.3.2. Amostragem sistemtica Quandooselementosdapopulaoseapresentamordenadosearetiradados elementos da amostra feita periodicamente, temos uma amostragem sistemtica. Assim,porexemplo,emumalinhadeproduo,podemos,acadadezitens produzidos, retirar um para pertencer a uma amostra da produo diria. Assim, teremos umaproduototaldeNitenseextrairemosumaamostradetamanhon,selecionando as unidades a cada dez itens. Para seleo do primeiro item, um nmero entre 1 e 10 sorteadoaleatoriamenteeosdemaissubseqentessoobtidossistematicamente.Por exemplo,asunidadessorteadaspoderoser8,18,28,38,48,eassimpordiante, repetindo-se o procedimento at o N-simo item. Denomina-se k = N/n como a razo de amostragem. No exemplo, portanto, k = 10.Aprincipalvantagemdaamostragemsistemticaestnagrandefacilidadena determinao dos elementos da amostra. O perigo em adot-la est na possibilidade da existnciadeciclosdevariaodavariveldeinteresse,especialmenteseoperodo dessescicloscoincidircomoperododeretiradadoselementosdaamostra.Poroutro lado, se a ordem dos elementos na populao no tiver qualquer relacionamento com a variveldeinteresse,entoaamostragemsistemticatemefeitosequivalentes amostragem casual simples, podendo ser utilizada sem restries. 2.3.3.Amostragem estratificada Muitasvezes,apopulaosedivideemsubpopulaesouestratos,sendo razovelsuporque,deestratoparaestrato,avariveldeinteresseapresenteum comportamentosubstancialmentediverso,tendo,entretanto,comportamento razoavelmentehomogneodentrodecadaestrato.Emtaiscasos,seosorteiodos elementosdaamostraforrealizadosemselevaremconsideraoaexistnciados estratos,podeacontecerqueosdiversosestratosnosejamconvenientemente representados na amostra, a qual seria mais influenciada pelas caractersticas da varivel nosestratosmaisfavorecidospelosorteio.Evidentemente,atendnciaocorrnciade 21 tal fato ser tanto maior quanto menor o tamanho da amostra. Para evitar isso, pode-se adotar uma amostragem estratificada. Constituemexemplosemqueumaamostragemestratificadapareceser recomendvel,aestratificaodeumacidadeembairros,quandosedesejainvestigar alguma varivel relacionada renda familiar; a estratificao de uma populao humana emhomensemulheres,ouporfaixasetrias;aestratificaodeumapopulaode estudantes conforme suas especificaes etc. 2.3.4.Amostragem por conglomerados Nestemtodo,emvezdaseleodeunidadesdapopulao,soselecionados conglomeradosdessasunidades.Essaumaalternativaparaquandonoexisteo cadastro das unidades amostrais. Se a unidade de interesse, por exemplo, for um aluno, podeserquenoexistaumcadastrodealunos,massimdeescolas.Portanto,podem serselecionadasescolasenelasinvestigartodososalunos.Essetipodeamostragem induz indiretamente aleatoriedade na seleo das unidades que formam a amostra e tem a grande vantagem de facilitar a coleta de dados. 2.3.5.Amostragem de convenincia (no-probabilstica) Aamostradeconveninciaformadaporelementosqueopesquisadorreuniu simplesmenteporquedispunhadeles.Ento,seoprofessortomarosalunosdesua classe como amostra de toda a escola, est usando uma amostra de convenincia. Os estatsticos tm muitas restries ao uso de amostras de convenincia. Mesmoassim,asamostrasdeconveninciasocomunsnareade sade,em quese fazem pesquisas com pacientes de uma s clnica ou de um s hospital. Mais ainda, as amostrasdeconveninciaconstituem,muitasvezes,anicamaneiradeestudar determinado problema. De qualquer forma, o pesquisador que utiliza amostras de convenincia precisa de muitosensocrtico.Osdadospodemsertendenciosos.Porexemplo,paraestimara probabilidade de morte por desidratao no se deve recorrer aos dados de um hospital. Comossointernadososcasos graves,possvelquea mortalidadeentrepacientes internadossejamaiordoqueentrepacientesno-internados.Conseqentemente,a amostradeconveninciaconstituda,nesseexemplo,porpacientesinternadosno hospital, seria tendenciosa. 22 Finalmente,opesquisadorquetrabalhacomamostrassemprepretendefazer inferncia, isto , estender os resultados da amostra para toda a populao. Ento muito importante caracterizar bem a amostra e estender os resultados obtidos na amostra apenas para a populao da qual a amostra proveio. Exemplos de planos amostrais: Exemplo1:UmaagnciadesegurostemN=100clientescomerciantes.Seu proprietriopretendeentrevistarumaamostrade10clientespara levantarpossibilidadesdemelhoranoatendimento.Escolhauma amostra aleatria simples de tamanho n = 10. Primeiro passo atribuir a cada cliente um nmero entre 1 e 100. Segundopassorecorreraumgeradordenmerosaleatriosde umaplanilhaeletrnicaparaselecionaraleatoriamente10nmeros de1a100.Osclientesidentificadospelosnmerosselecionados compem a amostra. Exemplo2:UmaoperadoradecelulartemumarquivocomN=5000fichasde usuriosdeumservioeselecionada,sistematicamente,uma amostra de n = 1 000 usurios. Nesse caso, a frao de amostragem igual a n/N = 1 000/5 000 e assim podemos definir k = 5 (N/n = 5 000/1000=5),ouseja,teremos5elementosnapopulaopara cada elemento selecionado na amostra. Na amostragem sistemtica, somenteopontodepartidasorteadodentreas5primeirasfichas do arquivo. Admitamos que foi sorteado o nmero 3, ento a amostra ser formada pelas fichas 3 , 8, 13 , 18, . . . , 4993, 4998. 23 3.VARIVEL a caracterstica que se deseja estudar de uma dada populao. Ex.: Cor dos olhos dos moradores da cidade de Rio Verde - GO, altura dos alunos da FESURV, resistncia muscular localizada para exerccios abdominais em obesos etc. 3.1. Classificao das variveis As variveis so classificadas segundo suas caractersticas particulares em quatro categorias.Taisclassificaesnososimplesmentedidticas,masassumempapel importante na estatstica, pois tero tratamentos diferentes como ser visto adiante. 3.2.Contnuas:soaquelasquepodemassumirqualquervalordentrodeum intervalodeinteresse.Osdadosadvindosdestetipodevarivelsoditos contnuos.Ex.:peso,estatura,distnciapercorridaemumtestedeesforoetc. Em geral esto associadas a medidas que tenham unidade (m, kg, l, m/s etc.) Exemplo 1: (varivel quantitativa contnua) Populao: moradores de uma determinada cidade. Varivel: estatura dos indivduos. 3.3.Discretas:soaquelasquespodemassumirvaloresinteirosdentrodeum intervalo de interesse. Os dados discretos so resultados da contagem do nmero deitensreferentevarivel.Ex.:nmeroderepetiesexecutadasemuma tarefa,nmerodefilhosdeumcasal,quantidadedeavesabatidasporum frigprfico, etc. Exemplo 2: (varivel quantitativa discreta) Populao: hospitais de uma determinada cidade. Varivel: nmero de leitos (0, 1, 2,...). 3.4.Nominais ou categricas: so aquelas que s podem assumir alguns estados oucategoriasegeralmentenosonumricas:Osdadosnominaissurgem quandosedefinemcategoriasesecontasuasobservaes.Ex.:Sexodeuma 24 populao(masculinoefeminino)queixasdedorlombar(simeno),cordos olhos de uma populao (azuis, castanhos, pretos, verdes) etc. Exemplo 3: (varivel qualitativa nominal) Populao: moradores de uma cidade. Varivel: cor dos olhos (pretos, castanhos, azuis e verdes). Exemplo 4: (varivel qualitativa ordinal) Populao: moradores de um condomnio. Varivel: grau de instruo (fundamental mdio e superior). 3.5.Ordinais:Soaquelasqueserelacionamaavaliaessubjetivassegundo prefernciaoudesempenho.Osdadosordinaisconstituemvaloresrelativos, atribudos para denotar ordem. Ex.: primeiro, segundo, terceiro, quarto, o melhor, o maior etc.

25 4.ESCALAS DE MENSURAO Existemquatroformasdemensuraooutiposounveisdemedidasouainda, escalas. Elas so conhecidas como nominal, ordinal, intervalar e razo. Nominal: Na classificao tenta-se separar conjuntos de elementos com respeito a certascategorias, tomando decisessobre quaiselementossomaisparecidos e quais so diferentes. Por exemplo: religio, sexo, estado civil. Ordinal:Onvelordinalonvelnominalondesepodeordenaras caractersticas ou categorias. A nica diferena entre os dois nveis a relao de ordem que se pode estabelecer entre as categorias. A avaliao atravs de conceitos feita por uma escala ordinal. Outros exemplos: classe social, nvel de instruo. Intervalar:Podeserutilizadaparasereferirassituaesemquesepode,no somenteordenarobjetoscomrespeitoaograuqueelespossuemcerta caracterstica,mastambmindicaraexatadistnciaentreeles.Aescalade medida intervalar uma escala nominal em que a distncia entre as categorias, aocontrriodaordinal,sempreamesma.Asescalasdemedirtemperatura como Celsius e Fahrenheit so exemplos de escalas de intervalo. No se pode afirmarqueumatemperaturade402vezesmaisquentequeumade20, pormadiferenaentre20e40a mesma queentre75e95.Isto ocorre, pois no existe zero absoluto, i, 0 no indica ausncia de calor e apenas um ponto de referncia. Escores padronizados so exemplos deste tipo de medida. Nvelderazo:omaisaltonveldemedida.Caracteriza-seporapresentar todasascaractersticasdonvelintervalarmaisumzeroabsoluto.Ozero absolutoaquientendidocomoausnciadacaractersticaeacomparaode valortemsentido.Porexemplo:Peso.0kgindicaausnciadepesoe20kg duas vezes mais pesado que 10 kg. 26 5.ANLISE EXPLORATRIA DE DADOS 5.1.Introduo Astcnicasestatsticasclssicasforamconcebidasparaseremasmelhores possveis, desde que se assuma um conjunto de pressupostos rgidos. Sabe-sequeessastcnicassecomportamdeficientementemedidaqueeste conjunto de pressupostos no satisfeito. AstcnicasdeAnliseExploratriadeDadoscontribuemparaaumentara eficcia da anlise estatstica, de forma fcil e rpida. Geralmente, devem ser aplicadas antes da formulao das hipteses estatsticas para identificar padres e caractersticas dos dados. Umaamostraumsubconjuntodeumapopulao,necessariamentefinito,pois todos os seus elementos so examinados para efeito da realizao do estudo estatstico desejado. intuitivo que, quanto maior a amostra, mais precisas e confiveis devem ser as induesrealizadassobreapopulao.Levandoesseraciocnioaoextremo, concluiramosqueosresultadosmaisperfeitosseriamobtidospeloexamecompletode todaapopulao,aoqualcostuma-sedenominarCensoouRecenseamento.Masessa concluso,naprtica,muitasvezesnoseverifica.Oempregodeamostraspodeser feito de tal modo que se obtenham resultados confiveis. Ocorre,emrealidade,quediversasrazeslevam,emgeral,necessidadede recorrer-se apenas aos elementos de uma amostra. Entre ela, podemos citar o custo do levantamentodedadoseotemponecessriopararealiz-lo,especialmentesea populao for muito grande. OobjetivodaEstatsticaDescritivaresumirasprincipaiscaractersticasdeum conjunto de dados por meio de tabelas, grficos e resumos numricos. A anlise estatstica deve ser extremamente cuidadosa ao escolher a forma adequada de resumirosdados.Apresentamosnatabelaaseguirumresumodosprocedimentosda Estatstica Descritiva. 27 Tabela 1: Principais tcnicas de estatstica descritiva Tabelas de FreqnciaApropriadapararesumirumgrandeconjunto dedados,agrupandoinformaesem categorias. As classes que compem a tabela podemsercategoriaspontuaisoupor intervalos. GrficosPossibilitaumavisualizaodasprincipais caractersticasdaamostra.Algunsexemplos degrficosso:diagramadebarras, diagramaemsetores,histograma,Box-plot, ramo-e-folhas, diagrama de disperso. Medidas DescritivasPormeiodemedidasouresumosnumricos podemoslevantarimportantesinformaes sobreoconjuntodedados,taiscomo:a tendnciacentral,variabilidade,simetria, valores extremos, valores discrepantes, etc. Um dos objetivos da Estatstica sintetizar os valores que uma ou mais variveis podemassumir,paraquetenhamosumavisoglobaldavariaodessaoudessas variveis.Issoseconsegue,inicialmente,apresentandoessesvaloresemtabelase grficos, que fornecem rpidas e seguras informaes a respeito das variveis. 5.2.Tabelas Uma tabela resume os dados por meio do uso de linhas e colunas, nas quais so inseridos os nmeros. Uma tabela compe-se de: Corpo conjunto de linhas e colunas que contm informaes sobre a varivel em estudo. Cabealho parte superior da tabela que especifica o contedo das colunas. Coluna Indicadora parte da tabela que especifica o contedo das linhas. Linhasretasimaginriasquefacilitamaleitura,nosentidohorizontal,de dados que se inscrevem nos seus cruzamentos com as colunas. Casas ou Clulas espao destinado a um s nmero. Ttuloconjuntodeinformaes(asmaiscompletaspossveis)localizadono topo da tabela. Existemainda,elementoscomplementaresqueso:afonte,asnotaseas chamadas, os quais devem ser colocados no rodap da tabela. As notas devem esclarecer aspectos relevantes do levantamento dos dados ou da apurao. As chamadas do esclarecimentos sobre os dados. Devem ser feitas de algarismos arbicos escritos entre parnteses, e colocados direita da coluna. 28 Exemplo: Tabela2:Populaobrasileiraresidente,com15anosemais,segundooestadoconjugal,de acordo com o censo demogrfico de 1980. Estado conjugalFreqnciaPercentual Solteiros125 146 484 34,18 Casados241 974 865 57,06 Separados1 816 046 2,47 Vivos 3 616 046 4,92 Sem declarao 1 005 234 1,37 Observao: Nas casas ou clulas devemos colocar: Umtraohorizontal(__) quandoovalorzero,nos quanto anaturezadascoisas, como quanto ao resultado do inqurito;Trs pontos ( ... ) quando no temos dados; Ponto de interrogao ( ? ) quando temos dvida quanto a exatido de um valor; Zero ( 0 ) quando o valor muito pequeno para ser expresso pela unidade utilizada. Estocomputados,como separados,osdesquitadoseos divorciados. 1Exclusiveaspessoassolteiras, vivendoemunioconsensual estvel. 2Inclusive4939528pessoas vivendoemunioconsensual estvel. 29 6. SRIES E GRFICOS ESTATSTICOS 6.1. Introduo Foiestabelecidoqueaetapafinaldomtodoestatsticoenvolveaanlisee interpretao de nmeros, obtidos na etapa de coleta de dados. O conjunto de nmeros provenientedacoletadedados,semqualquermanipulaonasuaformade apresentao, denominado dedados brutos. Nestaformadeapresentao,aindasemqualquertipodeprocessamento,a tentativa de anlise e interpretao de uma caracterstica, alm de extremamente rdua, podeconfundiraoinvsdeesclarecer,quandoseconsideranossalimitadacapacidade de lidar com um grande conjunto de dados. Surge ento a necessidade de organizao e reduo. Oprocessamentodosdadostorna-senecessrioparareduziraquantidadede detalhes, facilitando a identificao da essncia dos dados. Tanto os resumos visuais, utilizadosnoquedenominamosdeapresentaogrfica,quantoosresumos numricos, provenientes das tcnicas de apresentao tablar, proporcionam facilidades na identificao das caractersticas mais importantes dos dados. Estecaptulotemporobjetivoapresentarosprincipaisconceitosenvolvidosna apresentao de dados nas formas tabular e grfica. 6.1.1.Sries Estatsticas Toda tabela que apresenta a distribuio de um conjunto de dados estatsticos em relaopoca,localouespcie,denominadadesriesestatsticas.Emfunodos fatoresapontados,assriesnumricaspodemserclassificadasemquatrograndes classes: histricas, geogrficas, conjugadas e especficas. Nesta ltima classe, podemos enquadrarumtipoespecialderepresentaodedadosestatsticos:adistribuiode frquencias. 6.1.1.1. Sries Histricas, Cronolgicas, Temporais ou Marchas Descrevemosvaloresdavarivel,emdeterminadolocal,discri minados segundo intervalos de tempo vari veis. 30 Exemplo Efetivo de rebanhos bovinos (cabeas) Rio Verde-GO, 2004-2010 AnoCabeas (1.000) 2004325 2005343 2006320 2007375 2008390 2009412 2010400 Fonte: Seplan-GO 6.1.1.2. Sries Geogrficas, Espaciais, Territoriais ou de Localizao Descrevemosval oresdavarivel,emdeterminadoinstante, discriminados segundo regies. Exemplo Produo mundoal de soja, Safra 2010/2011 Pasrea Colhida (mil hectares) Participao % Estados Unidos 31.00630,2 Brasil 24.20023,5 Argentina 18.30017,8 ndia 9.4009,1 China 8.5208,3 Paraguai 2.8402,8 Canad 1.4771,4 Ucrnia 1.0371,0 Rssia 1.0361,0 Demais Pases (33) 5.0074,9 rea Colhida Total 102.823100,0 Fonte: IBGE 6.1.1.3. Sries Conjugadas e Tabela de Dupla Entrada Muitasvezestemosnecessidadedeapresentar,emumanicatabel a, avariaodevaloresdemaisdeumavari vel,isto,fazerumaconj ugao de duas ou mais sri es. Conj ugandoduassriesemumanicatabela,obtemosumatabel ade dupl aentrada.Emumatabeladesseti poficamcriadasduasordensde classificao: uma horizontal (linha) e uma vertical (coluna). 31 Exemplo: Terminais telefnicos em servio 1991-93 REGIES199119921993 Norte Nordeste Sudeste Sul Centro-Oeste 342.938 1.287.813 6.234.501 1.497.315 713.357 375.678 1.379.101 6.729.467 1.608.989 778.925 403.494 1486.649 7231.634 1.746.232 884.882 FONTE: Ministrio das Comunicaes 6.1.1.4. Sries Especficas ou Categricas Descrevemosvaloresdavarivel,emdeterminadotempoelocal,discriminados segundo especificaes ou categorias. Exemplo: Efetivo da pecuria do Estado de Gois EspciesCabeas Aves 55.156.362 Codornas243.150 Galinceos 54.913.212 Rebanho de Asininos6.084 Rebanho Bovino 21.347.881 Rebanho de Bubalinos 32.656 Rebanho de Caprinos 39.737 Rebanho de Equinos 428.367 Rebanho de Muares 42.530 Rebanho de Ovinos 201.173 Rebanho de Sunos 2.046.727 Rebanho de Vacas Ordenhadas 2.479.869 Fonte: SEPLAN-GO 32 6.2.Grficos Estatsticos Osgrficosconstituemumaformaclaraeobjetivadeapresentardados estatsticos.Aintenoadeproporcionaraosleitoresemgeralacompreensoea veracidade dos fatos. De acordo com a caracterstica da informao precisamos escolher o grfico correto. Os mais usuais so: grfico de segmentos, grfico de barras e grfico de setores 6.2.1.Grficosdelinhatilquandosedesejarepresentaraevoluodediversas variveisaolongodevriosmomentosdetempo.umgrficodeduas dimensesformadopordoiseixosperpendiculares.Emqueotempo representado no eixo horizontal X e os resultados das variveis no eixo vertical Y. Exemplo Uma locadora de filmes em DVD registrou o nmero de locaes no 1 semestre do ano de 2008. Os dados foram expressos em um grfico de segmentos 6.2.2.Grfico de colunas e grfico de barras apresentam os resultados por meio do desenho de diversas barras. Em que cada categoria da varivel em estudo associada a uma barra e o comprimento da barra diz respeito ao resultado indicado para a categoria. Podeserusadatambmemrepresentaesenvolvendodiversasvariveis. Acompanhadas em diversos momentos de tempo Os exemplos a seguir mostram o consumo de energia eltrica no decorrer do ano de 2005 de uma famlia 33 6.2.3. Grfico em setores (pizza) composto de um crculo repartido em n fatias. Com tamanhosproporcionaisocorrnciadavarivelnosresultadosdapesquisa. Representandoumcertoinstantenotempo.Sugere-sequesejaaplicadoemvariveis com no mximo 8 categorias. O grfico a seguir mostrar a preferncia dos clientes de uma locadora quanto ao gnero dos filmes locados durante a semana 6.2.4.Outros tipos de grficos6.2.4.1.Cartograma: Utilizado para representar mapas;6.2.4.2.Estereograma:6.2.4.3.Pictograma: Utilizado para Exemplos Cartograma

Pictograma Outros tipos de grficos Utilizado para representar mapas; tereograma: Utilizado para representar volume; : Utilizado para representar figuras CartogramaEstereograma

Fico22%Aventura19%Comdia25%Terror15%Guerra14%Outros5%34 35 7. DISTRIBUIO DE FREQNCIAS 7.1. Introduo Objetivos 1.Construirumatabeladefreqnciaqueincluaclasses,limitesdeclasse freqnciasimples,freqnciasrelativa,freqnciaacumuladaefreqncia acumulada relativa. 2.Interpretar uma tabela de freqncias. Parasetrabalharcomgrandesconjuntosdedadosnecessrioinicialmente agrupar estes dados. O agrupamento feito em tabelas, denominadas de distribuies defreqncias.Paraseconstruirumadistribuiodefreqnciascomumfazera distino entre dois tipos de variveis. A varivel (ou conjunto) discreta (valores que so resultados de contagem) e a varivel (ou conjunto) contnua (valores que so resultados deumamedida).Emgeralvariveisdiscretassoagrupadasemdistribuiespor ponto ou valores e variveis contnuas em distribuies por classes ou intervalos. Aseparaonorgidaedependebasicamentedosdadosconsiderados.Poderser necessriousarumadistribuioporclassesouintervalosmesmoquandoavarivel discreta. 7.2. Distribuies por ponto ou valores. Considere-seumconjuntodevaloresresultadosdeumacontagem.Poderiaser, por exemplo, o nmero de irmos dos alunos da turma U, disciplina de Estatstica. Nmero de irmos dos alunos da turma U - disciplina Estatstica 0116313110 4511102241 3121111556 41102143 22 1021123010 Esta coleo de valores no constitui informao, mas pode ser transformada em informaomediantesuarepresentaoemumadistribuiodefreqnciasporpontos ou valores. Para tal, colocase o conjunto em uma tabela em que a coluna da esquerda representadapelosdiferentesnmerosordenados(ospontosouvalores)ea colunada 36 direitapelonmerodevezesquecadavalorserepetiu(asfreqnciassimplesou absolutas). Para o exemplo, na tabela trs, tem-se: Tabela 03 - Distribuio de freqncias por ponto ou valores do nmero de irmos dos alunos da turma U. Disciplina Estatstica. Nmero de irmosNmero de alunos 07 121 28 35 44 53 62 50 7.3. Distribuies por classes ou intervalos Considere-se um conjunto de valores resultados de uma medida. Poderia ser, por exemplo, a idade dos alunos da turma U da disciplina de Estatstica. Idade (em meses) dos alunos da turma U - Disciplina Estatstica 230234276245345240270310368369 334268288336299236239355330247 287344300244303248251265246266 240320308299 312324289320264275 252298315255 274264263230303281 Este conjunto de valores, obviamente no pode ser apresentado da mesma forma queoanterior,poisquasenohrepeties.Nestecasonecessrioconstruiruma tabeladenominadadedistribuiodefreqnciasporclassesouintervalos. Evidentementehaverperdadeinformaonesteprocesso,masoganhoobtidopela facilidadecompreensodosdadoscompensa.Oprocedimentoparaconstruiresta distribuio envolve os seguintes passos (algoritmo): Determinar a amplitude dos dados: h = xmax - xmin. Decidir sobre o nmero de classes i a ser utilizado. Recomenda-se um nmero declassesentre5e15.Paraqueadecisonosejatotalmentearbitrria pode-se usar37 i , . +1 3 3 log n 1 3 3 log n 1 3 3 log n 1 3 3 log n ou i n Determinaraamplitudedecadaclasse.Sempre quepossvelmanter todasas amplitudesiguais.Paratantodeve-sedividiraamplitudedosdadoshpelo nmero de classes i, arredondando para mais, ou seja, ihhi . Contar o nmero de valores pertencentes a cada classe. Em geral, utiliza-se a simbologia(|---),paraindicarumintervalofechadoesquerdaeaberto direita. Tambm poderia ser utilizado o intervalo aberto esquerda e fechado direita (---|), aberto de ambos os lados ( --- ) ou ainda fechado de ambos os lados (|---|). Um exemplo de uma distribuio por classes ou intervalos apresentado na tabela 04. Tabela 04 - Idades dos alunos da turma U - Disciplina Estatstica. IdadesNmero de alunos 230 |---- 25012 250 |---- 2709 270 |---- 2908 290 |---- 3107 310 |---- 3306 330 |---- 3505 350 |---- 3703 Total50 7.4. Elementos de uma distribuio de freqncias 7.4.1. Classes So intervalos de variao da varivel.As classes so representadas simbolicamente por i, sendo i = 1, 2, 3, ..., k (onde k o nmero total de classes da distribuio). 7.4.2. limites de classe So os extremos de cada classe. Omenornmeroolimiteinferiordaclasse(li)eomaiornmero,olimite superior da classe (Li). 38 7.4.3. Amplitude de um intervalo de classe, ou, simplesmente, intervalo de classe a medida do intervalo que define a classe.Ela obtida pela diferena entre os limites superior e inferior dessa classe e indicada porhi. Assim: hi = Li - li 7.4.4. Amplitude total da distribuio (AT)adiferenaentreolimitesuperiordaltimaclasse(l imitesuperior mximo) e o limite inferior da primeira classe (limite inferior mni mo): AT = L(mx) l(mn) 7.4.5. Amplitude amostral (AA) a diferena entre o valor mximo e o valor mnimo da amostra: AA = x(mx) x(mn) 7.4.6. Ponto mdio de uma classe (xi)comooprprionomeindica,opontoquedi vi deointervalodeclasse em duas partes iguai s. Paraobtermosopontomdiodeumaclasse,calcul amosasemi-somados limites de da cl asse (mdia aritmtica): ( )i iil Lx+=2 7.4.7.Freqnciasimplesoufreqnciaabsolutaou,simplesmente, freqncia de uma classe ou de um valor individualonmerodeobservaescorrespondentesaessacl asseouaesse valor.Afreqnciasimplessimboli zadaporfi(lemos:fndiceiou freqncia da classe i). 7.5.Tipos de Freqncias 7.5.1.Freqncias simples ou absolutas (fi) So os valores que realmente representam o nmero de dados de cada classe. Como vimos, a soma das freqncias simpl es igual ao nmero total dos dados: 39 fi = n 7.5.2. Freqncias relativas (fri) So os valores das razes entre as freqncias simples e a freqnci a total: Como vimos, a soma das freqncias simpl es igual ao nmero total dos dados: iiffrn=7.5.3. Freqncia acumulada (Fi) o total das freqncias de todos os valores inferiores ao l imite superior do intervalo de uma dada cl asse: Fk = f1 + f2 + ... + fk ou Fk = fi (i = 1, 2, ..., k) 7.5.4. Freqncia acumulada relativa (Fri) de uma classe a freqncia acumulada da classe, di vidi da pel a f reqncia total da distribuio: iiFFrn=Exemplo: Na tabela 05, abaixo, esto ilustrados os clculos das freqncias relativas percentuais, da freqncia acumulada simples e da freqncia acumulada percentual. Tabela 05 - Exemplos de freqncias FifriFrifriFri 70,140,1414,014,0 280,420,5642,056,0 360,160,7216,072,0 410,10,8210,082,0 450,080,98,090,0 480,060,966,096,0 500,0414,0100,0 1,00100,0 40 7.6. Apresentao de uma distribuio de freqncias 7.6.1. Distribuio de freqncias por pontos ou valores. Umadistribuiodefreqnciasporpontosouvaloresapresentada graficamenteatravsdeumdiagramadelinhasoucolunas,ondeavarivelxi representadanoeixodasabcissas(horizontal)easfreqncias(quepodemserde qualquertipo)noeixodasordenadas(vertical).Veja-seumexemplodediagramade colunas simples na figura 01. Figura 01 - Diagrama de colunas simples da varivel "nmero de irmos dos alunos da turma U - Disciplina de Estatstica" 7.6.2. Distribuio de freqncias por classes ou intervalos Umadistribuiodefreqnciasporclassesouintervalosapresentada graficamente atravs de um diagrama denominado de histograma. Um histograma um grfico de retngulos justapostos onde a base de cada retngulo a amplitude de cada classe e a altura proporcional a freqncia (simples ou relativa) de modo que a rea de cadaretngulosejaigualafreqnciaconsiderada.Destaformaaalturadecada retngulo ser igual a: fi / hi ou ento fri / hi. Veja-se o clculo das alturas na tabela 06 e oexemplonafigura02.Tambmpodeserconstrudoumhistogramautilizando-seas freqncias acumuladas. Neste caso o diagrama resultante denominado de ogiva. Se os pontos mdios de cada classe de um histograma forem unidos atravs de segmentos de retas teremos ento um diagrama denominado de polgono de freqncias. 05101520251 2 3 4 5 6 741 7.7. Grficos de distribuies de frequncias Asdistribuiesdefreqnciasdeumavarivelcontnuasorepresentadas graficamenteporhistogramasdefreqncias,polgonosdefreqnciasepolgonosde freqnciasacumuladas.Empregandoatabelaabaixocomoexemplosero confeccionados os grficos correspondentes. Tabela 4.6 Notas dos alunos da Disciplina de Gentica do Curso de Medicina 1978 Notas ifiF0 222 2 479 4 61120 6 81030 8 10535 35 Fonte: dados fictcios 7.7.1. Histograma de frequncias Ohistograma formadoporumconjuntode retngulos justapostos, cujasbases selocalizamsobreoeixohorizontal(eixox),ondesorepresentadososintervalosde classenumaescalacontnua,nosendonecessrioqueaescalainiciedezero.As freqncias so representadas no eixovertical (eixo y) comeando dezero. As larguras dosretngulossoiguaissamplitudesdosintervalosdeclasse.Asalturasdos retngulos devem ser proporcionais s freqncias, absoluta ou relativa, das classes. AdistribuiodaTabela4.6denotasdosalunosdocursode Gentica correspondeao histograma da Figura 4.5. Figura 4.5 Histograma 42 Fonte: dados fictcios Notas: 1.Ohistogramagozadeumapropriedadedeconsidervelutilidade:areadeum histograma proporcional soma das freqncias. 2.Ao empregar as freqncias relativas obtm-se um grfico de rea unitria. 3.Paracompararduasdistribuies,oidealfaz-lopelohistogramadefreqncias percentuais. 4.Nas distribuies contnuas com classes de intervalos diferentes necessrio o ajuste dasfreqnciasparaqueafigurageomtricasejaproporcionalfreqnciade ocorrncia da varivel. 7.7.2.Polgono de frequncia Opolgonodefreqnciaumgrficoemlinhadeumadistribuiode freqncias.Asfreqnciassomarcadassobreperpendicularesaoeixohorizontal, levantadas plos pontos mdios dos intervalos de classe. Pararealmenteobterumpolgono(linhafechada),deve-secompletarafigura, ligandoosextremosdalinhaobtidaaospontosmdiosdaclasseanteriorprimeirae posterior ltima, da distribuio. Para a distribuio da Tabela de notas dos alunos do curso de Gentica (Tabela 4.6) corresponde o polgono de freqncia a seguir: Figura 4.6 - Polgono de frequncias12 0246810121Frequncia24 68 10 43 Fonte: dados fictcios 7.7.3. Polgono de frequncia acumulada Opolgonodefreqnciaacumuladatraadomarcando-seasfreqncias acumuladassobreperpendicularesaoeixohorizontalclevantadasnospontos correspondentes aos limites superiores dos intervalos de classe. Assim a distribuio da Tabela 4.6 corresponde ao polgono de freqncia acumulada a seguir: Figura 4.9 Polgono de freqncias acumuladas Fonte: dados fictcios 0246810120---2 2---4 4---6 6---8 8---10Frequncia05101520253035400---2 2---4 4---6 6---8 8---10Frequncia44 Arepresentaogrficadeumadistribuiodefreqnciassemintervalosde classe ser dada por um diagrama onde cada valor da varivel ser representada por um segmento da rela vertical e de comprimento proporcional respectiva freqncia. 7.7.4. Grfico stem-and-leaf (tronco e folhas) Ogrficostem-and-leaf(troncoefolhas)(Tukey1977)semelhanteaum histogramadeitado,commaiorquantidadedeinformaes.Umgrficostem-and-leaf bemconstrudoinformaaamplitudedasriededados,mostraalocalizaodamaior densidade de dados e revela a presena ou ausncia de simetria. A vantagem do grfico stem-and-leafsobreohistogramaapreservaodasinformaescontidasemcada dado.Essasinformaessoperdidasquandoosdadossoreunidosemumintervalo de classe. Paraconstruirumgrficostem-and-leafcadadadodivididoemduaspartes.A primeira parte denominada stem (tronco) e a segunda chamada leaf (folha). O stem consiste de um ou mais dgitos iniciais do dado e a Jeaf composta de um ou mais dos dgitosrestantes.Todososnmerossodispostosemumnicogrfico;ostroncos formam uma coluna ordenada com o menor valor no topo e o maior na base. As linhas do grficocontmasfolhas,ordenadasclistadasadireitadeseusrespectivostroncos (stem).Decimais,quandopresentesnosdadosoriginais,soomitidosnogrficostem-and-leaf. O tronco separado das suas folhas por uma linha vertical. Osgrficosstem-and-leafsomaisefetivoscomconjuntosdedados relativamente pequenos. No so recomendveis para um grande nmero de dados. So de grande valor para subsidiar investigadores nas tomadas de deciso sobre a natureza dosdados.Paradocumentosdecirculaoexterna,oshistogramassomais apropriados. Como exemplo empregam-se os dados da tabela a seguir: 1737495976 1738506379 1938516479 2239516579 2341516782 2542536783 2843566885 2945566885 3047576886 3447586986 3448597487 3449597589 Fonte: dados fictcios 45 Como todos os dados so constituidos de dois digitos, o primeiro ser o tronco e o segundo a folha: Tronco (Stem) Folha(Leaf) 1779 223589 304447889 4123477899 5011136678999 6344578889 7456999 823556679 Fonte: dados fictcios 46 8. MEDIDAS DE POSIO As medidas de posio, tambm conhecidas como medidas de tendncia central, indicamosvaloresemtornodoquaisocorreamaiorconcentraodofenmeno quantitativo em estudo. A mdia aritmtica, a moda e a mediana so as trs medidas de tendnciacentraloupromdiosmaisutilizadosparadescreveroconjuntodevalores representativos do fenmeno que se deseja estudar. Outros promdios menos utilizados so a mdia geomtrica, harmnica, quadrtica, cbica e biquadrtica. Essas ltimas no sero descritas nesse trabalho. 8.1. Mdia aritmtica Amdiaaritmticaomaissimplesdosvaloresdescritivosdeumaamostra.A mdia da amostra uma estatstica representada pelo smboloX (x barra). 8.1.1. Mdia nas sries de dados no agrupados a mdia aritmtica dos dados de observaes da amostra: ixXn=Avarivelrepresentadaporxi,sendoxiovalornumricodaprimeira observao, x2 o da seguinte, e assim por diante, at i = n, isto , xn sendo n o nmero totaldeobservaesdaamostra.O(letragregasigma)significa"notaode somatrio".xi, a soma de todas as observaes xi. Portanto, a mdia a soma dos -valores de todas as observaes da amostra, dividida pelo nmero (n) de valores. Exemplo 5.1 A determinao de glicose plasmtica em 9 indivduos forneceu os seguintes resultados (em mg/dL): 90, 86, 78, 90, 98, 90, 82, 76 e 84 Calcular a mdia. dL mg x / 86984 76 82 90 98 90 78 89 90=+ + + + + + + +=A mdia amostrai,X uma medida descritiva de uma amostra e uma estimativa da mdia da populao, simbolizada pela letra grega,(mu). Ou seja. uma medida descritiva da populao (parmetro populacional). 47 8.1.2. Mdia nas sries de dados agrupados sem intervalo de classe Nessecaso,comoasfreqnciassonmerosindicadoresdaintensidadede cada valor da varivel, elas funcionam como fatores de ponderao, o que leva a calcular a mdia aritmtica ponderada, dada pela frmula: i ix fXn= Onde: xi= valor varivelif = Freqncia Exemplo 5.2 Considerando-se a distribuio relativa a 40 requisies mdicas encaminhadas a umlaboratrioclnico,toma-separavarivelonmerodeexamessolicitadoscmcada requisio (ver tabela abaixo). Ummodoprticodeobtenodamediaponderadaabrir,natabela,umacoluna correspondente aos produtos xifi, assim: xifixifi 2816 32339 4936 5630 6318 717 =40= 146 Clculo: i iix fX , examesf= = =1463 6540 48 8.1.3. Mdia nas sries de dados agrupados com intervalos de classes Nessecaso,utiliza-seoponto mdiodecadaclassecomoumaaproximaode todososvalorescontidosnaclasse.Determina-seamdiaaritmticapormeioda frmula: i iix fXf= Onde:xifi = o somatrio dos produtos de cada ponto mdio de classe (xi) pela respectiva freqncia (fi) fi = o nmero total de observaes Exemplo 5.3 Para o exemplo da determinao do colesterol em uma amostra controle (v. Cap. 3),abre-seumacolunaparaosprodutosmdiosdasclassescoutraparaosprodutos xi,fi: iConcentrao ifxixifi 11541584156624 2158162121601920 3162166141642296 4166170101681680 517017471721204 61741783176528 =50 = 8252 Clculo: i iix fX mg / dLf= = =825216550 Nota: Amdiaaritmticadedadosagrupadosemclassesnopodesercalculada quando a primeira e a ltima classe apresentam extremos indefinidos indefinidos. 8.2. Moda (Mo) Amoda(Mo)(ounorma)ovalorqueocorrecommaiorfreqnciaemum conjuntodevalores.umamedidadedominncia.Noafetadaporvalores 49 extremos.Paraoconjuntodedadosdoexemplo5.1:76,78,82,84,86,90,90, 90, 98 a moda 90. Pode-se deparar com conjunto de dados, onde nenhum valor repetido e, portanto, no existe moda. Essa uma distribuio amodal. Ex.: a serie 3,5,8,10,12,13. Em outro casos, pode haver mais de um valor repetido. Diz-se distribuio plurimodal. Na serie: 2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9, temos duas modas: 4 e 7 (distribuio bimodal). 8.2.1. Moda nas sries de dados agrupados sem intervalos de classes Nesses casos a moda o elemento que apresenta a maior freqncia: xi234567 if8139631 No Exemplo supra-citado o elemento que apresenta a maior freqncia (13) o 3. Portanto ,a moda 3. 8.2.2. Moda nas series de dados com intervalos de classe Aclassequeapresentaamaiorfreqnciaechamadaclassemodal.Amoda, nessecaso,eovalordominantecompreendidoentreoslimitesdaclassemodal.O processo mais comum para o clculo da moda emprega a frmula de Czuber: * . * .2 11h Mo + + = * = o limite inferior da classe que contm a moda 1=diferenaentreafreqnciadaclassemodaleafreqnciadaclasse imediatamente inferior. 2 = diferena entre a freqncia da classe modal e freqncia da classe imediatamente posterior. h* = a amplitude da classe que contem a moda. Exemplo 5.4 Assim para a distribuio: 50 iConcentrao if1154 1584 2158 16212 3162 16614 4166 17010 5170 1747 6174 1783 Identifica-se a classe modal, ou seja, aquele que possuir maior freqncia. No caso trata-se da 3 classe: 162166. A seguir aplica-se a frmula: * . * .2 11h Mo + + = Onde: * = 162 1 = 14 - 12 = 2 2 = 14 - 10 = 4 Portanto: 162 22 4 4 2X46 162 86 162 1,33 163, 33 8.3. Mediana (Md) A mediana (Md) ovalor que ocupa a posio central quando todos os itens do grupoestodisposto,emtermosdevalor,emordemcrescenteoudecrescentede magnitude.Noafetadaporvaloresextremoseindicadaquandoexistemvalores discrepantes. Para o exemplo 5.1 dos valores da determinao da glicose (76, 78, 82, 84, 86, 90, 90, 90, 98) a Md 86. Quando o numero de observao for par deve-se somar os dois nmeros centrais e dividir por dois. 8.3.1. Medianas nas series de dados sem intervalos de classe Nesse caso, o bastante independente identificar a freqncia acumulada que imediatamente superior metade da soma das freqncias. A mediana ser aquele valor da varivel que corresponde a tal freqncia acumulada. Exemplo 5.5 Tome-se a distribuio relativa tabela dos dados agrupados, completando-a com acolunacorrespondentefreqnciaacumulada.Noexemplodonmerodeexames solicitados por requisio mdica, tem-se: 51 Nmeros de exames ifiF288 31321 4930 5636 6339 7140 = 40 Sendo: 2402 20 A menor freqncia acumulada que supera esse valor 21, que corresponde ao valor 3 da varivel, sendo esse o valor mediano logo: Md = 3 exames 8.3.2. Mediana nas sries de dados com intervalos de classe Inicialmente determina-se a classe em que est compreendida a mediana (classe mediana).Talclasseevidentemente,aquelacorrespondentefreqnciaacumulada imediatamente superior a fi/2. Procedendodessemodo,umproblemadeinterpolaoresolveaquesto. Admitindo-se, agora, que os valores se distribuam uniformemente em todo o intervalo de classe. Para o clculo so realizados os seguintes passos: 1 Determinar as freqncias acumuladas. 2 Calcular fi/2. 3Marcaraclassecorrespondentefreqnciaacumuladaimediatamentesuperiora fi/2.- classe mediana e, em seguida, empregar a frmula: Md f2F ant . hf Na qual: * = o limite inferior da classe que contm a mediana F(ant)=afreqnciaacumuladadaclasseanterioraclassequecontma mediana. f* = a freqncia simples da classe que contm a mediana. 52 h* = a amplitude do intervalo da classe que contm a mediana. Exemplo: 5.6 Considerandoadistribuiodatabeladeconcentraodecolesterolemuma amostra controle, acrescida das freqncias acumuladas: 2502 25 Logo, a classe mediana a ordem 3. Ento: * = 162: F (ant) = 16: f* = 14 e h* = 4 Substituindo esses valores na frmula, obtm-se: Md = 162 +. 162 162 2,57 164,57/ dL 8.4. Medidas de ordenamento e posio Deummodogeral,existemtrsgrandesgruposdemedidasdeordenamento: quartis, decis e percents. 8.4.1.Quartis Quartissoosvaloresquesubdividemumadistribuiodemedidasquanto dispostasemtermosdevaloresemordemcrescenteoudecrescente,emquatropartes iguais, H portanto, trs quartis. Primeiro quartil (Q1) e o primeiro da srie tal quem um quarto dos dados est abaixo dele (25%) e as trs quartas partes restantes (75%) esto acima dele. Para encontrar o Q1 emprega-se: 14 Segundoquartil(Q2)evidentemente,coincidente.Comamediana(Q2 = Md). O Q2 obtido: 2 14 12 iConcentrao ifF 1154 15844 2158 1621216 3162 1661430 classe mediana 4166 1701040 5170 174747 6174 178350 = 50 53 Terceiroquartil(Q3),onmerodasrietalquetrsquartosdosdados estoabaixodele(75%)eumaquartaparte(25%),estoacimadele, Calcula-se: 3 14 Para determinar o primeiro quartil de dados agrupados em classes, emprega-se a expresso: Q f4F ant . hf Exemplo 5.7 Nas duas equaes acima, F(ant) a freqncia acumulada da classe anterior a classe do quartil a ser calculado. Primeiro quartil (K = 1): 4504 12.5 Aplicando a frmula: 158 , 158 , 158 2,8 160,8 mg/ dL Terceiro quartil (k = 3): 343 X 504 37.5 Aplicando a frmula: 166 , 166 166 3 169 mg/ dL 8.4.2. Centil ou Percentil Concentrao ifF 154 15844 158 1621216 Q1 162 1661430 166 1701040 Q3 170 174747 174 178350 = 50 54 Os centis ou percentis so os noventa e nove valores que separam uma srie de 100 partes iguais: P1, P2, ..., P42,..., P99 evidente que: P50 = Md; P25 = Q1 e P75 = Q3 O clculo de um percentil segue a mesma tcnica do clculo da mediana, porm, a frmula obedece a ordem do percentil. Exemplo 5.8 Para a tabela anterior tm-se para o 12 percentil (k = 12): tem-se: P 12f100F ant . hf Considerando a tabela acima tem-se para o dcimo segundo percentil 1210012 X 50100 6 Logo: 8.5. Que promdio usar? Comumpoucodeexperincia,facilmentedeterminadaqualdasmedidasde tendnciacentraldeveserparacadasituao.Amdiaaritmticadelongeamais usada. Em geral, so usadas a moda para os dados nominais, a mediana para os dados ordinais e a mdia para os dados intervalares ou de razo. 55 9. MEDIDAS DE DISPERSO Objetivos 1.Calcularasmedidasdevarincia,desviopadro,coeficientedevariao, amplitude e amplitude entre quartis de dados simples e agrupados. 2.Listaralgunsusosdasmedianasdevariao:variao,desviopadro, amplitude e amplitude entre quartis. 3.Comparar diferentes dados de um paciente de variao. 4.Interpretar o grfico Box-and-Whisker Plot. Adispersoouvariabilidaderepresentaumdosmaisimportantesgruposde medidasdaestatstica.Paraoconhecimentoplenoeadequadodeumasrieouuma distribuio de freqncias. necessrio determinar no apenas determinar no apenas aposiocentraldosvalores,atravsdasmedidasdeposio,mastambmpreciso conhecer o real grau de disperso dos valores em questo. Asmedidasdedispersoindicamograudeafastamentodeumconjuntode nmero em relao sua mdia. 9.1 Varincia Asmedidasdetendnciacentralsoinsuficientesparadescrever adequadamente uma amostra. necessrio tambm descrever em que medida os dados deobservaoestoaoredordamdia.Avariaomediadispersodosdadosde observaes de uma amostra em relao respectiva mdia. A varincia amostral, simbolizada por s2, calculada pela frmula: 1 Em quexisoasobservaesdaamostraen onmero totaldeobservaes. Em termos,a varincia a soma dos quadrados dos desvios em relao mdia, dividida pelo nmero das observaes da amostra menos uma. 56 Exemplo 6.1 Empregando os dados do exemplo 5.1 cuja mdia () = 86 mg/ dL xx - (x - )2 9090 86 =4(4)2 = 16 86 86 = 0(0)2 = 0 7878 86 = -8(-8)2 = 64 9090 86 = 4(4)2 = 16 9898 86 = 12(12)2 = 144 9090 86 = 4(-4)2 = 16 8282 86 = -4(-4)2 = 16 7676 86 = -10(-10)2 = 100 8484 86 = -2(-2)2 = 4 0376 Aplicando-se a frmula, a varincia amostral calculada: 3769 1 47 Avarincias2,comoestatsticacalculadadaamostra,umaestimativano-viciadadavarinciapopulacionalumvalorfixorepresentadopor2(sigmaao quadrado). O denominador n-1 chamado graus de liberdade (GL). O uso de n em lugar de nlcomodenominadornoclculodavarinciaamostralobter-se-iaumvalor denominador da varincia amostral obter-se-ia um valor menor do que o verdadeiro valor doparmetropopulacional(2).Asituaocorrigidareduzindoodenominadorpela subtrao de uma unidade. AVarinciaamostralpodetambmsercalculadaporumafrmula particularmente bem adaptada para o emprego de calculadoras: 1 O termo a soma dos quadrados das observaes individuais da amostra e (xi)2 /n de correo, FC. 57 Exemplo 6.2 Aplicando esta equao ao exemplo anterior: xx2 908100 867396 786084 908100 989604 908100 826724 765776 847056 77466940 1 66940 77499 1 66940 665468 47 9.2. Desvio padro Odesviopadroamaisimportantemedidadedispersodosvalores individuaisaoredordamdia.Apresentaavantagemsobreavarinciadeutilizar mesmaunidadedemedidadedados(kg,cmetc.)queasempregadasnatomadadas observaes. representado por s. 9.2.1. Desvio padro nas sries de dados no agrupados clculos pela frmula: xx 1 x 1 O desvio padro e, portanto, a raiz quadrada da varincia. 58 Exemplo 6.3 = 6,85 mg/dL O desvio padro da amostra uma estimativa do valor paramtrico (sigma), o desvio padro verdadeiro da populao. Paraosdadosdemedio,especialmenteemgrandesamostras.Odesvio padroindicaoslimitesprovveisdentrodoquaissesituamcertasproporesdas observaes.Assimverifica-sequecercade68%dasobservaesdaamostraestar entre os limites 2s; e 99% das obrigaes entre 3s. 9.2.1.1.Desviopadronassriesdedadosagrupadossemintervalode classe Nessecasoemprega-seopontomdiodecadaclasseparaapresentaras medidasincludasnaquelaclasse.Deve-selevaremconsiderao,tambm,as freqncias de cada classe aplicando-se a frmula: 22|||

\| =n x fnx fsi iii Exemplo 6.4 Considerando a tabela de distribuio de freqncia sem intervalos de classe do exemplo dos exames solicitados por requisio mdica. O modo mais prtico para a obteno do desvio padro abrir, na tabela dada, uma coluna para os produtos f,x,, e outra para fix12 lembrando que para obter fiXi2 basta multiplicar cada fiXi2 pelo seu respectivo Xi. Assim: 59 xififixifi 281632 31339117 4936144 5630150 6318108 71749 = 40 = 146 = 600 Logo: 6004015640 15 21316160015 13,32 1,68 1,29 9.2.1.2Desviopadronassriesdedadosagrupadoscomintervalosde classe Para os dados grupados com intervalo de classe, emprega-se a mesma frmula acima descrita. Exemplo 6.5 Utilizandocomoexemploadistribuiodadeterminaodaconcentraode colesterolemumaamostracontrole,abrirascolunasparaxi(pontomdio),parafixie para fixi2. Assim: IConcentraofixifixifixi2 1154158415662497344 21581621216019203076544 3162166141642296376544 4166170101681680282240 517017471721204207088 6174178317652892928 = 50 = 8252 = 136344 Clculo: 13634450825250 27266,9 27238,2 28,68 5.355 60 9.3. Coeficiente de variao O coeficiente de variao (CV) a magnitude relativa do desvio padro expresso emporcentagemdamdia.umaestatsticausadaquandosedesejacomparara variabilidaderelativaemdiferentestiposdedados,inclusivedadosmedidosem diferentes unidades de medio. Ocoeficientedevariaoindependedaunidadedemedioempregado.Isto permiteacomparaodevriostiposdedados,taiscomo.pressoarterialcom temperatura. CV s x 100x Exemplo 6.6 Para o exemplo da secesanteriores cujos dados so: 90, 86,78, 90, 98, 90, 82, 76, 84 com mdia de 86, tem-se: CV 6,85 x 10086 7,96% 9.4. Amplitude Aamplitudeamaissimpleseprecriamedidadevariabilidade,isto,a diferena entre o valor mais alto (H) e o valor mais baixo (L) de uma srie.. A = H - L Para o exemplo 6.6 tem-se: 98 - 76 = 22 mg/dL Oinconvenientedaamplitudedependerdosvaloresextremos,no considerandoosvaloresintermedirios.Portanto,aamplitudenoinfluenciadapela disperso dos demais valores entre o escore mximo e o escore mnimo. 9.5. Amplitude entre quartis adiferenaentreovalordoterceiroquartil(Q3)eovalordoprimeiroquartil (Q1);compreendeos50%dosdadoscentraisdasrieemdistribuiessimtricas. menos afetado plos valores extremos do que a amplitude, tornando-se uma medida de grandeutilidade.Medidasdedispersobaseadasnosquartissovlidasparadados ordinais, intervalares ou de razo. AEQ = Q3 Q1 61 ValoreselevadosdeAEQindicamgrandevariabilidadedos50%dosdados relevantes, enquanto valores reduzidos indicam pequena variabilidade entre as mesmas observaes. Como esses valores muitas vezes parecem vagos, foi proposta uma razo interquartilcomtodaasriededadosanalisada.ArazoobtidaporAEQ/A(amplitude entrequartis/amplitude)multiplicadapor100.Ouseja,100(AEQ/R)relataa percentagem da AEQ em relao a amplitude total. Ex.: um valor da razo de 34% indica que a AEQ corresponde a 34% da amplitude (de toda a srie de dados). 9.6. Box-and-Whisker plots Um dispositivo visual til para a comunicao de caractersticas de uma srie de dadosogrficotipohox-and-whiskerplot.Aconstruodogrficoutilizaoprimeiro quartil (Q1) e o terceiro quartil (Q3) obtidos a partir da srie de dados. Para a construo devem ser observados os seguintes ifens: 1.A varivel de interesse representada no eixo horizontal; 2.Desenhar uma caixa no espao acima do eixo horizonlal, de tal modo que o lado esquerdo fique alinhado com o primeiro quartil (Q1) e o lado direito fique alinhado com o terceiro quartil (Q3). 3.Dividir a caixa em duas partes por um trao vertical que corresponde ao valor da mediana. 4.Traar uma linha horizontal (whisker) a partir do lado esquerdo da caixa ate o ponto que alinha com o menor valor contido na srie de dados. 5.Traarumalinhahorizontal(whisker)apartirdoladodireitodacaixaato ponto que alinha com o maior valor contido na srie de dados. 62 Vocabulrio AmplitudeGraus de liberdade Amplitude entre quartisBox-and-whisker Plots Coeficiente de variaoVarincia Desvio padro Exerccios 6.1. Encontrar a mdia, mediana, varincia e desvio padro para os seguintes dados: 9, 6, 2, 6, 3, 4, 7, 4. 6.2. Calcular a mdia, mediana e desvio padro para os seguintes dados: 2, 3; 2,7; 3,4; 3,2; 1,9; 4,1; 3,7; 2,2; 1,8; 2,7; 3,0. 6.3. Todas as seguintes medidas so de disperso, EXCETO A.Varincia; B.Amplitude; C.Moda; D.Desvio padro; E.Coeficiente de variao. 63 6.4.Oclculodavarinciadaalturaemcentmetrosdeestudantesdedeterminada escola dado em: A. B.CentmetrosC.(centmetros)2 D.Sem unidade E.Nenhuma das respostas 6.5 O seguinte polgono de freqncia acumulado foi obtido de batimentos cardacos de 1.000 estudantes: Qual dos seguintes falsa? A.a amplitude da distribuio 60 a 100 batimentos por minuto B.a moda da distribuio c100 batimentos por minuto C.a mediana da distribuio 77 batimentos por minuto D.92% dos valores so menores que 90 batimentos por minuto E.95% dos valores so maiores que 65 batimentos por minuto 64 EXERCCIOSDIVERSODS 1.Populao ou universo : a)Um conjunto de pessoas; b)Um conjunto de elementos quaisquer c)Um conjunto de pessoas com uma caracterstica comum; d)Um conjunto de elementos com pelo menos uma caracterstica em comum; e)Um conjunto de indivduo de um mesmo municpio, estado oupas. 2.Uma parte da populao retirada para analis-la denomina-se: a)Universo; b)Parte; c)Pedao; d)Dados Brutos; e)Amostra. 3.Apartedaestatsticaquesepreocupasomentecomadescriodedeterminadas caractersticas de um grupo, sem tirar concluses sobre um grupo maior denomina-se: a)Estatstica de Populao; b)Estatstica de Amostra; c)Estatstica Inferencial d)Estatstica Descritiva; e)Estatstica Grupal. 4.Uma srie estatstica denominada Temporal quando? a)O elemento varivel o tempo; b)O elemento varivel o local; c)O elemento varivel a espcie; d) o resultado da combinao de sries estatsticas de tipos diferentes; e)Os dados so agrupados em subintervalos do intervalo observado. 5.Suponhaqueumapesquisadeopiniopblicadeveserrealizadaemumestado quetemduasgrandescidadeseumazonarural.Oselementosnapopulaode interesse so todos os homens e mulheres do estado com idade acima de 21 anos.Que tipo de amostragem voc sugeriria?. Amostragem Estratificada 6.Ummdicoestinteressadoemobterinformaosobreonmeromdiodevezes em que 15.000 especialistas prescreveram certa droga no ano anterior (N = 15.000).Deseja-se obter uma amostra n = 1.600.Que tipo de amostragem voc sugeriria e por que? Amostragem A Sistemtica 7.De acordo com as normas para representao tabular de dados, quando o valor de um dado muito pequeno, para ser expresso com o nmero de casa decimais utilizadas ou com a unidade de medida utilizada, deve-se colocar na clula correspondente. a)Zero (0); b)Trs pontos (...); c)Um trao horizontal (-) d)Um ponto de interrogao (?); e)Um ponto de exclamao (!). 65 8.Assinale a afirmativa verdadeira: a)Um grfico de barras ou colunas aquele em que os retngulos que o compem esto dispostos horizontalmente. b)Um grfico de barras ou colunas aquele em que os retngulos que o compem esto dispostos verticalmente. c)Um grfico de barras aquele em que os retngulos que o compem esto dispostos verticalmente e um grfico de colunas, horizontalmente. d)Um grfico de barras aquele em que os retngulos que o compem esto dispostos horizontalmente e um grfico de colunas, verticalmente. e)Todas as alternativa anteriores so falsas. 9.Um dado foi lanado 50 vezes e foram registrados os seguintes resultados 5 4 6 1 2 5 3 1 3 3 4 4 1 5 5 6 1 2 5 1 3 4 5 1 1 6 6 2 1 1 4 4 4 3 4 3 2 2 2 3 6 6 3 2 4 2 6 6 2 1 Construa uma distribuio de freqncia sem intervalo de classe e determine: a.A amplitude Total (n)a)5 b)6 c)7 d)10 e)50 b.A freqncia total f)5 g)6 h)7 i)10 j)50 c.A freqncia simples absoluta do primeiro elemento: k)10% l)20% m) 1 n)10 o)20 d.A freqncia simples relativa do primeiro elemento: p)10% q)20% r)1 s)10 t)20 e.A freqncia acumulada do primeiro elemento: u)10% 66 v)20% w) 1 x)10 y)20 f.A freqncia acumulada relativa do primeiro elemento: z)10% aa)20% bb)1 cc)10 dd)20 g.A freqncia simples absoluta do segundo elemento: ee)19 ff)9 gg)2 hh)38% ii)18% h.A freqncia simples relativa do quinto elemento: jj)12% kk)84% ll)5 mm)6 nn)42 i.A freqncia acumulada relativa do sexto elemento: oo)50 pp)8 qq)6 rr) 100% ss)16% 10.Dado o rol de medidas das alturas (dadas em cm) de uma amostra de 100 indivduos de uma faculdade: calcule: a)a amplitude amostral; b)o nmero de classes; c)a amplitude de classes; 151 152 154 155 158 159 159 160 161 161161 162 163 163 163 164 165 165 165 166166 166 166 167 167 167 167 167 168 168168 168 168 168 168 168 168 168 169 169169 169 169 169 169 170 170 170 170 170170 170 171 171 171 171 172 172 172 173173 173 174 174 174 175 175 175 175 176176 176 176 177 177 177 177 178 178 178179 179 180 180 180 180 181 181 181 182182 182 183 184 185 186 187 188 190 19067 d)os limites de classes; e)as freqncias absolutas da classes; f)as freqncias relativas; g)os pontos mdios da classes; h)as freqncias acumuladas; i)o histograma e o polgono de freqncia; j)o polgono de freqncia acumulada; k)faa um breve comentrio sobre os valores das alturas desta amostra atravs da distribuio de frequncia. 11.Os dados seguintes representam 20 observaes relativas ao ndice pluviomtrico em determinado municpio do Estado: Milmetros de chuva a)Determinar o nmero de classes pela regra de Sturges; b)Construir a tabela de freqncias absolutas simples; c)Determinar as freqncias absolutas acumuladas; d)Determinar as freqncias simples relativas; 12.Considere a seguinte distribuio de frequncia correspondente aos diferentes preos de um determinado produto em vinte lojas pesquisadas. e)Quantas lojas apresentaram um preo de R$52,00?f)Construa uma tabela de freqncias simples relativas. g)Construa uma tabela de freqncias absolutas acumuladas. h)Quantas lojas apresentaram um preo de at R$52,00 (inclusive)?i)QualopercentualdelojascompreomaiordequeR$51,00emenordeque R$54,00? 144 152 159 160160 151 157 146154 145 151 150142 146 142 141141 150 143 158Preos No. De lojas50 251 552 653 654 1Total 2068 13.O quadro seguinte representa as alturas (em cm) de 40 alunos de uma classe. j)Calcular a amplitude total. k)Admitindo-se 6 classes, qual a amplitude do intervalo de classe? l)Construir uma tabela de frequncia das alturas dos alunos. m)Determinar os pontos mdios das classes. 14.Vinte alunos foram submetidos a um teste de aproveitamento cujos resultados fornam os que se seguem. Pede-se agrupar tais resultados em uma distribuio de freqncias 15.Construa uma tabela para mostrar que, em determinado curso, o nmero de alunos matriculados nas 1 , 2e 3sries era, respectivamente, 40, 35 e 29 em 1997 e 42, 36 e 32 em 1998. 16.Construaumatabelaparamostrarque,deacordocomaPesquisaNacionalpor AmostradeDomiclios,PNAD,em1992havianoBrasil73,1milhesdepessoas comrendafamiliarmensalat330reais(pobresemiserveis),45milhesde pessoas com renda familiar mensal de 330 reais at 1300 reais (emergentes) e 13,6 milhes de pessoas com renda familiar mensal acima de 1300 reais (classe mdia e ricos). Apresente, tambm, percentuais. 17.Faaumgrficodelinhasparaapresentarocrescimentoemalturadecrianasdo sexo masculino. Os dados esto na tabela a seguir. 162 163 148 166 169 154 170 166164 165 159 175 155 163 171 172170 157 176 157 157 165 158 158160 158 163 165 164 178 150 168166 169 152 170 172 165 162 16426 28 24 13 1818 25 18 25 2420 21 15 28 1727 22 13 19 28Idades Altura Mdia (cm)7 119,78 124,49 129,310 134,111 139,212 143,269 18.Dado o rol do nmero de erros de impresso da primeira pgina de um jornal durante 50 dias, obteve-se os seguintes resultados: a)Complete a tabela de distribuio de frequncia: Classe f P.M. F f r05 |- 0808 |- 1111 |- 1414 |- 1717 |- 2020 |- 23Total - - Segundo nos mostra a tabela acima responda: i) Qual a amplitude total (r) ? ii)Qual o valor de k (nmero de classe) ? iii)Qual o intervalo de cada classe (h) ? 19.Complete a tabela a seguir: 20.Considere a seguinte tabela: 5 5 5 6 6 6 7 7 7 77 8 8 8 8 8 8 8 9 910 10 10 10 10 11 11 11 11 1212 12 12 12 12 12 12 12 13 1414 14 14 14 14 14 15 16 19 22Classesf P.M.Fi fr0,021262 - 65 0,0666,5 84126362250,15300Total - -Classes fi2,75 |- 2,80 22,80 |- 2,85 32,85 |- 2,90 102,90 |- 2,95 112,95 |- 3,00 243,00 |- 3,05 143,05 |- 3,10 93,10 |- 3,15 83,15 |- 3,20 63,20 |- 3,25 3Total 9070 Identificar os seguinte elementos da tabela: a)Freqncia simples absoluta da quinta classe.b)Freqncia total.c)Limite inferior da sexta classe.d)Limite superior da quarta classe.e)Amplitude do intervalo de classe.f)Amplitude total.g)Ponto mdio da terceira classe. 21.Responda as questes abaixo: Mdia, Mediana e Moda so medidas de : a) ( ) Dispersob) ( ) posio c) ( ) assimetriad) ( ) curtose Na srie 10, 20, 40, 50, 70, 80 a mediana ser: a) ( ) 30b) ( ) 35 c) ( ) 40d) ( ) 45 50% dos dados da distribuio situa-se: a) ( ) abaixo da mdiac) ( ) abaixo da moda b) ( ) acima da medianad) ( ) acima da mdia 22.Calcule para cada caso abaixo a respectiva mdia. a)7, 8, 9, 12, 14 b) c) 23.Calcule o valor da mediana. d)82, 86, 88, 84, 91, 93 e) f) 24.Calcule a moda g)3, 4, 7, 7, 7, 8, 9, 10 h) i) Xi 3 4 7 8 12Fi 2 5 8 4 3Classes 68 - 72 72 - 76 76 - 80 80 - 84Fi 8 20 35 40Xi 73 75 77 79 81Fi 2 10 12 5 2Classes 1 - 3 3 - 5 5 - 7 7 - 9 9 - 11 11 - 13Fi 3 5 8 6 4 3Xi 2,5 3,5 4,5 6,5Fi 7 17 10 5Classes 10 - 20 20 - 30 30 - 40 40 - 50Fi 7 19 28 3271 25.Para a distribuio abaixo calcular D2, P4 Q3 26.Desvio Mdio, Varincia e Coeficiente de variao so medidas de : a) ( ) Assimetria c) ( ) Posio b) ( ) Disperso d) ( ) Curtose 27.Desvio Mdio para o conjunto de dados abaixo ser: a) ( ) 1,28c) ( ) 1,00 b) ( ) 1,20d) ( ) 0,83 28.O Desvio Padro de um conjunto de dados 9. A varincia : a) ( ) 3c) ( ) 81 b) ( ) 36d) ( ) 18 29.Na distribuio de valores iguais, o Desvio padro : a) ( ) negativoc) ( ) zero b) ( ) a unidaded) ( ) positivo 30.O calculo da varincia supe o conhecimento da: a) ( ) Facc) ( ) mediana b) ( ) mdiad) ( ) moda 31.A varincia do conjunto de dados tabelados abaixo ser: a) ( ) 1,36c) ( ) 4,54 b) ( ) 18,35d) ( ) 20,66 Classes 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70Fi 3 8 18 22 24xi Fi5 27 38 59 411 2Classes Fi03 |- 08 508 |- 13 1513 |- 18 2018 |- 23 1072 32.Numa empresa o salrio mdio dos homens de R$ 4000,00 com um desvio padro deR$1500,00,eodasmulheresnamdiadeR$3000,00comdesviopadrode R$1200,00. Qual dos sexos apresenta maior disperso. (Analise pelo C.V.) a) ( ) as mulheresc) ( ) homens e mulheres b) ( ) os homensd) ( ) nenhuma das anteriores 33.Analisando as curvas abaixo marque a resposta correta. (I)(II)(III) a) a curva I simtrica ; b) a curva II assimtrica positiva c) a curva I simtrica; d) a curva III simtrica positiva; 34.Para as distribuies abaixo foram calculados Distrib.A Distrib.BDistrib.C Marque a alternativa correta: a) a distribuio I assimtrica negativa; b) a distribuio II assimtrica positiva; c) a distribuio III assimtrica negativa moderada. d) a distribuio I simtrica; 35. Todas as seguintes medidas so de disperso, EXCETO F.Varincia; G.Amplitude; H.Moda; I.Desvio padro; J.Coeficiente de variao. 36. Oclculodavarinciadaalturaemcentmetrosdeestudantesdedeterminada escola dado em Classes Fi Classes Fi Classes Fi02 |- 06 6 02 |- 06 6 02 |- 06 606 |- 10 12 06 |- 10 12 06 |- 10 3010 |- 14 24 10 |- 14 24 10 |- 14 2414 |- 18 12 14 |- 18 30 14 |- 18 1218 |- 22 6 18 |- 22 6 18 |- 22 673 a) b)Centmetrosc)(centmetros)2 d)Sem unidade e)Nenhuma das respostas 37. O seguinte polgono de freqncia acumulado foi obtido de batimentos cardacos de 1.000 estudantes: Qual dos seguintes falsa? a) a amplitude da distribuio 60 a 100 batimentos por minuto b) a moda da distribuio c100 batimentos por minuto c) a mediana da distribuio 77 batimentos por minuto d) 92% dos valores so menores que 90 batimentos por minuto e) 95% dos valores so maiores que 65 batimentos por minuto 74 10.PROBABILIDADES Objetivos 1.Compreender as propriedades bsicas da probabilidade. 2.Selecionareaplicarasregrasapropriadasdaprobabilidadeparaumadada aplicao. 3.Selecionareaplicararegradeprobabilidadeapropriadaparadeterminada situao. 4.Distinguir entre eventos mutuamente exclusivos e eventos independentes. 5.Distinguir ente permutaes e combinaes. 6.Explicar o que uma distribuio de probabilidades e seus principais usos. Probabilidade um conceito filosfico e matemtico que permite a quantificao daincerteza,permitindoqueelasejaaferida,analisadaeusadaparaarealizaode previses ou para, a orientao de intervenes. aquilo que torna possvel se lidar de forma racional com problemas envolvendo o imprevisvel. Osmecanismosprobabilsticossoasestruturasedinmicasqueseacredita estaremsubjacentessprobabilidadesobservadasparaumdadofenmenoqualquer. Em outras palavras, seriam a causa do padro de incerteza percebido num determinado instante. Oconhecimentodosmecanismosprobabilsticospermitenoapenaso estabelecimento de expectativas quanto s probabilidades de um evento especfico mastambmaidentificaodequaisosfatoresqueinfluememtaisprobabilidadesecomo eles atuam. Exemplo: Cartas de Baralho Os fatores subjacentes probabilidade de uma dada carta surgir ao acaso num baralhoconstituemummecanismoprobabilsticorelativamentecomplexo,envolvendo principalmente a disposio inicial das cartas, a quantidade total das mesmas, o mtodo de embaralhamento e o procedimento de sorteio da carta. Coisas como o material de que as cartas so feitas, seu tamanho e formato, a temperatura e umidade do ambiente, e as correntes de ar no local tambm podem ser relevantes. 75 Dizer que todos os componentes acima constituem um mecanismo probabilstico significaquemudanasemqualquerumdessesparmetrostendeaalteraras probabilidades associadas ao surgimento de cada carta ou tipo de carta. Exemplo: Fecundao Afecundaohumanaapresentaummecanismoprobabilsticobastante complexo,comaprobabilidadedesucessonumdeterminadointercursosexual dependendo de uma srie de fatores que envolvem a contagem de espermatozides no smen,aquantidadeeaforadaejaculao,opHvaginal,afasedociclomenstrual feminino, a fase da espermatognese masculina, a data do coito anterior do homem e da mulher, a idade de ambos os envolvidos, a ausncia de infeces e outros. Todas essas variveisatuamconjuntamenteparapermitirareproduo,demodoqueelastambm condicionam a sua probabilidade. 10.1.Entendendo a probabilidade AteoriadasProbabilidadesestudaosfenmenosaleatrioscomvrios resultadospossveis,quantificandoassuaspossibilidadesdeocorrncia.Combasena teoria das probabilidades, jamais ser possveldizer o que vai ocorrer num experimento aleatrio-poisissodependersempredoacaso;noentanto,elapermitepreveroque podeocorrereaindadimensionaachancedeocorrnciadecadaumadas possibilidades.Entende-sepor"chance"amedidadaocorrnciadascircunstncias favorveis. 10.2.Experimento aleatrio Umexperimentopodeserpensadocomoumtesteparasedemonstraruma afirmativa,paraexaminaravalidadedeumahiptese,ouparasedeterminaraeficcia dealgumacoisanuncatentadapreviamente.Acondutadeumtaltesteconstituium experimento. Um bom exemplo de experimento o atode jogar uma moeda sobre uma superfcieplanaeanotaroresultado(caraoucoroa),assimcomoolanamentodeum dado ou o sorteio cego de uma bola a partir de uma urna com mltiplas bolas coloridas. Umingredientefundamentalnateoriadaprobabilidadeanoodeum experimentoque,aomenoshipoteticamente,podeserrepetidosobcondies essencialmenteidnticas,pormconduzindoaresultadosdiferentesemtentativas 76 diferentes.Emoutraspalavras,trata-sedeumasituaoonde,paratodososfins prticos,causasiguaisgeram(oupodemgerar)efeitosdiferentes.Quandosedizser possvelrepetirumexperimentosobcondiesessencialmenteidnticas,naturalmente est-sepensandonocontroledeumcertonmerodefatores.claroqueseria impossvelcontrolarabsolutamentetodososfatoresemquesto.Narealidade,so justamente esses fatores no controlados (tambm chamados de variveis de confuso, variveisestranhasouvariveisesprias)queiroconstituiraaleatoriedadedo fenmeno. Esta uma forma de visualizar o conceito. Tome-se,porexemplo,ocasodo.lanamentodeumamoeda.Deum lanamentoparaooutro,nosepodegarantirqueascondiessejamexatamenteas mesmas.Aexataposioinicialdosobjetosepersonagensenvolvidos,bemcomoa intensidadeedireoprecisasdaforadelanamento,noserorigorosamenteas mesmas.Ascondiesgerais,contudo,taiscomoamoeda,oindivduoquefazo lanamento e a mesa. podem ser idnticas, mas muitos fatores simplesmente no sero controlados. Caso tudo fosse absolutamente controlado, ento poder-se-ia supor que os resultadosseriamosmesmos,outalveznemassim,vistoque,aparentemente,existem incertezasfundamentaisnouniverso,taiscomoasquesoevidenciadasnofenmeno quntico. O conjunto de todos os resultados possveis em um experimento denominado de espao amostral (S). A soma de todos os resultados em um espao amostra tem uma probabilidadede1,0.Comotodososresultadostemamesmaprobabilidadede ocorrncia,qualquerumdelesiguala1divididopelonmerototalderesultados possveis. Qualquerconjuntoderesultadosdeumexperimentodenomina-seevento(e). Sendo evento um subconjunto de S, indica-se os eventos por letras maisculas: A. B, C, .. Exemplo 7.1 No experimento lanar um dado: Espao amostral ser o conjunto S = {1, 2, 3, 4, 5, 6}. Seja o evento A: sair um nmero par. Assim, A = {2, 4, 6}. Eventosimplesaqueleformadoporumnicodoespaoamostral,aopasso que o evento composto c aquele que possui mais de um elemento. No exemplo acima A composto. 77 Diantedasexplicaessobreoconceitodeeventos,nota-sequeS(espao amostrai)e (conjuntovazio)tambmsoeventos,esochamadosrespectivamente eventocertoeeventoimpossvel.Assim,oeventoob