apostila estatistica

Upload: ana-maria-neves-rego

Post on 08-Jul-2015

238 views

Category:

Documents


0 download

TRANSCRIPT

AAPPOOSSTTIILLAA EESSTTAATTSSTTIICCAA Luis Felipe Dias Lopes, Dr. [email protected], [email protected] D E - UFSM 2 0 0 3 S Su um m r r i io o 1Concei t os bsi cos 1.1PopulaoxAmost ra 1.2Censo x Amost ragem 1.3Dado x Varivel 1.4Parmet ros x est at st icas 1.5Arredondament o de dados 1.6Fases do mt odo est at st ico 2Repr esent ao t abul ar2.1Represent ao esquemt ica 2.2Element osdeumat abela 2.3Sries est at st icas 2.4Dist ribuiodef reqncia 3Repr esent ao gr f i ca 3.1GrficosdeLinhas 3.2Grficosdecolunasoubarras 3.3Grf icoscircularesoudeSet ores( PieChart s)3.4Grf icoPict orial- Pict ograma 3.5GrficoPolar3.6Cart ograma 3.7Grf icosut ilizadosparaaanlisedeumadist ribuiodef reqncia 4Medi das descr i t i vas 4.1Medidasdeposio 4.2Medidasdevariabilidadeoudisperso 4.3Medidas de disperso relat ivas 4.4Moment os, assimet ria e curt ose 4.5Exerccios 5Pr obabi l i dade e var i vei s al eat r i as 5.1Modelos mat emt icos 5.2Conceit os em probabilidade 5. 3Conceit osdeprobabilidade 5.4Exerccios 5.5TeoremadeBayes 5.6Variveis aleat rias 5.7Funodeprobabilidade5.8Exemplos 5.9Exerccios 6Di st r i bui es de Pr obabi l i dade 6.1Dist ribuiesdiscret asdeprobabilidade 6.2Exerccios 6.2Dist ribuies cont nuas de probabilidade 6.4Exerccios 7Amost r agem 7.1Conceit os em amost ragem 7.2Planosdeamost ragem 6.3Tipos de amost ragem 7.4Amost ragemcomesemreposio 7.5Represent aodeumadist ribuioamost ral 7.6Dist ribuiesamost raisdeprobabilidade 7.7Exerccios 7.8Est at st icas amost rais 7.9Tamanhodaamost ra 8Est i mao de par met r os 8.1Est imao pont ual8.2Est imao int ervalar 8.3Exerccios 9Test es de hi pt eses 9.1Principais conceit os 8.2Test e de signif icncia 9.3Exerccios 9.4Test esdoQui- quadrado 9.5Exerccios 10Regr esso e Correl ao 10.1I nt roduo 10.2Def inio 10.3Modelode Regresso 10.4Mt odo para est imao dosparmet ros e 10.5Decomposio da varincia Tot al 10.6Anlise de Varincia da Regresso 10.7Coef icient e de Det erminao ( r ) 10.8Coef icient e de Correlao ( r)10.9Exercci os 11Ref er nci as bi bl i ogr f i cas 1 1 1C Co on nc ce ei i t t o os s B B s si ic co os s 1.1 Popul ao x Amost r a Populao (N):Conjuntodetodososelementosrelativosaumdeterminadofenmeno quepossuempelomenosumacaractersticaemcomum,apopulaooconjunto Universo, podendo ser finita ou infinita. Finita - apresenta um nmero limitado de observaes, que passvel de contagem. Infinita-apresentaumnmeroilimitadodeobservaesqueimpossveldecontaregeralmenteesta associada a processos. Amostra (n): umsubconjuntodapopulaoedeverserconsideradafinita,aamostra deveserselecionadaseguindocertasregrasedeveserrepresentativa,demodoqueela represente todas as caractersticas da populao como se fosse uma fotografia desta. Umapopulaopode,medianteprocessosoperacionais,serconsideradainfinita,poisamesmairdepender dotamanhodaamostra.Seafreqnciarelativaentreamostraepopulaoformenordoque5%ela considerada infinita, se a freqncia relativa for maior do 5% ela considerada finita. 1.2Censo x Amost r agem PesquisaEstatstica:qualquerinformaoretiradadeumapopulaoouamostra, podendo ser atravs de Censo ou Amostragem. Censo: a coleta exaustiva de informaes das "N" unidades populacionais. Amostragem:oprocessoderetiradadeinformaesdos"n"elementosamostrais,no qual deve seguir um mtodo criterioso e adequado (tipos de amostragem). 1.3 Dado x Var i vel Dados estatsticos: qualquer caracterstica que possa ser observada ou medida de alguma maneira. As matrias-primas da estatstica so os dados observveis. Varivel: aquilo que se deseja observar para se tirar algum tipo de concluso, geralmente asvariveisparaestudososelecionadasporprocessosdeamostragem.Ossmbolos utilizados para representar as variveis so as letras maisculas do alfabeto, tais como X, Y, Z,...quepodeassumirqualquervalordeumconjuntodedados.Asvariveis podem ser classificadas dos seguintes modos: 2 -Qualitativas(ouatributos): Socaractersticasdeumapopulaoquenopodeser medidas. Nominal : so utilizados smbolos,ounmeros, para representar determinado tipo de dados, mostrando, assim, a qual grupo ou categoria eles pertencem. Ordinalouporpostos:quandoumaclassificaofordivididaemcategorias ordenadasemgrausconvencionados,havendoumarelaoentreascategoriasdotipo maior do que,menordoque,iguala,osdadosporpostosconsistemdevalores relativosatribudosparadenotaraordemdeprimeiro,segundo,terceiroe,assim, sucessivamente. -Quantitativas:Socaractersticaspopulacionaisquepodemserquantificadas,sendo classificadas em discretas e contnuas. Discretas:soaquelasvariveisquepodeassumirsomentevaloresinteirosnum conjuntodevalores.geradapeloprocessodecontagem,comoonmerode veculos que passa em um posto de gasolina, o nmero de estudantes nesta sala de aula. Contnuas:soaquelasvariveisquepodemassumirumvalordentrodeumintervalo devalores.geradapeloprocessodemedio.Nestecasoservecomoexemploo volume de gua em um reservatrio ou o peso de um pacote de cereal. 1.4 Par met r os x Est at st i cas Parmetros:somedidaspopulacionaisquandoseinvestigaapopulaoemsua totalidade, neste caso impossvel fazer inferncias, pois toda a populao foi investigada. EstatsticasouEstimadores:somedidasobtidasdaamostra,torna-sepossvelneste casoutilizarmosasteoriasinfernciasparaquepossamosfazerconclusessobrea populao. 3 1.5 Ar r edondament o de Dados Regras:Portaria36de06/ 07/ 1965-INPMInstitutoNacionaldePesose Medidas. 1a)Seoprimeiroalgarismoapsaquelequefor mosarredondarforde0a4, conservamos o algarismo a ser arredondado e desprezamos os seguintes. Ex.: 7,34856 (para dcimos) 7,3 2a)Seoprimeiroalgarismoapsaquelequeformosarredondarforde6a9, acrescenta-seumaunidadenoalgarismoaserarredondadoedesprezamosos seguintes. Ex.: 1,2734 (para dcimos) 1,3 3a)Seoprimeiroalgarismoapsaquelequeformosarredondarfor5,seguidoapenas de zeros, conservamos o algarismo se ele for par ou aumentamos uma unidade se ele for mpar, desprezando os seguintes. Ex.: 6,2500 (para dcimos) 6,2 12,350 (para dcimos) 12,4 Seo5forseguidodeoutrosalgarismosdosquais,pelomenosumdiferente dezero,aumentamosuma unidade no algarismo e desprezamos os seguintes. Ex.: 8,2502 (para dcimos) 8,3 8,4503 (para dcimos) 8,5 4a)Quando,arredondarmosumasriedeparcelas,easomaficaralterada, devemos fazerumnovoarredondamento(porfaltaouporexcesso),namaiorparcelado conjunto, de modo que a soma fique inalterada. Ex.:17,4%+18,4%+ 12,3%+ 29,7%+ 22,2%= 100% arredondando para inteiro: 17%+ 18%+ 12%+30%+ 22%=99% 17%+ 18%+12%+31%+ 22%=100% 4 1.6 Fases do mt odo est at st i co O mtodo estatstico abrange as seguintes fases: a) Definio do Problema Consiste na: - formulao correta do problema; - examinar outros levantamentos realizados no mesmo campo (reviso da literatura); - saber exatamente o que se pretende pesquisar definindo o problema corretamente (variveis, populao, hipteses, etc.) b) Planejamento Determinar o procedimento necessrio para resolver o problema: - Como levantar informaes; - Tipos de levantamentos: Por Censo (completo); Por Amostragem (parcial). - Cronograma, Custos, etc. c) Coleta ou levantamento dos dados Consiste na obteno dos dados referentes ao trabalho que desejamos fazer. A coleta pode ser: Direta- diretamente da fonte; Indireta- feita atravs de outras fontes. Osdadospodemserobtidospelaprpriapessoa(primrios)ousebaseianoregistro de terceiros (secundrios). d) Apurao dos Dados ou sumarizao Consisteemresumirosdados,atravsdeumacontagemeagrupamento.um trabalho de coordenao e de tabulao. Apurao: manual, mecnica, eletrnica e eletromecnica. e) Apresentao dos dados a fase em que vamos mostrar os resultados obtidos na coleta e na organizao. Esta apresentao pode ser:Tabular (apresentao numrica) Grfica (apresentao geomtrica) f) Anlise e interpretao dos dados afasemaisimportanteetambmamaisdelicada.Tiraconclusesqueauxiliamo pesquisador a resolver seu problema. 5 2 2R Re ep pr r e es se en nt t a a o o t t a ab bu ul l a ar r Consisteemdisporosdadosemlinhasecolunasdistribudasdemodoordenado.A elaboraodetabelasobedeceResoluono886,de26deoutubrode1966,doConselho NacionaldeEstatstica.AsnormasdeapresentaosoeditadaspelaFundaoBrasileirade Geografia e Estatstica (IBGE). 2.1 Repr esent ao esquemt i ca Ttulo Cabealho Corpo Rodap 2.2 El ement os de uma t abel a Ttulo: O ttulo deve responder as seguintes questes: - O que? (Assunto a ser representado (Fato));- Onde? (O lugar onde ocorreu o fenmeno (local)); - Quando? (A poca em que se verificou o fenmeno (tempo)). Cabealho: parte da tabela na qual designada a natureza do contedo de cada coluna. Corpo: parte da tabela composta por linhas e colunas. Linhas: parte do corpo que contm uma seqncia horizontal de informaes. Colunas: parte do corpo que contm uma seqncia vertical de informaes. ColunaIndicadora:colunaquecontmasdiscriminaescorrespondentesaosvalores distribudos pelas colunas numricas.Casa ou clula: parte da tabela formada pelo cruzamento de uma linha com uma coluna. Rodap:oespaoaproveitadoemseguidaaofechodatabela,ondesocolocadasas notas de natureza informativa (fonte, notas e chamadas). Fonte: refere-se entidade que organizou ou forneceu os dados expostos. Notas e Chamadas: so esclarecimentos contidos na tabela (nota - conceituao geral; chamada - esclarecer mincias em relao a uma clula). 6 2.3 Sr i es Est at st i cas Umasrieestatsticaumconjuntodedadosordenadossegundoumacaracterstica comum, as quais serviro posteriormente para se fazer anlises e inferncias. SrieTemporalouCronolgica:asriecujosdadosestodispostosem correspondnciacomotempo,ouseja,variaotempoepermanececonstanteofatoeo local. Produo de Petrleo Bruto no Brasil de 1976 a 1980 (x 1000 m) AnosProduo 19769 702 19779 332 19789 304 19799 608 198010 562 Fonte: Conjuntura Econmica (fev. 1983) SrieGeogrficaouTerritorial:asriecujosdadosestodispostosem correspondncia com o local, ou seja, varia o local e permanece constante a poca e o fato. Populao Urbana do Brasil em 1980 (x 1000) RegioPopulao Norte 3 037 Nordeste17 568 Sudeste42 810 Sul11 878 Centro-Oeste 5 115 Total80 408 Fonte: Anurio Estatstico (1984) SrieEspecficaouQualitativa:asriecujosdadosestodispostosem correspondnciacomaespcieouqualidade,ouseja,variaofatoepermanececonstantea poca e o local. Populao Urbana e Rural do Brasil em 1980 (x 1000) LocalizaoPopulao Urbana 80 408 Rural 38 566 Total118 974 Fonte: Anurio Estatstico (1984) 7 SrieMistaouComposta:Acombinaoentreduasoumaissriesconstituemnovas sriesdenominadascompostaseapresentadasemtabelasdeduplaentrada.Onomeda srie mista surge de acordo com a combinao de pelo menos dois elementos. Local +poca =Srie Geogrfica Temporal Populao Urbana do Brasil por Regio de 1940 a 1980 (x 1000) R E G I E S AnosNNESESCO 1940 406 3 381 7 232 1 591271 1950 581 4 74510 721 2 313424 1960 958 7 51717 461 4 3611 007 19701 62411 75328 965 7 3032 437 19803 03717 56742 81011 8785 115 Fonte: Anurio Estatstico (1984) 2.4 Di st r i bui o de Fr eqnci a otipode srie estatstica na qual permanece constante o fato, o local e a poca. Os dadossocolocadosemclassespreestabelecidas,registrandoafreqnciadeocorrncia.Uma distribuio de freqncia pode ser classificada em discreta e intervalar. a) DistribuiodeFreqnciaDiscretaouPontual:umasriededadosagrupadosna qual o nmero de observaes est relacionado com um ponto real. Notas do Aluno "X" na Disciplina de Estatstica segundo critrios de avaliao do DE da UFSM 1990 Xifi 6.32 8.43 5.32 9.53 6.55 15 Fonte: Departamento de Estatstica (1990) 8 b)DistribuiodeFreqnciasIntervalar:Nadistribuiodefreqncia,osintervalos parciais devero ser apresentados de maneira a evitar dvidas quant o classe a que permanece determinado elemento. Otipodeintervalomaisusadodotipofechadoaesquerdaeabertoadireita, representado pelo smbolo: | ---. Altura em centmetros de 160 alunos do Curso de Administrao da UFSM- 1990 Altura (cm)Xifi 150| ---15815418 158| ---16616225 166| ---17417020 174| ---18217852 182| ---19018630 190| ---19819415 ----160 Fonte: Departamento de Estatstica (1990) Elementos de uma Distribuio de Freqncias: ClasseouClassedeFreqncia(K):cadasubintervalo(linha)naqualdividimoso fenmeno. Para determinar o nmero de classes a partir dos dados no tabelados, podemos usar a FrmuladeSturges,masdeve-sesaberqueexistemoutrosmtodosdedetermina o do nmero de classes em uma tabela de freqncia. O que se deseja fazer apenas comprimir um conjunto de dados em uma tabela, para facilitar a visualizao e interpretao dos mesmos. n log 3.3 1 n(K) + , onde n no de informaes. AlmdaRegradeSturges,existemoutrasfrmulasempricaspararesolveroproblemaparadeterminao do nmero de classes [n(k)], h quem prefira n ) k ( n .Entretanto,averdadequeessasfrmulasno noslevamaumadecisofinal;estavaidependernarealidadedeumjulgamentopessoal,quedeverestar ligadoanaturezadosdados,procurando,semprequepossvel,evitarclassescomfreqnciasnulasou freqncias relativas exageradamente grandes. Limite de Classe (li ou Li): So os valores extremos de cada classe. li = limite inferior da i-sima classe;Li = limite superior da i-sima classe; 9 Amplitudedointervalodeclasse(h):adiferenaentredoislimitesinferioresou superiores consecutivos. l l h1 n n ou 1 n nL L = h A amplitude do intervalo de classe deve ser constante em todo a distribuio de freqncias intervalar. Amplitudetotal(H):adiferenaentreolimitesuperiordaltimaclasseeolimite inferiorda1classe,ouadiferenaentreltimoeoprimeiro elemento de um conjunto de dados postos em ordem crescente. 1 nl L H Ponto mdio de classe (Xi): a mdia aritmtica simples do limite inferior com o limite superior de uma mesma classe. 2L lXi ii+ ou a partir do X1 os demais pontos mdios pode ser determinado por: h X X1 n n+ Quandosubstituirmososintervalosdeclassespelospontosmdios(Xi),ter-se- umadistribuiode freqncia pontual. Freqncia absoluta (fi): a quantidade de valores em cada classe n 2 1n1 iif ... f f f n + + + Freqncia Acumulada (Fi): o somatrio da freqncia absoluta da i-sima classe com a freqncia absoluta das classes anteriores, ou a freqncia acumulada da classe anterior.n f Fn1 ii n FreqnciaRelativa(fri):oquocienteentreafreqnciaabsolutadai-sima classe com o somatrio das freqncias. n1 iiiifffr Obs.: 1 frn1 ii Freqncia Relativa Acumulada (Fri): osomatriodafreqnciarelativadai-sima classe com as freqncias relativas das classes anteriores. 1 fr Frn1 ii n 10 3 3R Reep pr r e es se en nt t a a o o g gr r ff i i c ca a Osgrficossoumaformadeapresentaovisualdosdados.Normalmente,contm menosinformaesqueastabelas,massodemaisfcilleitura.Otipodegrficodependeda varivel em questo 3.1 Gr f i cos de Li nhas Usado para ilustrar uma srie temporal. Produo de Petrleo Bruto no Brasil de 1976 a 1980 (x 1000 m) AnosProduo8500900095001000010500110001976 1977 1978 1979 1980 Fonte: Conjuntura Econmica (Fev. 1983) 3.1.1 Grfico de linhas comparativas Populao Urbana do Brasil por Regio de 1940 a 1980 (x 1000) 0500010000150002000025000300003500040000450001940 1950 1960 1970 1980NENSESCO Fonte: Anurio Estatstico (1984) 11 3.2 Gr f i cos de col unas ou bar r as Representaogrficadadistribuiodefreqncias.Estegrficoutilizadopara variveis nominais e ordinais.Caractersticas: - todas as barras devem ter a mesma largura- devem existir espaos entre as barras 3.2.1 Grfico de Colunas Usado para ilustrar qualquer tipo de srie. Populao Urbana do Brasil em 1980 (x 1000) N NE SE S CORegies3037175684281011878511501000020000300004000050000Pop.N NE SE S CORegies Fonte: Anurio Estatstico (1984) Aslargurasdasbarrasquedeverosertodasiguaispodendoseradotadoqualquerdimenso,desdequeseja convenienteedesdequenosesuperponham.Onmeronotopodecadabarrapodeounoomitido,se forem conservados, a escala vertical pode ser omitida. 3.2.2.1 Grfico de colunas comparativas a) Colunas Justapostas (grfico comparativo) Populao Urbana do Brasil por Regio de 1940 a 1980 (x 1000) 0500010000150002000025000300003500040000450001940 1950 1960 1970 1980NNESESCO Fonte: Anurio Estatstico (1984) 12 b) Colunas Sobrepostas (grfico comparativo) Populao Urbana do Brasil por Regio de 1940 a 1980 (x 1000) 0200004000060000800001000001940 1950 1960 1970 1980COSSENNE Fonte: Anurio Estatstico (1984) 3.2.2 Grfico de Barras As regras usadas para o grfico de barras so igua is as usadas para o grfico de colunas. Populao Urbana do Brasil em 1980 (x 1000) RegiesPopulao0 10000 20000 30000 40000 50000NNESESCO30371756842810118785115 Fonte: Anurio Estatstico (1984) Assim como os grficos de Colunas podem ser construdos grficos de barras comparativas. 3.3 Gr f i cos ci rcul ares ou de Set ores ( Pi e Chart s) Representaogrficadafreqnciarelativa(percentagem)decadacategoriada varivel. Este grfico utilizado para variveis nominais e ordinais. uma opo ao grfico de barrasquandosepretendedarnfasecomparaodaspercentagensdecadacategoria.A construodogrficodesetoressegueumaregrade3simples,ondeasfreqnciasdecada classecorrespondemaonguloquesedesejarepresentaremrelaoafreqnciatotalque representa o total de 360. 13 Caractersticas: - A rea do grfico equivale totalidade de casos (360o = 100%);- Cada fatia representa a percentagem de cada categoria Populao Urbana e Rural do Brasil em 1980 (x 1000) 68%32%UrbanaRural Fonte: Anurio Estatstico (1984) 3.4 Gr f i co Pi ct or i al- Pi ct ograma Temporobjetivodespertaraatenodopblicoemgeral,muitodessesgrficos apresentam grande dose de originalidade e de habilidade na arte de apresentao dos dados. Evoluo da matricula no Ensino Superior no Brasil de 1968 a 1994 (x 1000) 1968 1974 1980 1986 1990 19940250500750100012501500 Fonte: Grandes nmeros da educao brasileira maro de 1996 14 3.4.1 Exemplos de pictogramas Evoluo da frota nacional de carros lcool de 1979 1987 9 . 6 4 519791.277.10719832.473.58119853.631.6471987 Os mtodos mais eficientes para deixar de fumar segundo 30.000 fumantes entrevistados no Canad 36%30%27%19,5%18,5%Go m a d e m a sc a rc o m nic o t inam a i s se ss e s d ea p o i op si c o l g i c oInt e rna m e nt o e m ho sp it a l eu sod ed ro g a s re l a xa n t e s Ac um p unt uraHi p n o seInj e o d e Clo nid ina ,d ro g a q uere d uzo se fe it o sd a a b st in nc ia Devastao Selvagem: extrao de madeiras no Brasil EucaliptoMadeira nativaPinus2 4 , 4 %6 8 , 8 %6, 8% 15 3.5 Gr f i co Pol ar otipodegrficoidealpararepresentarsriestemporaiscclicas,ouseja,todaasrie que apresenta uma determinada periodicidade. 4.5.1 Como construir um grfico polar 1)Traa-seumacircunfernciaderaioarbitrrio(preferencialmente,aumraiode comprimento proporcional a mdia dos valores da srie); 2)Constri-se uma semi-reta(deprefernciahorizontal)partindodoponto0 (plo) e com uma escala (eixo polar); 3) Divide-se a circunferncia em tantos arcos forem as unidades temporais; 4) Traa -se semi-retas a partir do ponto 0 (plo) passando pelos pontos de diviso; 5)Marca-seosvalorescorrespondentesdavarivel,iniciandopelasemi-reta horizontal (eixo polar); 6) Ligam-se os pontos encontrados com segmentos de reta; 7) Para fechar o polgono obtido, emprega-se uma linha interrompida. Precipitao pluviomtrica do municpio de Santa Maria RS- 1999 MesesPrecipitao (mm)Janeiro 174,8 Fevereiro 36,9 Maro83,9 Abril462,7 Maio418,1 Junho418,4 Julho538,7 Agosto323,8 Setembro 39,7 Outubro 66,1 Novembro83,3 Dezembro 201,2 Fonte: Base Area de Santa Maria Mdia =237,31 mm Precipitao pluviomtrica do municpio de Santa Maria RS- 1999 Fonte: Base Area de Santa Maria 16 3.6 Car t ogr ama a representao de uma carta geogrfica. Este tipo de grfico empregado quando o objetivoodefigurarosdadosestatsticosdiretamenterelacionadoscomasreasgeogrficas ou polticas Dados absolutos (populao) usa-se pontos proporcionais aos dados. Dados relativos (densidade) usa-se hachaduras. Exemplo: Populao da Regio Sul do Brasil - 1990 EstadoPopulao (hab.)rea (m2)Densidade Paran9.137.700199.32445,8 SantaCatarina4.461.40095.31846,8 Rio Grande do Sul9.163.200280.67432,6 Fonte: IBGE Populao da Regio Sul do Brasil 1990 Fonte: IBGE Densidade populacional da Regio Sul do Brasil 1990 Fonte: IBGE 17 3.7 Gr f i cos ut i l i zados par a a anl i se de uma di st r i bui o de f r eqnci a 3.7.1 Histograma Altura em centmetros de 160 alunos do Curso de Administrao da UFSM -1990 Fonte: Departamento de Estatstica (1990) 3.7.2 Polgono de Freqncias Altura em centmetros de 160 alunos do Curso de Administrao da UFSM- 1990 Fonte: Departamento de Estats tica (1990) 18 3.6.3 Ogivas Altura em centmetros de 160 alunos do Curso de Administrao da UFSM 1990 OgivaCrescente OgivaDecrescente 3.7.4 Grfico em segmentos de reta vertical utilizadopararepresentarumadistribuiodefreqnciapontual,ondeos segmentos de reta so proporcionais s respectivas freqncias absolutas. Altura em centmetros de 160 alunos do Curso de Administrao da UFSM -1990 Fonte: Departamento de Estatstica (1990) 3.7.5 Como se interpreta um histograma? Arepresentaogrficadadistribuiodavarivel,porhistogramas.Estegrfico utilizado para variveis contnuas. Caractersticas: - Cada barra representa a freqncia do intervalo respectivo;- Os intervalos devem ter a mesma amplitude; - As barras devem estar todas juntas. 19 Asimplesobservaodaformado histogramapermitealgumasconcluses. Vejaafigura4.1.Amedidadosdadosest nocentrododesenho.Asfreqnciasmais altastambmestonocentrodafigura. Nosprocessosindustriais,estaaforma desejvel. Figura 4.1 Histograma 60 50 40 30 20 10 0 Afigura4.2apresentaum histogramacomassimetriapositiva.A mdiadosdadosestlocalizadaesquerda docentrodafiguraeacaudadireita alongada.Estaocorrequandoolimite inferiorcontroladoouquandono podemocorrervaloresabaixode determinado limite. Figura4.2Histogramacomassimetria positiva60 50 40 30 20 10 0 Afigura4.3apresentaum histogramacomassimetrianegativa.A mdia dos dados est localizada direita do centrodafiguraeacaudaesquerda alongada.Estaformaocorrequandoo limite superior controlado ou quando no podemocorrervaloresacimadecerto limite Figura4.3Histogramacomassimetria negativa 60 50 40 30 20 10 0 20 Afigura4.4mostraumhistograma emplateau,Isto,comexceodas primeirasedasltimasclasses,todasas outrastmfreqnciasquaseiguais.Essa formaocorrequandosemisturamvrias distribuies com diferentes mdias. Figura 4.4 Histograma em plateau 60 50 40 30 20 10 0 Afigura4.5mostraumhistograma comdoispicos,ouduasmodas.As freqnciassobaixasnocentrodafigura, mas existem dois picos fora do centro. Esta formaocorrequandoduasdistribuies commdiasbemdiferentessemisturam. Podemestarmisturados,porexemplo,os produtos de dois turnos de trabalho. Figura4.5Histogramacomdois picos 60 50 40 30 20 10 0 Oshistogramastambmmostramograudedispersodavarivel.Vejaafigura4.6.O histogramaesquerdamostrapoucadisperso,masohistogramadireitamostragrande disperso. Figura 4.6 Histogramas com disperses diferentes FreqnciaFreqncia60 50 40 30 20 10 0 60 50 40 30 20 10 0 21 3.7.6 Curva de freqncia curva polida Como,emgeral,osdadoscoletadospertencemaumaamostraextradadeuma populao,pode-se imaginar as amostras tornando-se cada vez mais amplas e a amplitude das classesficandocadavezmenor,oquenospermiteconcluirqueocontornodopolgonode freqnciastendeasetransformarnumacurva(curvadefreqncia),mostrando,demodo mais evidente, a verdadeira natureza da distribuio da populao. Pode-sedizer,ento,que,enquantoqueopolgonodefreqncianosdaimagem real do fenmeno estudado, a curva de freqncia nos d a imagem tendenciosa. Assim,apsotraadodeumpolgonodefreqncia,desejvel,muitasvezes,quese faa umpolimento,demodoamostraroqueseriatalpolgonocomumnmeromaiorde dados. Esseprocedimentoclaro,nonosdarcertezaabsolutaqueacurva polida seja tal qualacurvaresultantedeumgrandenmerodedados.Porm,pode-seafirmarqueela assemelha-se mais a curva de freqncia que o polgono de freqncia obtido de uma amostra limitada. Opolimento,geometricamente,correspondeeliminaodosvrticesdalinha poligonal. Consegue-se isso com a seguinte frmula: 4f f 2 ffc. post i . anti+ +onde: fci =freqncia calculada da classe considerada; fi =freqncia absoluta da classe i; fant . =freqncia absoluta da classe anterior a i; fpost . =freqncia absoluta da classe posterior a i; Quando for em fazer o uso da curva polida convm mostrar as freqncias absolutas, por meio de umpequenocirculo,demodoquequalquerinteressadopossajulgarseessepontoseoponto um dado original ou um dado polido. Altura em centmetros de 40 alunas do Curso de Enfermagem da UFSM - 1996 Altura (cm)Xififci 150| ---1541524(0+2 x 4 +9)/ 4 =4,25 154| ---1581569(4 +2 x 9 +11)/ 4 =8,25 158| ---16216011(9 +2 x 11 +8)/ 4 =9,75 162| ---1661648(11 +2 x 8 +5)/ 4 =8,00 166| ---1701685(8 +2 x 5 +3)/ 4 =5,25170| ---1741723(5 +2 x 3 +0)/ 4 =2,75 ----40--- Fonte: Departamento de Estatstica (1997) 31 Altura em centmetros de 40 alunas do Curso de Enfermagem da UFSM- 1996 Fonte: Departamento de Estatstica (1997) 3.7.7 Curvas em forma de sino Ascurvasemformadesinocaracterizam-sepelofatodeapresentaremumvalor mximo na regio central. Distinguem-se as curvas em forma de sino em: simtrica e assimtrica a) Curva simtrica Estacurvacaracteriza-seporapresentarovalormximonopontocentraleospontos eqidistantes desse ponto terem a mesma freqncia. 32 b) Curvas assimtricas Naprtica,noseencontramdistribuiesperfeitamentesimtricas.Asdistribuies obtidasdemedidasreaissomaisoumenosassimtricas,emrelaofreqnciamxima. Assim,ascurvascorrespondentesataisdistribuiesapresentamacaudadeumladoda ordenadamximamaislongadoqueooutro.Seacaudamaislongaficaadireitachamada assimtricapositivaouenviesadadireita,seacaudasealongaaesquerda,acurva chamada assimtrica negativa ou enviesada esquerda. Assimtrica Positiva Assimtrica Negativa 33 4Medi das Descr i t i vas Temporobjetivodescreverumconjuntodedadosdeformaorganizadaecompacta quepossibilitaavisualizaodoconjuntoestudadopormeiodesuasestatsticas,oqueno significa que estes clculos e concluses possam ser levados para a populao.Podemos classificar as medidas de posio conforme o esquema abaixo: 4.1 Medi das de Posi o Mdia AritmticaRepresentativas-MdiasMdia Geomtrica Mdia Harmnica Mediana SeparatrizesQuartis Decis Centis ou Percentis Dominantes Moda de Czuber Moda de King Moda de Pearson 4.1.1 Representativas (Mdias) So medidas descritivas que tem por finalidade representar um conjunto de dados. a) Mdia Aritmtica: Amostral (X); Populacional () Dados No Tabelados XXnou =XNii 1nii 1N 34 Dados Tabelados com Valores Ponderados Mdia Aritmtica Ponderada ( Xw), (onde Wi o peso) Nota do aluno "X"1 semestre de 1994 - UFSM Notas (Xi)Pesos (Wi) 7.82 8.33 8.22 5.83 10 Fonte: Dados Hipotticos XX .WW wi ii 1nii=1n D istribuiodefreqncias - Mdia Aritmtica ( X) Altura em centmetros de 160 alunos do Curso de Administrao da UFSM - 1990 Altura (cm)XifiXi . fi 150| ---158154182763,0 158| ---166162254037,5 166| ---174170203390,0 174| ---182178529230,0 182| ---190186305565,0 190| ---198194152917,55 ----16027903 Fonte: Departamento de Estatstica (1990) XX .ff i ii 1nii=1n -Caractersticas da Mdia Aritmtica Simples 1a) A Mdia Aritmtica Simples dever estar entre o menor e o maior valor observado, max. min.X X X 2a)Asomaalgbricadosdesvioscalculadosentreosvaloresobservadoseamdia aritmtica igual a zero; desvios = d xi d ( x zeroi 1nii 1n ) 35 3a) Somando-seousubtraindo-se todos os valores (Xi) da srie por uma constante "k" (k 0), a nova mdia aritmtica ser igual a mdia original somada ou subtrada por esta constante "k". k X Y Xk x y xi i it t 4a)Multiplicando-seoudividindo-setodososvalores(Xi)dasrieporumaconstante "k"(k0),anovamdiaaritmticaserigualamdiaoriginalmultiplicadaou dividida por esta constante "k". k X Y k X Y Xk x y k x y xi i i i i b) Mdia Geomtrica: (Xg): A aplicao da mdia geomtrica deve ser feita, quando os valores do conjunto de dados considerado se comportam segundo uma progresso geomtrica (P.G.)ou dela se aproximam. Dados No Tabelados nn 2 1nn1 ii g.X ... . .X X X X Dados Tabelados n1 = iin 2 1n1 = iiiffnf2f1f n1 ifi g.X ... . .X X X X Usandoumartifciomatemtico,pode-seusarparacalcularamdiageomtricaa seguinte frmula: ( ) + + +n1 ii in1 iin n 2 2 1 1n1 iiX log . ff1X log . f ... X log . f X log . ff1g10 10 X36 c) Mdia Harmnica (Xh) usada para dados inversamente proporcionais. Ex.: Velocidade Mdia, Preo de Custo Mdio 4.1.2 Emprego da mdia 1) Deseja-se obter a medida de posio que possui a maior estabilidade; 2) Houver necessidade de um tratamento algbrico ulterior. Dados No Tabelados n 2 1n1 iihX1...X1X1X1X+ + + n n Dados Tabelados XffXf f .. . ffXfX. ..fXhii 1nii i 1n1 2 n1122nn + + ++ + + Deve-se observar esta propriedade entre as mdiash gX X X 4.1.3 Separatrizes (Mediana, Quartis, Decis e Centis ou Percentis) Somedidasdeposioquedivideoconjuntodedadosempartesproporcionais, quando os mesmos so ordenados. a) Dados no tabelados Antesdedeterminarmosasseparatrizesdevemosemprimeirolugarencontraraposio da mesma. - Se o nmero de elementos for par ou mpar, as separatrizes seguem a seguinte ordem: S1) + i(nPosio se for mediana '2 S1 ise for quartis ' 4 S3 i 1 37 se for decis ' 10 S9 i 1 se for centis ' 100 S99 i 1 Dados Tabelados b) Distribuio de freqncias pontual: segue a mesma regra usada para dados no tabelados c) Distribuio de freqncias intervalar iiSantS if.h FSi.nl S

,_

+ onde: S Mdi =1i ; S Q1 i 3i i ; S D1 ii i 9; S Cou P1 ii i i 99 lSi limite inferior da classe que contm a separatriz; i.nS posio da separatriz; Fant freqncia acumulada da classe anterior a que contm a separatriz; h amplitude do intervalo de classe; fSi freqncia absoluta da classe que contm a separatriz; 4.1.4 Emprego da mediana 1) Quando se deseja obter um ponto que divide a distribuio em partes iguais; 2) H valores extremos que afetam de uma maneira acentuada a mdia; 3) A varivel em estudo salrio. 4.1.5 Dominantes - Moda (Mo) definida como sendo a observao de maior freqncia. 38 a) Dados no tabelados Ex.: 34445566789 Mo =4 (unimodal) 5678910111213 Mo = / (amodal) 11223334555 Mo1 = 3 Mo2 =5 (bimodal) 55667788 Mo = / (amodal) 5566778 Mo1 =5 Mo2 =6Mo3 =7 (multimodal) Acima de 3 modas usamos o termo multimodal. Dados Tabelados a) Distribuio de freqncias pontual - Moda Bruta (Mob): o ponto mdio da classe de maior freqncia i bX Mo b) Distribuio de freqncias intervalar - Moda de Czuber (Moc): O processo para determinar a moda usado por Czuber leva em considerao as freqncias anteriores e posteriores classe modal. '

,_

+ + pos Mo 2ant Mo 12 11Mo cf ff f.h l Mo onde: lMo limite inferior da classe modal; fMo freqncia absoluta da classe modal; h amplitude do intervalo de classe; fant freqncia absoluta da classe anterior a classe modal; fpos freqncia absoluta da classe posterior a classe modal; -ModadeKing(Mok):OprocessopropostoporKingconsideraainfluncia existente das classes anterior e posterior sobre a classe modal. A inconvenincia deste processo justamente no levar em considerao a freqncia mxima. .hf ffl Moant posposMo k

,_

++ 39 -ModadePearson(Mop):OprocessousadoporPearsonpressupequea distribuiosejaaproximadamentesimtrica,naqualamdiaaritmticaeamedianaso levadas em considerao. MoMd -2 Xp 3 Um distribuio considerada simtrica quandoX Md Mo . 4.1.6 Emprego da moda 1) Quando se deseja obter uma medida rpida e aproximada de posio; 2) Quando a medida de posio deve ser o valor mais tpico da distribuio. 4.1.7 Posio relativa da mdia, mediana e moda Quando uma distribuio simtrica, as trs medidas coincidem. Porm, a assimetria torna-as diferentes e essa diferena tanto maior quanto maior a assimetria. Assim, em uma distribuio temos: Mo Md x curva simtrica Mo Md x < < curva assimtrica negativa x Md Mo < < curva assimtrica positiva Mo Md x Md Md Mo x Mo xModad ian a e Mdi a M 40 4.1.8 Exerccios Para os dados abaixo calcule: Md; Q1; Q3; D3; C70 1) 37810121315171821 4681113141718192225 2) Alturas dos alunos da Turma X no 1o sem. de 1994 - UFSM Alturasfi 6315 7525 8430 9120 90 Fonte: Dados Hipotticos 3) Alturas dos alunos da Turma Y no 1o sem. de 1994 UFSM AlturasfiFi 61| ---651212 65| ---692335 69| ---733469 73| ---772695 77| ---8115110 110110 Fonte: Dados Hipotticos 4.2 Medi das de Var i abi l i dade ou Di sper so Visamdescreverosdadosnosentidodeinformarograudedispersoouafastamento dos valores observadosemtornodeumvalorcentralrepresentativochamadomdia.Informa seumconjuntodedadoshomogneo(poucavariabilidade)ouheterogneo(muita variabilidade). As medidas de disperso podem ser: - D esvioex tremo- amplitude Absoluta- D esvioMdio - D esvio Padro - D esvioquadrtico- V arincia 41 Paraestudarmosasmedidasdevariabilidadeparadadosnotabeladosusaremosum exemploprtico.Supomosqueumaempresaestejaquerendocontratarumfuncionrio,eno finaldaconcorrnciasobraram dois candidatos para uma nica vaga. Ento foi dado 4 tarefas para cada um, onde as mesmas tiveram como registro o tempo (em minutos) de execuo. TAREFAS1234 OPERRIO 1 (TEMPO)55455248 OPERRIO 2 (TEMPO 30704060 - Anlise Grfica - Medidas de disperso Absoluta: - Desvio Extremo ou Amplitude de Variao (H):adiferenaentreomaioreo menor valor de um conjunto de dados H X Xmax min - Desvio Mdio (d ): Em virtude do( ) niiX X10, usamos para calcular o desvio mdioX Xiin 01, assim ficando: Para dados no tabelados dX XnX X X X X Xniinn + + + 11 2... Para dados tabelados 42 ( ) + + + niin nniinii ifX X f X X f X X ffX X fd12 2 1 111... - Desvio Quadrtico ou Varincia : S2 (amostra) ou 2 (populao) Para dados no tabelados: ( )( ) ( ) ( )nX X X X X XnX Xnnii2 2221 122... + + + ( )( ) ( ) ( )1...12 2221 122 + + + nX X X X X XnX XSnnii Para dados tabelados ( )( ) ( ) ( ) + + + niin nniinii ifX X f X X f X X ffX X f12 22 221 11122... ( )( ) ( ) ( )1...112 22 221 11122 + + + niin nniinii ifX X f X X f X X ffX X fS 43 - Desvio Padro: S (amostra) ou (populao) Para dados no tabelados: ( )( ) ( ) ( )nX X X X X XnX Xnnii2 2221 12... + + + ( )( ) ( ) ( )1...12 2221 12 + + + nX X X X X XnX XSnnii Para dados tabelados ( )( ) ( ) ( ) + + + niin nniinii ifX X f X X f X X ffX X f12 22 221 1112... ( )( ) ( ) ( )1...112 22 221 1112 + + + niin nniinii ifX X f X X f X X ffX X fS (n-1)usadocomoumfatordecorreo,ondedevemosconsideraravarinciaamostralcomouma estimativa da varincia populacional. - Propriedades da Varincia 1) Somando-se ou subtraindo-se uma constante k a cada valor observado a varincia no ser alterada; 2)Multiplicando-seoudividindo-seporumaconstantekcadavalorobservadoavarinciaficar multiplicada ou dividida pelo quadrado dessa constante. Outra forma de calcular o desvio padro Odesviopadromedebemadispersodeumconjuntodedados,masdifcilde calcular. Ento, voc pode obter o desvio padro atravs da seguinte relao: 2dR ondeRaamplitudeeovalorded2,quedependedotamanhodaamostra,encontradona tabelaaseguir.Estemtododecalcularodesviopadroforneceboasestimativaspara amostrasdepequenotamanho(n= 4,5ou6),masperdeaeficinciasen> 10.Dequalquer 44 forma,essarelaoentreaamplitudeeodesviopadrode uma amostra que permite fazer grficos de controleR X . TABELA 1: - Fatores para construir um grfico de controle n234567891011121314 d21,1281,6932,0592,3262,5342,7042,8472,9703,0783,1733,2583,3363,407 n15161718192021222342425------ d20,3473,5323,5323,6403,6893,7353,7783,8193,8583,3913,391------ Fonte: Montgomery, D.C. Statical Quality Control. Nova York, Wyley.1991. 4.3 Medi das de Di sper so Rel at i va - V arinciarelativa Relativa - Coeficiente de V ariao (Pearson) a medida de variabilidade que em geral expressa em porcentagem, e tem por funo determinarograudeconcentraodosdadosemtornodamdia,geralmenteutilizadaparase fazeracomparaoentredoisconjuntosdedadosemtermospercentuais,estacomparao revelar o quanto os dados esto prximos ou distantes da mdia do conjunto de dados. - Varincia Relativa V RX. . 22 2ou S2 - Coeficiente de Variao de Pearson 100 xXSou. V . C C.V. 50% a mdia representativa C.V. 0 a maior representatividade da mdia (S =0) 4.4 Moment os, assi met r i a e cur t ose Asmedidasdeassimetriaecurtosecomplementamasmedidasdeposioede dispersonosentidodeproporcionarumadescrioecompreensomaiscompletadas distribuies de freqncias. Estas distribuies no diferem apenas quanto ao valor mdio e variabilidade, mas tambm quanto a sua forma (assimetria e curtose). 45 Para estudar as medidas de assimetria e curtose, necessrio o conhecimento de certas quantidades, conhecidas como momentos. 4.4.1 Momentos Somedidasdescritivasdecartermaisgeraledoorigemsdemaismedidas descritivas, como as de tendncia central, disperso, assimetria e curtose. Conforme a potncia considerada tem-se a ordem ou o grau do momento calculado. - Momentos simples ou centrados na origem (mr) O momento simples de ordem r definido como: nXmrir , para dados no tabelados; iirirff Xm ,para dados tabelados. onde: r um nmero inteiro positivo;m0 =1; m1 =mdia aritmtica. - Momentos centrados na mdia (Mr) O momento de ordem r centrado na mdia, definido como: ( )ndnX XMririr , para dados no-tabelados ( )nf dff X XMiriiirir , para dados tabelados onde:M0 =1; M1 =0; M2 =varincia (s2). 46 - Momentos abstratos (r) So definidos da seguinte forma: rrrsM onde: s =desvio padro. 4.4.2 Assimetria Umadistribuiodevaloressemprepoderserrepresentadaporumacurva(grfico). Essacurva,conformeadistribuio,podeapresentarvriasformas.Seconsiderarmosovalor da moda da distribuio como ponto de referncia, vemos que esse pont o sempre corresponde aovalordeordenadamxima,dando-nosopontomaisaltodacurvarepresentativada distribuio considerada, logo a curva ser analisada quanto sua assimetria. -DistribuioSimtrica:aquelaqueapresentaaX MoMdeosquartisQ1eQ3 eqidistantes do Q2. X Mo Md - Distribuio Assimtrica Assimtrica Positiva Mo ' Teste Unilateral Direito HH0 01 0:: 30); - Se a varincia populacional 2 for desconhecida, a varivel teste ser "t" de Student com =n -1 (n 30). 3. Com o auxlio das tabelas "Z" e "t" determinar as regies RA e RR; ( a ) ( b ) ( c ) 1164. Calcular o valor da varivel: ZXncal 0tXSncal 0 onde:X = mdia amostral0 =valor da hiptese nula 5. Concluso para a situao ( a ) - Se + Z Z Zcal 2 2 ou + t t tcal 2 2, no se pode rejeitar Ho. - Se Z Z Z Zcal cal< > + 2 2 ou out t tcal cal< > + 2 2 ou t , rejeita-se Ho. OBS.: Para qualquer tipo de teste de significncia devemos considerar:-Seavarivelteste(calculada)cairdentrodaregiodeaceitao (RA) no se pode rejeitar Ho; - Se a varivel teste (calculada) cair fora da regio de aceitao (RA) rejeita-se Ho. Ex.:Osdoisregistrosdosltimosanosdeumcolgio,atestamparaoscalouros admitidosumanotamdiade115pontos(testevocacional).Paratestara hiptesedequeamdiadeumanovaturmaamesma,tirou-se, ao acaso, uma amostra de 20 notas, obtendo-se mdia 118 e desvio padro 20. Admitir = 5%, para efetuar o teste. (R =aceita-se Ho) 9.2.2 Teste de significncia para a proporo 1. Enunciar as hipteses: Ho : =po Hppp1000:>inf supou, rejeita-se Ho. Ex.:Paratestarahiptesedequeavarinciadeumapopulao25,tirou-seuma amostra de 25 elementos obtendo-se S2 =18,3. Admitindo-se =5%, efetuar o teste de significncia unicaudal a esquerda. (R =aceita-se Ho) 10.2.4 Teste de significncia para igualdade de duas mdias 1ocaso)Seasvarinciaspopulacionais2foremconhecidasesupostamenteiguais, independentes e normais, a varivel teste ser "Z" (n n 30)1+2> ; 1. Enunciar as hipteses: Ho : 1 =2 ou 1 - 2 =d H11 21 2: ' d 119 onde d a diferena admitida entre as duas mdias. 2. Fixar . Escolhendo a varivel normal padro "Z"; 3. Com o auxlio da tabela "Z" determinar as regies RA e RR; 4. Calcular o valor da varivel: ( )ZX X dn ncal +1 2121222 5. Concluso: Optar pela aceitao ou rejeio de Ho. Ex.:Umfabricantedepneusfazdoistipos.ParaotipoA,= 2500Km,eparao tipo B,= 3000Km.Umtaxitestou50pneusdotipoAe40pneusdotipoB, obtendo24000Kme26000Kmdeduraomdiadosrespectivostipos. Adotandoumriscode4%equeexisteumadiferenaadmitidade200Kmentre as marcas, testar a hiptese de que a vida mdia dos dois tipos a mesma.(R =rejeita-se Ho) 2ocaso)Seasvarinciaspopulacionais2foremdesconhecidas,independentese normais, a varivel teste ser "t" (n n 30)1+2 com =n1 +n2 -2; a) As estimativas diferentes 1. Enunciar as hipteses: Ho : 1 =2 ou 1 - 2 =d H11 21 2: ' d onde d a diferena admitida entre as duas mdias. 2. Fixar . Escolhendo a varivel "t" de Student; 3. Com o auxlio da tabela "t" determinar as regies RA e RR; 4. Calcular o valor da varivel: 120( )tX X dSnSncal +1 2121222 5. Concluses: Optar pela aceitao ou rejeio de Ho. Ex.: Dois tipos de pneus foram testados sob as mesmas condies meteorolgicas. O tipo A fabricado pela fabrica A, registrou uma mdia de 80.000 km rodados com desviopadrode5.000km.em6carrosamostradas.OtipoBfabricadopela fbrica B, registrou uma mdia de 88.000 km com desvio padro de 6.500 km em 12carrosamostradas.Adotando= 5%testarahiptesedaigualdadedas mdias. b) As estimativas iguais 1. Enunciar as hipteses: Ho : 1 =2 ou 1 - 2 =d H11 21 2: ' d onde d a diferena admitida entre as duas mdias. 2. Fixar . Escolhendo a varivel "t" de Student; 3. Com o auxlio da tabela "t" determinar as regies RA e RR; 4. Calcular o valor da varivel: ( )2 1c2 1caln1n1. Sd X Xt+ onde ( ) ( )Sn S n Sn nC + + 1 122 221 21 12 5. Concluses: Optar pela aceitao ou rejeio de Ho. Ex.: Dois tipos de tintas foram testados sob as mesmas condies meteorolgicas. O tipoAregistrouumamdiade80minparasecagemcomdesviopadrode5 min.emcincopartesamostradas.OtipoB,umamdiade83mincomdesvio padro de 4 min. em 6 partes amostradas. Adotando =5% testar a hiptese da igualdade das mdias.(R=aceit a-se Ho) 1219.2.5 Teste de significncia para igualdade de duas propores 1. Enunciar as hipteses: H : o 1=2 H1 1 2: 2. Fixar . Escolhendo a varivel normal padro "Z"; 3. Com o auxlio da tabela "Z" determinar as regies RA e RR; 4. Calcular o valor da varivel: Zp pp qncal $ $$ . $1 21 2 1 2onde $ , $ , $ pp1 2 ++XnXnpX Xn n11221 21 21 2 5. Concluses: Optar pela aceitao ou rejeio de Ho. Ex.:Deseja-setestarsesoiguaisasproporesdehomensemulheresquelem revistaeselembramdodeterminadoanncio.Soosseguintesosresultadosda amostra aleatria independente de homens e mulheres: Admita =10%. HomensMulheres X1 =70 n1 =200 X2 =50 n2 =200 9.2.6 Teste de significncia para igualdade de duas varincias 1. Enunciar as hipteses: H : 0 1222 H :1 1222 2.Fixar.Escolhendoavarivel"F"com1= n1-1grausdeliberdade no numerador, e 2 =n2 - 1 graus de liberdade no denominador. 3. Com o auxlio da tabela "F" determinar as regies RA e RR; ( ) F Fsup, 1 2 ( )( )F FFinf,, 1 1 22 11 122 4. Calcular o valor da varivel: FSScal 1222 5. Concluses: Optar pela aceitao ou rejeio de Ho. Ex.:Doisprogramasdetreinamentodefuncionriosforamefetuados.Os21 funcionriostreinadosnoprogramaantigoapresentaramumavarinciade146 pontosemsuataxadeerro.Nonovoprograma,11funcionriosapresentaram umavarinciade200.Sendo=10%,pode-seconcluirqueavarincia diferente para os dois programas? 9.3 Exer cci os 1) O crescimento da indstria da lagosta na Flrida nos ltimos 20 anos tornou esse estadoamericanoo2omaislucrativocentroindustrialdepesca.Espera -se que uma recente medida tomada pelo governo das Bahamas, que proibiu os pescadores norteamericanosdejogaremsuasredesnaplataformacontinentaldessepas. ProduzaumareduonaquantidadedeKgdelagostaquechegaaosEstados Unidos.Deacordocomndicespassados,cadaredetrazemmdia14Kgde lagosta. Uma amostra de 20 barcos pesqueiros, recolhida aps a vigncia da nova lei, indicou os seguintes resultados, em Kg (Use =5%) 7.8913.2917.9615.68.89 15.2816.8719.6818.9112.47 10.939.575.5311.5710.02 8.5717.9610.7919.5911.06 Estesdadosmostramevidnciassuficientesdeestarocorrendoumdecrscimona quantidade mdia de lagostas pescadas por barco, que chega aos Estados Unidos, depoisdodecretodogovernodasBahamas?Testeconsiderando=5%. (bilateral) 2)Osresduosindustriaisjogadosnosrios,muitasvezes,absorvemoxignio, reduzindoassimocontedodooxignionecessriorespiraodospeixese outrasformasdevidaaqutica.Umaleiestadualexigeummnimode5p.p.m. (Partespormilho)deoxigniodissolvido,afimdequeocontedo de oxignio seja suficiente para manter a vida aqutica. Seis amostras de gua retiradas de um rio, durante a mar baixa, revelaram os ndices (em partes por milho) de oxignio dissolvido: 1234.95.14.95.55.04.7 Estes dados so evidncia para afirmar que o contedo de oxignio menor que 5 partes por milho? Teste considerando =5% e =1%. 3)ADebugCompanyvendeumrepelentedeinsetosquealegasereficientepelo prazode400horasnomnimo.Umaanlisede90itensaleatoriamente inspecionados acusou uma mdia de eficincia de 380 horas. a) Teste a afirmativa da companhia, contra a alternativa que a durao inferior a 400 horas, ao nvel de 1%, seu desvio padro de 60 horas.b) Repita o teste, considerando um desvio padro populacional de 90 horas. 4)Aofinalde90diasdeumdietaalimentarenvolvendo32pessoas,constatou-se o seguinte ganhos mdio de peso 40 g, e desvio padro de 1,378g. a) Supondo que o ganho de peso mdio dessas pessoas de 45 g, teste a hiptese para =5%, se esse valor o mesmo (bilateral) b)Supondoqueavarinciadessaspessoasde1.8g2, teste a hiptese para = 5%, se esse valor o mesmo (bilateral). 5)Uma pesquisafeitaalegaque15%dospessoasdeumadeterminadaregiosofrem de cegueira aos 70 anos. Numa amostra aleatria de 60 pessoas acima de 70 anos constatou-se que 12 pessoas eram cegas. Teste a alegao para =5% contra p >15%. 6)Atabelaabaixomostraaquantidadedepessoasqueobtiveramomelhorefeito perante a aplicao de duas drogas: Droga ADroga B SexomuscularintravenosamuscularTotal Masculino21102253 Feminino20122557 Total412247110 a)TestarahiptesedequeaproporodehomenssubmetidosadrogaAde35%, sendo =3%. b) Testar a hiptese de que a proporo dos adultos que tiveram melhor resultado nas aplicaes musculares de 85%, usando = 2%.c) Testar a hiptese de que a proporo de mulheres de 50%, usando =5%. d)TestarahiptesedequeaproporodepessoassubmetidosadrogaAde65%, usando =4%. 7) Um processo de fabricao de arame de ao d um produto com resistncia mdia de200psi.Odesviopadrode20psi.Oengenheirodecontroledequalidade desejaelaborarumtestequeindiquesehouveounovariaonamdiado 124processo, usando uma amostra de 25 arames obteve-se uma mdia de 285 psi. Use um nvel de significncia de 5%. Suponha normal a populao das resistncias. 8)ADeBugCompanyvendeumrepelenteparainsetosquealegasereficientepelo prazode400horasnomnimo.Umaanlisede9itensescolhidosaleatoriamente acusouumamdiadeeficinciade380horas.a)Testeaalegaodacompanhia, contraaalternativaqueaduraoinferiora400horasnomnimoaonvelde 1%, e o desvio padro amostral de 60 horas. b) Repitas o item (a) sabendo que o desvio padro populacional de 90 horas. 9)UmlaboratriodeAnlisesClnicasrealizouumtestedeimpurezasem9pores deumdeterminadocomposto.Osvaloresobtidosforam:10,32;10,44;10;56; 10,.60;10,63;10,67;10,7;10.73;10,75mg.a)estimaramdiaeavarinciade impurezasentreaspores.b)Testarahiptesedequeamdiadeimpurezade 10.4, usando= 5%.c)Testarahiptesedequeavarinciaumusando = 5%. 10)Umaexperinciatemmostradoque40%dosestudantesdeumaUniversidade reprovamempelomenos5disciplinascursadanafaculdade.Se40de90 estudantesfossemreprovadosemmaisde5disciplinas,poderamosconcluir quanto a proporo populacional, usando =1%. 11)Paraverificaraeficciadeumanovadrogaforaminjetadosdosesem72ratos, obtendo-se a seguinte tabela: SexoTamanho da AmostraVarincia Machos4143.2 Fmeas3129.5 Testar a igualdade das duas varincias usando =10%. 12) Sendo Amostra 1 n1 =60 X1 =5.7112 =43 Amostra 2 n2 =35 X2 =4.1222 =28 a) Testar a igualdade das duas mdias usando = 4%. b) Testar a igualdadedas duas varincias usando =5% 12513)Natabelaabaixoestoregistradososndicesdevendasem6supermecadospara osprodutosconcorrentesdamarcaAemarcaB.Testarahiptesedequea diferena das mdias no ndice de vendas entre as marcas zero, usando = 5%. SupermercadoMarca AMarca B 1144 22016 3228 4119 5531 61210 14) Da populao feminina extraiu-se uma amostra resultando: Renda (em $1000)10 | ---2525 | ---4040 | ---5555 | ---7070 | ---85 No de mulheres7121064 da populao masculina retirou-se uma amostra resultando: Renda (em $1000)10 | ---2525 | ---4040 | ---5555 | ---7070 | ---85 No de homens8151273 a)Testaraonvelde10%ahiptesedequeadiferenaentrearendamdiados homens e das mulheres valha $ 5000. b) Testar ao nvel de 5% a hiptese de que a diferena entre as varincias valha 0. 15)Umaempresadepesquisadeopinioseleciona,aleatoriamente,300eleitoresde So Paulo e 400 doRiodeJaneiro,eperguntaacadaumsevotarounonum determinadocandidatonasprximaseleies.75eleitoresdeSPe120doRJ responderam afirmativo. H diferena entre as propores de eleitores favorveis ao candidato naqueles dois estados? use =5%. 16)Estoemtestedoisprocessosparafecharlatasdecomestveis.Numaseqncia de1000latas,oprocesso1gera50rejeies,enquantooprocesso2acusa200 rejeies. Pode ao nvel de 5%, concluir que os dois processos sejam diferentes? 9.4 Test e do Qui - quadr ado 2 Anteriormentefoitestadohiptesesreferentesaumparmetropopulacionalou mesmoacomparaodedoisparmetros,ouseja,soostestesparamtricos.Agoraser testadoaquelesquenodependemdeumparmetropopulacional,nemdesuasrespectivas estimativas. Este teste chamado de teste do Qui-quadrado. OtestedoQui-quadradousadoquandose quer comparar freqncias observadas com freqncias esperadas. Divide-se em trstipos:126 - Teste de adequao do ajustamento - Teste de Aderncia - Teste de Independncia (Tabela de Contingncia) 9.4.1 Procedimentos para a realizao de um teste Qui-quarado (2) 1o) Determinao das Hipteses: Ho: Fo =FeH1: Fo Fe 2o) Escolha do Nvel de Significncia () 3o) Estatstica Calculada ( ) k1 ie2e o 2calFF F 4o) Estatstica Tabelada: tab2 2, 5o) Comparar o cal2 comtab2 e concluir: 6o) Concluso: Se cal2 tab2 aceita -se Ho Se cal2 >tab2 rejeita-se Ho 1279.4.2 Teste de adequao do ajustamento Suponhamosumaamostradetamanhon.SejamE1, E2,...,Ek,umconjuntode eventos possveis da amostra. EventosFreq. Obs. E1 E2 : Ek Fo1 Fo2 : Fok Totaln Estetesteindicadoparaverificarseasfreqnciasobservadasdoskeventos(k classes em que a varivel dividida) concordam ou no com as freqncias tericas esperadas. Asfreqnciasesperadas(Fei)soobtidasmultiplicando-seonmerototalde elementos pela proporo terica da classe i (n. pi). Paraencontraro cal2,necessita-sedonveldeSignificncia()edosgrausde liberdade (), os quais podem ser obtidos da seguinte forma: 1o) =k - 1, quando as freqncias esperadas puderem ser calculadas sem que faam estimativas dos parmetros populacionais a partir das distribuies amostrais. 2o)= k-1-m,quandoparaadeterminaodasfreqnciasesperadas,m parmetrostiveremsuasestimativascalculadasapartirdasdistribuiesamostrais.Pearson mostrouque,seomodelotestadoforverdadeiroesetodasasFei5%,estasdeveroser fundidas s classes adjacentes. Ex1.: Deseja-se testar se o nmero de acidentes numa rodovia se distribui igualmente pelosdiasdasemana.Paratantoforamlevantadososseguintesdados(= 5%). Dia da SemanaDomSegTerQuaQuiSexSabNo de Acidentes33262122172036 Resoluo: Ho: As freqncias so iguais em todos os dias H1:As freqncias so diferentes em todos os dias 128 Dia da SemanaDomSegTerQuaQuiSexSabk =7 No de Acidentes33262122172036175 pi1/ 71/ 71/ 71/ 71/ 71/ 71/ 7--- Fe =n . pi25252525252525--- ( ) ( ) ( )122525 36...2525 262525 332 2 22calc+ ++ cal2 =12tab2 =5 6212 5%,. Concluso:Comoocal2 < tab2,aceita-seHo,ouseja,para=5%, as freqncias podem ser iguais. Ex2.:Onmerodelivrosemprestadosporumabibliotecadurantecertasemanaest aseguir.Testeahiptesequeonmerodelivrosemprestadosnodependemdodiada semana, com =1%. Dia da SemanaSegTerQuaQuiSex No de Livros110135120146114 R =cal2 =7.29 ;tab2 =1 4213 28%,. 9.4.3 Teste de aderncia usadaa estatstica2quandodeseja-setestaranaturezadadistribuioamostral. Por exemplo, quandosequerverificarseadistribuioamostralseajustaaumdeterminado modelodedistribuiodeprobabilidade(Normal,Poisson,Binomial,...),ouseja,verifica-se a boa ou m, aderncia dos dados da amostra do modelo. Ex1.:Onmerodedefeitosporunidadedeumaamostrade100aparelhosdeTV produzidos por uma linha de montagem apresentou a seguinte distribuio: No de Defeitos01234567 No de Aparelhos253518134221 Verificarseonmerodedefeitosporunidadeseguerazoavelmenteuma distribuio de Poisson, com =5%. Resoluo: Ho: A distribuio do no de defeitos/ unidade segue uma Poisson H1: A distribuio do no de defeitos/ unidade no segue uma Poisson 129 No de Defeitos01234567n No de Aparelhos253518134221100 pi0.2120.3290.2550.1320.0510.0160.0040.0011.000 Fe =n . pi21.232.925.513.25.11.6*0.4*0.1*100 Para calcular pi, temos: peiii! (Distribuio de Poisson) XX fni iin..1155 ( )212 . 0! 055 . 1 ep055 . 10 ( )051 . 0! 455 . 1 ep455 . 14 ( )329 . 0! 155 . 1 ep155 . 11 ( )016 . 0! 555 . 1 ep555 . 15 ( )255 . 0! 255 . 1 ep255 . 12 ( )004 . 0! 655 . 1 ep655 . 16 ( )132 . 0! 355 . 1 ep355 . 13 ( )001 . 0! 655 . 1 ep655 . 17 * =Fei 5%, logo deve ser agrupada com a classe adjacente. ( ) ( ) ( )474 . 32 . 72 . 7 9...9 . 329 . 32 352 . 212 . 21 257 6 5 42 2 22calc+ ++ 43 42 1 ' ) X ( usados) s estimadore de (nmero 1 = mo) agrupament aps classes de (nmero 5 k 3 1 1 5 m 1 k tab2 =5 327 81%,. Concluso:Comoo cal2tab2,aceita-seHo, ou seja, para =5%, a distribuio do nmero de defeitos/ unidade pode seguir uma Distribuio de Poisson. 130Ex2.:Verificarseosdadosdasdistribuiodasalturasde100estudantesdosexo feminino se aproxima de uma distribuio normal, com =5%. Altura (cm)No de Estudantes Transf."Z"Prob (rea)Fe =n . pi 150 | ---156 156 | ---162 162 | ---168 168 | ---174 174 | ---180 180 | ---186 4 12 22 40 20 2 - | ----1.94 -1.94 | --- -1.04 -1.04 | --- -0.14 -0.14 | ---0.76 0.75 | ---1.66 1.66 | --- + 0.026 * 0.123 0.295 0.332 0.175 0.048 * 2.6 12.3 29.5 33.2 17.5 4.8 k =61001.000100.0 Resoluo: Ho: A distribuio da altura das estudantes do sexo feminino normal H1: A distribuio da altura das estudantes do sexo feminino no normal Para calcular pi, temos: ZxSi (Distribuio Normal Padro) XX fni iin..1168 96 ( )67 . 61 nX X . fSn1 ii i Z1156 168 966 671 94 ... Z4174 168 966 670 76 ... Z2162 168 966 671 04 ... Z5180 168 966 671 65 ... Z3168 168 966 670 14 ... ( ) ( ) ( ) ( )38 . 33 . 22) 8 . 4 5 . 17 ( ) 2 20 (2 . 332 . 33 405 . 295 . 29 229 . 14) 3 . 12 6 . 2 ( ) 12 4 (6 52 2 22 122calc+ +++++ + 4 4 4 4 3 4 4 4 4 2 1 4 4 4 4 3 4 4 4 4 2 1 =k - 1 - m =4 - 1 - 2 =1 ' (S) ) X ( usados) s estimadore de (nmero 2 = mo) agrupament aps classes de (nmero 4 k tab2 =5 123 84%,. Concluso:Comoocal2 tab2, aceita-seHo, ou seja, para =5%,adistribuioda altura das estudantes do sexo feminino normal. 1319.4.4 Tabelas de contingncia Teste de independncia Uma importante aplicao do teste 2ocorre quandosequerestudararelaoentre duasoumaisvariveisdeclassificao.Arepresentaodasfreqnciasobservadas,nesse caso, pode ser feita por meio de uma tabela de contingncia. Ho: As variveis so independentes (no esto associadas) H1: As variveis no so independentes (esto associadas) Onmerodegrausdeliberdadedadopor: = (L- 1) (C-1),ondeLonmero de linhas e C o nmero de colunas da tabela de contingncia. ( ) k1 ie2e o 2calFF F ( )( )s observae de totalj coluna da soma i linha da somaFeij Obs.:Emtabelas2x2temos1graudeliberdade,porissoutiliza -seacorreode Yates, onde para n 50 pode ser omitida. O teste do 2 no indicado em tabelas 2 x 2 nos seguintes casos: i) quando alguma freqncia esperada for menor que 1; ii) quando a freqncia total for menor que 20 (n 20); iii)quandoafreqnciatotal(20 n 40) e algumas freqncias esperadas for menor que 5. Neste caso aplica-se o teste exato de Fischer. Ex.: Verifique se h associaoentreosnveisderendaeosmunicpiosondeforam pesquisados 400 moradores. Use = 1%. MunicpioNveis de Renda ABCD X Y 28 44 42 78 30 78 24 76 Ho: As variveis so independentes H1: As variveis so dependentes ABCDTotal (l ) X Y 28 44 42 78 30 78 24 76 124 276 Total (c) 72120108100400 Fxe11124 7240022 32 . Fxe21276 7240049 68 . 132Fxe12124 12040037 2 . Fxe22276 12040082 8 . Fxe13124 10840033 48 . Fxe23276 10840074 52 . Fxe14124 100400310 . Fxe24276 10040069 ( ) ( ) ( )81 , 56969 76...2 , 372 , 37 4232 , 2232 ,. 22 282 2 22calc+ ++ 34 , 1123 %; 12) 1 4 )( 1 2 ( %; 12tab Concluso:Comoocal2 tab2,aceita-seHo,ouseja,para =1%, as variveis so independentes. Uma medida do grau de relacionamento, associao ou dependncia das classificaes em uma tabela de contingncia dada pelo coeficient e de contingncia. Cncalcal+22 QuantomaiorovalordeC,maiorograudeassociao,OmximovalordeC dependerdonmerodelinhasecolunasdatabelaepodevariarde0(independncia)a1 (dependncia total). 9.5 Exer cci os 1) Verificar se os dados se a justam a uma distribuio de Poisson, =2.5%. No de Acidentes012345 No de Dias251910943 2) Testar para =5% se h alguma relao entre as notas escolares e o salrio. SalriosNotas Escolares AltaBaixaMdia Alto Mdio Baixo 18 26 6 5 16 9 17 38 15 R =aceita Ho 1333) Determine o valor do coeficiente de contingncia considerando os dados: =1%. SexoPartido AB Masculino Feminino 50 29 72 35 C = 4% 4)Comoobjetivodeinvestigararelaoentreasituaodoempregonomomento em que se aprovou um emprstimo e saber se o emprstimo est, agora, pago ou no,ogerentedeumafinanceiraselecionouaoacaso100clientesobtendoos resultados da tabela. Testeahiptesenuladequeasituaodeempregoeade emprstimo so variveis independentes, com =5%. Estado AtualSituao de Emprego do Emprst imoEmpregadoDesempregado Em mora Em dia 10 60 8 22 R =Aceita Ho 5) A tabelaindica o nmero mdio de acidentes por mil homens/ hora da amostra de 50firmasobtidasdeumaindstriaespecfica.Amdiadestadistribuiode 2.32eodesviopadrode0.42.Testeahiptesenuladequeasfreqncias observadas seguem uma distribuio normal, com =5%. No de AcidentesNo de Firmas 1.5 ---1.7 1.8 ---2.0 2.1 ---2.3 2.4 ---2.6 2.7 ---2.9 3.0 ---3.2 3 12 14 9 7 5 R=A ceita Ho Total50 6)Verifiqueseadistribuioseajustaanormal.(=5%),onde200casasdealuguel foram pesquisadas, obtendo-se a seguinte distribuio: Classes ($)freq. observada 250 | ---750 750 | --- 1250 1250 | --- 1750 1750 | --- 2250 2250 | --- 2750 2750 | --- 3250 3250 | --- 3750 3750 | --- 4250 4250 | --- 4750 2 10 26 45 60 37 13 5 2 Total200 1341 10 0R RE EG GR RE ES SS S O O E E C CO OR RR RE EL LA A O O 10.1 I nt r oduo Muitasvezesdeinteresseestudar-seumelementoemrelaoadoisoumais atributos ou variveis simultaneamente. Nessescasospresume-sequepelomenosduasobservaessofeitassobrecada elemento da amostra. A amostra consistir, ento, de pares de valores, um valor para cada uma das variveis, designadas, X e Y. Um indivduo i qualquer apresenta o par de valores (Xi ; Yi). Objetivo visado quando se registra pares de valores (observaes) em uma amostra, o estudo das relaes entre as variveis X e Y. Para a anlisederegressointeressamprincipalmenteoscasosemqueavariaode um atributo sensivelmente dependente do outro atributo. Oproblemaconsisteemestabelecerafunomatemticaquemelhorexprimea relao existente entre as duas variveis. Simbolicamente a relao expressa por uma equao de regresso e graficamente por uma curva de regresso. 10.2 Def i ni o Constitui uma tentativa de estabelecer uma equao matemtica linear que descreva o relacionamento entre duas variveis(uma dependente e outra independente). AequaoderegressotemporfinalidadeESTIMAR valores de uma varivel, com base em valores conhecidos da outra. Ex.: Peso x Idade; Vendas x Lucro; Nota x Horas de Estudo 10.3 Model o de Regr esso i i i+ x y + iy valor estimado (varivel dependente); ix varivel independente; coeficiente de regresso (coeficiente angular); coeficient e linear; i resduo. 13510.3.1Pressuposies Naregresso,osvaloresde"y"soestimadoscombaseemvaloresdadosou conhecidosde"x",logoavarivel"y"chamadavariveldependente,e"x"varivel independente. a) A relao entre X e Y linear (os acrscimos em X produzem acrscimos proporcionais em Y e a razo de crescimento constante). b) Os valores de X so fixados arbitrariamente (X no uma varivel aleatria). c) Y uma varivel aleatria que depende entre outras coisas dos valoresde X. d)ioerroaleatrio,portantoumavarivelaleatriacomdistribuionormal,commdia zeroevarincia 2. [ i ~N (0, 2)]. irepresentaavariaodeYquenoexplicadapela varivel independente X. e) Os erros so considerados independentes. Ex.: Vendas (x 1000) X Lucro (x100) Obs.12345678 Vendas201225305380560600685735 Lucro1720212325242727 10.3.1 Grfico (Diagrama de Disperso) Temcomofinalidadeajudarnadecisoseumaretadescreveadequadamenteouno o conjunto de dados. VendasLucro16182022242628150 250 350 450 550 650 750 850 Pelo grfico podemos observar que a possvel reta de regresso ter um coeficiente de regresso (coeficiente linear) positivo. 13610.4 Mt odo par a est i mao dos parmet ros e Asestimativasdosparmetros edadasporaeb,seroobtidasapartirde umaamostradenparesdevalores(xi, yi)quecorrespondemanpontosnodiagramade disperso. Exemplo: Omtodomaisusadoparaajustarumalinharet aparaumconjuntodepontos (x , y ),...,(x ,y )1 1 n n oMtodo de Mnimos Quadrados: Omtododosmnimosquadradosconsisteemadotarcomoestimativados parmetros os valores que minimizem a soma dos quadrados dos desvios. 10.4.1 Caractersticas 1a) A soma dos desvios verticais dos pontos em relao a reta zero; 2a) A soma dos quadrados desses desvios mnima. Os valores de "a" e "b" da reta de regresso$ y a x+b sero: an xyn x SSi=1n2i=1nxyxx

_,

x yxininin1 112 b y a x Para cada par de valores (xi , yi) podemos estabelecer o desvio: ) bx a ( y y y ei i i i i+ Parafacilitarosclculosdaretaderegresso,acrescentamostrsnovascolunasna tabela dada. Obs. Vendas Xi Lucro Yi 2iX Yi2 i iY . X120117404012893417 222520506254004500 330521930254416405 4380231444005298740 55602531360062514000 66002436000057614400 76852746922572918495 87352754022572919845 36911842011501431889802 137( ) ( )( )( ) ( )0159 , 03691 2011501 8184 3691 89802 8 x x ny x y x na2 2n1 iin1 = i2in1 iin1 iin1 = ii i

,_

15,66 = 1,38) (0,159)(46 - 23 = x a y b 15,66 + x0159 , 0 y Sada do Statistica VendasLucro16182022242628150 250 350 450 550 650 750 850y = 15,66 + 0,0159 x Partindodaretaderegressopodemosafirmarqueparaumavendade400mil podemos obter um lucro de$ ( . ) y(400.000) + 15.66=22 mil 0 0159 . Sadas do Statistica Obs.:Paraqualquertipodeequaoderegressodevemostermuitocuidadopara noextrapolarvaloresparaforadombitodosdados.Operigodaextrapolaoparafora dos dados amostrais, que a mesma relao possa no mais ser verificada. 13810.5 Decomposi o da var i nci a Tot al A disperso da variao aleatria y pode ser medida atravs da soma dos quadrados dosdesviosemrelaoasuamdiay .EssasomadequadradosserdenominadaSomade Quadrados Total (SQTotal). ( ) n1 i2iy y SQTotal A SQTotal pode ser decomposta da seguinte forma: ( ) ( ) ( ) + n1 i2i in1 i2in1 i2iy y y y y y Essa relao mostra que a variao dos valores de Y em torno de sua mdia pode ser dividida em duas partes: uma( )n1 i2iy y queexplicadapelaregressoeoutra( )n1 i2i iy y , devido ao fato de que nem todos os pontos esto sobre a reta de regresso, que a parte no explicada pela regresso ou variao residual. Assim: SQ. Total =SQRegresso +SQResduo Aestatsticadefinidapor SQTotalo a~Regress SQr2 ,edenominadacoeficientede determinao,indicaaproporooupercentagemdavariaodeYqueexplicadapela regresso. Note que 0 r2 1. Frmulas para clculo: SQTotal = ( )

,_

n1 i2n1 iin1 = i2i2iy y n y y , com (n - 1) graus de liberdade. SQ Regresso = ( ) ,_

n1 iin1 iin1 = ii in1 i2iy x y x n b y y , com (n - 2) graus de liberdade. 13910.6 Anl i se de Var i nci a da Regr esso ASomadeQuadradosdaRegresso(SQRegresso),segueumadistribuiode2 (qui-quadrado) com(1)graudeliberdade,enquantoqueaSomadeQuadradosdoResduo (SQResduos) segue a mesma distribuio, porm com (n-2)grausdeliberdade.Portanto,o quociente QMResiduoo a~QMRegress2 - Residuo/n SQo/1 a~Regress SQ , segue uma distribuio F de Snedecor com 1 e (n - 2) graus de liberdade. EssefatonospermiteempregaradistribuioFdeSnedecorparatestara significnciadaregresso,atravsdachamadaAnlisedeVarincia,sintetizadanoquadro abaixo: Anlise de Varincia Causas de Variao G.L.SQQMF Regresso1SQRegresso 1o a~QMRegress QMResiduoo a~QMRegress Resduon - 2SQResduo 2 - nQMResduo --- Totaln - 1SQTotal------ ondeQMrepresentaQuadradoMdioeobtidopeladivisodaSoma deQuadradospelos respectivos graus de liberdade. Para testar a significncia da regresso, formula-se as seguintes hipteses: H0: = 0 contra H1: 0, onde representa o coeficiente de regresso paramtrico. SeovalordeF,calculadoapartirdoquadroanterior,superarovalortericodeF com 1 e (n - 2) graus de liberdade, para o nvel de significncia , rejeita -se H0 e conclui -se que a regresso significativa. Se Fcalc. >F [1,(n-2)], rejeita-se H0. 140Para o exemplo anterior: Obs. Vendas iXLucro iY 2iX Yi2 i iY . X120117404012893417 222520506254004500 330521930254416405 4380231444005298740 55602531360062514000 66002436000057614400 76852746922572918495 87352754022572919845 36911842011501431889802 66 , 15 x 0159 , 0 yi i+ 1]1

n1 iin1 iin1 = ii iy x y x n a = o a~SQRegress ( ) [ ] 624,42 = ) 184 )( 3691 ( 89802 8 0,0159 = o a~SQRegress 2n1 iin1 = i2iy y n SQTotal ,_

688,00 = (184) - 8(4318) SQTotal2 Causas de Variao G.L.SQQMF Regresso1624,42624,4200058,93 Resduo663,5810,59587--- Total7688,00------ H0: =0 e H1: 0 Comparando o Fcalc. =58,93 com o Ftab. =F0,05 (1,6) =5,99 Conclui-sequearegressodey sobrex segundo o modelo66 , 15 x 0159 , 0 yi i+ significativaaonveldesignificnciade5%.Umavezestabelecidaetestadaaequaode regresso, a mesma pode ser usada para explicar o relacionamento entre as variveis e tambm para fazer previses dos valores de Y para valores fixados de X. 141Sadas do Statistica 10.7 Coef i ci ent e de Det er mi nao ( r ) o grau em que as predies baseadas na equao de regresso superam as predies baseadas em y, ou ainda a proporo entre a varincia explicada pela varincia total. Varincia Total =soma dos desvios ao quadrado VT =SQTotal = ( )

,_

n1 i2n1 iin1 = i2i2iy y n y y , Varincia No-explicada =soma de quadrados dos desvios em relao a reta$ y VE = ( )n1 i2i iy y Para facilitar os clculos usaremos: rn xyn x n y COVS S2 i=1n22i=1n2i=1nxyxx yy

_,

_,

1]11

_,

1]11 x yx yinininin1 11212. [ ][ ][ ]r8(89802) - (3691)(184)8(2011501) - (3691) 8(4318) - (184) 0.90822 2 2 Ovalordervariade0a1,logoofat oder= 0.908(noexemplo),indicaque aproximadamente 91% da variao do lucro esto relacionados com a variao das vendas, em outras palavras 9% da variao dos lucros no so explicados pelas vendas. 142Sadas do Statistica 10.8 Coef i ci ent e deCorrel ao ( r ) Temcomoobjetivoencontrarograuderelaoentreduasvariveis,ouseja,um coeficiente de correlao. Estaaformamaiscomumdeanlise,envolvendodadoscontnuos,conhecido como "r de Pearson ". 10.8.1 Caractersticas do r -Podeassumirvalorespositivos(+ )comonegativos(-),semelhanteaocoeficiente de regresso de uma reta ajustada num diagrama de disperso; - A magnitude de r indica quo prximos da "reta" esto os pontos individuais; - quando o r se aproxima de + 1 indica pouca disperso, e uma correlao muito forte e positiva; -quandoorseaproximade"zero"indicamuitadisperso,eumaausnciade relacionamento; -quandoorseaproximade-1indicapoucadisperso,eumacorrelao muito forte e negativa. 0-1 +10valor de r-0,5 +0,5NegativafortePositivaforteNegativamoderadaPositivamoderadaNegativafracaPositivafraca 14310.8.2 Medidas de Correlao 10.8.2.1 Tratamento Qualitativo (correlao momento produto) Relao entre as variveis, mediante a observao do diagrama de disperso. 10.8.2.2 Tratamento Quantitativo o estabelecimento das medidas de correlao. O valor de "r" pode ser enganoso, na realidade, uma estatstica mais significante o r (coeficiente de determinao), que d o valor percentual da variao de uma varivel explicativa em relao a outra varivel. yy xxxyn1 in1 = i2n1 in1 = i2n1 in1 in1 = iS . SS y y n x x ny x xy nr 1]1

,_

1]1

,_

,_

Logo podemos observar que o coeficiente de determinao nos d uma base intuitiva para a anlise de correlao. No exemplo temos r =0.95 3 Sada do Statistica Regression95% confid. LUCRO = 15,660 + ,01591 * VENDASCorrelao: r = ,95295 Vendas Lucro16182022242628150 250 350 450 550 650 750 850 14410.9 Exer cci os Para os dados abaixo: a) Construa um diagrama de disperso;b) Determine a reta de regresso; c) Faa uma anlise de varincia do modelo; d) Calcule o Coeficiente de Explicao;e) Calcule o Coeficiente de Correlao de Pearson; f) Interprete os resultados obtidos. X =1o Exame e Y =2o Exame Aluno12345678910 Exame 182848683888785838685 Exame 292919092878689909290 R = $ . yx+157. 25 0 79 ; r =53.29%; r =-0.73 X =horas de estudo e Y =Nota da Prova Aluno12345678 Horas245568910 Nota136687810 R =$ . yx+0.12 0 98 ; r =82.99%; r =+ 0.911 X =Seguro (x 1000 ) e Y =Renda (x100) Indivduo12345678 Seguro2016342327321822 Renda6461847088927277 R = $ . yx+40.08 1 50 ; r =74.3%; r =+ 0.86 X =Peso do Pai (kg) e Y =Peso do Filho (kg) Indivduo12345678910 Peso Pai65636764686270666867 Peso Filho68666865696668657167 R = $ . yx+35.48 0 48 ; r =40.58%; r =+ 0.637 1451 11 1R Re ef f e er r n nc ci ia as s B Bi i b b l l i i o oggr r f f i ic ca as s COSTANETO,P.L.O.;CYMBALISTA,M.(1994).Probabilidades.SoPaulo:Edgard Blucher. FONSECA, J.S.; MARTINS, G.A. (1993). Curso de estatstica. 4a ed. So Paulo: Atlas. LAPONNI,JuanCarlos(1997).EstatsticausandooExcel.SoPaulo:Lapponi Treinamento e Editora. MILONE, G.; ANGELINI, F. (1995). Estatstica aplicada. So Paulo: Atlas. SNEDECOR,G.W.;COCHRAM,W.G. (1989).StatisticalMethods. 8rded.Iowa:Iowa State University Press, 1989. WONNACOTT,T.H.;WONNACOTT,R.J.(1990).IntroductoryStatistics.NewYork. John wiley & Sons;