libro de geoestadistica i 2dra. parte. - teoria ok

Upload: joan-irvin

Post on 07-Jul-2015

309 views

Category:

Documents


2 download

TRANSCRIPT

Control de Calidad Aplicado a la IngenieraPg. 1 Ing Edmundo Alarcn CceresEstadstica Descriptiva CONCEPTOS BSICOS DE ESTADSTICA DESCRIPTIVA DISTRIBUCIONES UNIDIMENSIONALES. Introduccin. Una de las ramas de la Estadstica ms accesible a la mayora de la poblacin es la Descriptiva.Estapartesededicanicayexclusivamentealordenamientoy tratamiento mecnico de la informacin para su presentacin por medio de tablas yderepresentacionesgrficas,ascomodelaobtencindealgunosparmetros tilesparalaexplicacindelainformacin(Larios,1998).Adems,puedeser usado para comparar dos (2) caractersticas medibles sobre algunas personas en un grupo, para comparar grupos usando la misma caracterstica y comparar un grupo con el universo (Otto, 1987).La Estadstica Descriptiva, por lo general, no pasa a serunanlisismsprofundodelainformacin.Esunprimeracercamientoala informaciny,poresamismarazn,eslamaneradepresentarlainformacin ante cualquier lector, ya sea especialista o no. Sin embargo, lo anterior no quiere decir que carezca de metodologa o algo similar, sino que, al contrario, por ser un medioaccesiblealamayoradelapoblacinhumana,resultadesuma importancia considerar para as evitar malentendidos, tergiversaciones o errores. Lainformacindetodaclaseyenparticularprocedentedelosresultadosdela inspeccinydelaspruebas,debeserordenadaengruposoarreglos,detal maneraqueseaposibleobtenerlamejorrepresentacinpormediodeuna distribucindefrecuencias,medianteestadistribucines posiblecomprenderla magnituddelaexactitudyprecisindeunprocesoodeunacaractersticade calidad con respecto a una especificacin determinada. CONCEPTO GRAFICO

Mtodos de Anlisis Recolectar, organizar, resumir grandes conjuntos de datos. GRAFICOS: -Histogramas de Frecuencias. -Diagrama Tallos y Hojas. -Diagrama de Caja. Permite NUMERICOS: -Medidas de tendencia central. -Medida de Dispersin. -Medidas de Forma. Mediante Estadstica Descriptiva Control de Calidad Aplicado a la IngenieraPg. 2 Ing Edmundo Alarcn CceresEstadstica Descriptiva NMEROS RELATIVOS. Utilizandolosnmerosabsolutoscomobasedeanlisissepuededistorsionarla realidad,estonormalmenteocurrecuandoseusalafrecuenciaocantidadde casos de una categora de inters con motivo de comparacin sin hacer referencia del total. Esteapartadopretendemediantetcnicasdenmerosrelativos,facilitarlas herramientasnecesariasparapoderminimizaroeliminarlosanlisis distorsionados cuando se utilizan los nmeros absolutos sin tener en consideracin el tamao. Las tcnicas de los nmeros relativos a discutir sern: proporcin, por ciento, razn, tasa de cambio o por ciento de cambio y tasas.Proporcin. Comparaelnmerodecasosenunacategoradeintersdeunavariable especficaconeltamaototaldeladistribucindeloscasosdetodaslas categoras, incluyendo la categora de inters.Hay que resaltar que los casos de dichacategoradeintersformarpartedelnmerototaldecasosenla distribucintotal. Adems,cuandotodaslascategorasdeunavariablese expresan como proporcin (P), la suma de todas las (P) debe dar uno (1). Podemos entonces convertir cualquier categora en una proporcin(P), dividiendo elnmerodecasosofrecuencia(a)decualquiercategoradeintersporel nmerototaldecasosenladistribucindelavariableespecfica. Lanotacin expresada sera:

donde: -P=Proporcin -=Frecuencia, cantidad o nmero de casos. -a= Frecuencia,cantidadonmerodecasosdeunacategoradeintersde una variable especfica. -i=Frecuencia(s),cantidad(es)onmero(s)decaso(s)deotra(as) categora(as) de la misma variable especfica. -a + i =La suma de la frecuencia, cantidad o nmero de casos de la categora de inters con la(as) frecuencia(as) o nmero de casos de otra(as) categora(as) de la variable especfica. O sea, es el nmero total de casos en la distribucin de una variable especfica. Por Ciento. La expresin "por ciento" viene de la frase latina "per centum", y de ella se deriva lapalabra"porcentaje". Unsinnimoparaexpresarelporcientoesdistribucin porcentual. Elpropsitodeestemtodoesreflejarlafrecuencia(a)de ocurrencia deunacategora deinters porcadacien(100)casos. Cuandotodas las categoras de una variable se expresan como porcentaje del total, la suma de todoslosporcentajesdebedarcien(100)oaproximadoacien(100). Para Control de Calidad Aplicado a la IngenieraPg. 3 Ing Edmundo Alarcn CceresEstadstica Descriptiva calcularunporcentajemultiplicamoscualquierproporcinpor100. Lanotacin expresada sera:

donde: %=Por ciento; porcentaje; distribucin porcentual Razn. Comparadirectamenteelnmero decasosque caendentrodeunacategorade inters(porej.,hombres)conelnmerodecasosquecaendentrodeotra categora de inters (por ej. mujeres).Es un cociente que simboliza el resultado de comparar dos cantidades.As, se puede obtener una razn (R) de la siguiente manera,dondeaesigualalafrecuenciadeuna categoradeintersybes igual a la frecuencia de otra categora de inters.Como principio bsico hay que establecerqueelnumeradornoesunapartecomponentedeldenominador (Daniel,1985)comohemosnotadoenelmtododeproporcinyporciento. La notacin expresada sera: donde: R = Razn b= Frecuencia,cantidad o nmero de casos de otra categora de inters que se localiza en el denominador. Una pregunta bsica es qu categora va en el numerador y que categora va en el denominador.Veamos,siustedcomoinvestigadordeseabuscarenunlugary tiempoespecficocuntasmujeresexistenportantoshombres,estarausted planteandoculseralaraznmujervs.hombre. Laprimeracategoraquese mencionaendichoproblemaesmujerylasegundacategoramencionadaesel hombre. Porconsiguiente,lamaneracorrectaseratomarlaprimeracategora quesemencionacomonumeradorylasegundacategoracomodenominador (Snchez, 1992). El resultado final se lee en trminos de tantos de la categora que representa la a porcada1o100delacategoraquerepresentalab. Adems,cancelandolos factores comunes en el numerador y el denominador, es posible reducir la razn a suformamssimple,siempreycuandoaplique. Sintetizandopodemossealar que podemos resolver la razn por tres formas distintas: a. razn utilizando la constante de uno,b. razn utilizando la constante de cien, c. cancelando los factores comunes de la razn. Cambio Porcentual. El cambio que puede ocurrir en un perodo dado puede reflejar un aumento o una disminucin. Elintersdeestemtodoesestablecercuntorepresenta porcentualmente ese aumento o disminucin.Permite determinaren cunto por cientohamermado(oaumentado)unfenmenoentredospuntosdereferencia Control de Calidad Aplicado a la IngenieraPg. 4 Ing Edmundo Alarcn CceresEstadstica Descriptiva (Snchez,1992). Alcomputarlatasadecambiooporcientodecambio comparamos el cambio real entre el evento ms reciente en un tiempoa contra el evento menos reciente en otro tiempo b, sirviendo como base el evento menos reciente tiempo b. La notacin expresada sera:

donde:% = Cambio porcentual o tasa de cambio. tiempo a = es el valor, frecuencia o cantidad que esta ubicado en el tiempoms reciente. tiempob=eselvalor,frecuenciaocantidadqueestaubicadoeneltiempomenos reciente. Tasas. Paramedirelriesgodequeocurrauneventodado(esdecir;divorcio; matrimonios;homicidios;suicidios;autoshurtados;criminalidad;desempleo; natalidad; entre otros) en una poblacin y poder hacer comparaciones vlidas, se deberelacionareseeventoconlapoblacinenlacualaconteciopuede acontecer (Snchez, 1992; Guerrero, et. al., 1981).Esa relacin se conoce con el nombredetasas. Lamismaserefiereaaquellosclculosqueimplicanla probabilidaddelaocurrenciadealgnevento(Daniel,1985),mediantelas comparaciones entre el nmero de casos reales y el nmero de casos potenciales (Levin,1979).Es preciso sealarquetantoel numerador(casosreales)comoel denominador (casos potenciales) deben referirse al mismo lugar, al mismo lapso o tiempo de ocurrencia y al mismo grupo de poblacin.Las tasas pueden ser crudas (brutas, globales), cuando los eventos se refieren a la poblacin total, incluyendo elementos que no son afectados por el evento; y especficas, cuando se refiere a unapartedelamisma. Unatasapuedehacersetanespecficasiemprequesus elementos se identifiquen con toda claridad.La notacin expresada sera:

Donde: T = Tasas casosreales=Lafrecuenciaconlacualhaocurridouneventodurantealgn perodo y lugar especfico. casospotenciales=Elnmerodepersonasexpuestasalriesgodel evento durante el mismo perodo y lugar especfico. k=Elpropsitodelmultiplicadork,llamadobase,esevitarresultadosque comprendan nmeros muy pequeos,que puedan surgiren el clculo de tasas,y facilitarlacompresindeestaltima. Elvalorelegido parakdependerde las magnitudesdelnumeradoryeldenominador.Algunaskparalatasaestn preestablecidas como variables de salud (1,000); variables de economa (10,000); variables de criminalidad (100,000). Control de Calidad Aplicado a la IngenieraPg. 5 Ing Edmundo Alarcn CceresEstadstica Descriptiva Loscasosrealeseslacantidadofrecuenciaconquehaocurridounevento normalmente son fciles de encontrar si estn registradas.Ejemplo del mismo son lasactasdedefunciones,losnacimientos,matrimonios,divorcios,registro electoral,autoshurtados,delitotipoI,suicidios,homicidios,empleos, desempleos,entreotros. Estoseventossonregistradossistemticamente,ypor ende, podemos tener acceso a dichos totales. Loscasospotenciales,esdecir,elnmerodepersonasexpuestasalriesgodel eventodeintersesenocasionesmsdifcildeencontrar. Porejemplo,si nuestrointerscomoinvestigadoresanalizarlatasadenacimientos paraelao 2002 tendramos que tener los siguientes elementos;porun lado los casos reales (nacimientos ocurridos en el 2002) y los casos potenciales (la poblacin expuesta a eseevento). Parabuscarloscasospotencialessedebeestablecerquepoblacin estaexpuestaaleventodeinters(nacimientos). Notodalapoblacinestuvo expuestaaleventodenacimientos. Sonlasmujeresynoloshombreslasque estnexpuestasaleventodelosnacimientos. Esdecir,sonellaslasquetienen nios(as)yporlotanto,lapoblacinfemeninaeslamsexpuestaalos nacimientos. Estainformacindelapoblacinfemeninaestadisponible,porlo que es fcil de obtener. Como nota aclaratoria, si se insiste en calcular una tasa y enloscasospotencialesseincluyenelementos(poblaciones)quenoestn expuestosalevento,losresultadossedenominascomotasasbrutas. Esdecir,si calculamosunatasadenatalidadyloscasospotencialesincluimosmujeres (expuestasalevento)yhombres(noexpuestosalevento),entoncesloquese encontrfueunatasabrutadenatalidad.Hayquedistinguirentrelasmujeres queestnenlaedadreproductivavs.lasquenoestnenlaedad reproductiva. Porconsiguiente,lapoblacinconmayorexposicinaleventode nacimientos es el sector femenino en edad reproductiva, o sea, mujeres entre 15 a49aos.Sinningnproblema,estainformacindelapoblacinfemeninapor edades esta disponible por lo que es fcil de obtener. No olvidemos que mientras ms depurada tengamos los casos potenciales mejor ser la impresin ofrecida por el valor calculado. TABLAS ESTADSTICAS. Apartirdeestemomentonosvamosaocupardelasestadsticasdeunasola variable, "Estadsticas Unidimensionales". Las tablas estadsticas segn el nmero deobservacionesysegnelrecorridodelavariableestadstica,setienenlos siguientes tipos de tablas estadsticas: 1.- Tablas tipo I. Cuandoeltamaode lamuestra yelrecorrido dela variable son pequeos,por ejemplo si tenemos una muestra de las edades de 5 personas,porlo que no hay quehacernadaespecialsimplementeanotarlasdemaneraordenadaenfilaso columnas. Edad de los 5 miembros de una familia:5, 8, 16, 38, 45 aos. 2.- Tablas tipo II. Control de Calidad Aplicado a la IngenieraPg. 6 Ing Edmundo Alarcn CceresEstadstica Descriptiva Cuandoeltamaodelamuestraesgrandeyelrecorridodelavariablees pequeo, por lo que se tienen valores de la variable que se repiten. Por ejemplo, si preguntamos el nmero de incidentes que ocurrieron en 50 semanas obtenemos la siguiente tabla: 2122124211232111342222121 1132232312421411343222133 Podemos observar quela variable toma valores comprendidos entre 1 y 4, por lo queserequieredeunatabla,enlaquesetienequeresumirestosdatos, quedando de la siguiente manera la tabla: No. de IncidentesNmero de semanas 116 220 39 45 Total50 3.- Tablas tipo III. Cuando el tamao de la muestra y el recorrido de la variable son grandes, por lo que ser necesario agrupar en intervalos los valores de la variable. Por ejemplo si a un grupo de 30 alumnos les preguntamos el dinero que en ese momento llevan encima, nos encontramos con los siguientes datos: 4501152250300175802526806057851595230050001200100 518020067550037515002059851851253154255601100 Evidentemente, la variable estadstica tiene un recorrido muy grande, 5000 soles, queeselmsalto,porloquesqueremoshacerunatablaconestosdatos tendremosquetomarintervalos.Paradecidirla amplituddelosintervalos,necesitaremosdecidir cuntosintervalosqueremos?.Normalmentese sueletrabajarconnomsde10o12intervalos, por lo que la amplitud ser a: Amplitud =5000/10 = 500,deestamaneratomaremosintervalosde amplitud 500 Debemostenerencuentalassiguientes consideraciones: -Tomarpocos intervalos implica que la "prdida de informacin" sea mayor. -LosintervalossernsiempreCerradosporla izquierda y Abiertos por la Derecha [ Li-1 , Li ) Procuraremosqueenladecisindeintervaloslos valores observados no coincidan con los valores de losextremosdelintervaloysiestoocurrequeno sea en ms de un 5% del total de observaciones, as tendremos la siguiente tabla: [ Li-1 - Li )Frecuencia [ 5 - 505)17 [ 505 - 1005)5 [ 1005 - 1505)4 [ 1505 - 2005)1 [ 2005 - 2505)1 [ 2505 - 3005)1 [ 3005 - 3505)0 [ 3505 - 4005)0 [ 4005 - 4505)0 [ 4505 - 5005)1 E30 Control de Calidad Aplicado a la IngenieraPg. 7 Ing Edmundo Alarcn CceresEstadstica Descriptiva Tcnicas de recuento. Aunquehoyenda,siserealizaunestudioestadsticoimportanteestatareala realizaelordenador,yaseapormediodeprogramasdeestadsticaespecficos BMDP,SPSS,obienutilizandoherramientasinformticasdepropsitogeneral comoBasesdeDatosuHojasdeClculo.Alolargodelcurso,veremoscomo mediante hojas de clculo o bases de datos podemos realizar este recuento. Veamoscomorealizaramosesteprocesomanualmente,paraelloveremos diversas tcnicas de ir anotando las puntuaciones; aunque el mtodo ms utilizado o conocido sea el primero, quizs el ms cmodo de utilizar es el 2 en la mayora de los casos. Tipos de Frecuencia. Unadelosprimerospasosqueserealizanencualquierestudioestadsticoesla tabulacinderesultados,esdecir,recogerlainformacindelamuestraresumida enunatabla,enlaqueacadavalordelavariableseleasociandeterminados nmeros que representan el nmero de veces que se ha encontrado, su proporcin conrespectoaotrosvaloresdelavariable,estosnmerossedenominan frecuencias: As tenemos los siguientes tipos de frecuencia: a)Frecuencia absoluta. La frecuenciaabsolutadeunavariableestadsticaeselnmerodevecesque aparece en la muestra, dicho valor de la variable la representaremos por ni b)Frecuencia relativa. Lafrecuenciaabsoluta,esunamedidaqueestinfluidaporeltamaodela muestra, al aumentar el tamao de la muestra aumentar tambin el tamao de lafrecuenciaabsoluta.Estohacequenoseaunamedidatilparapoder comparar.Para esto esnecesariointroducir elconcepto defrecuenciarelativa, queeselcocienteentrelafrecuenciaabsolutayeltamaodelamuestra.La denotaremos por fi Donde N = Tamao de la muestra c)Frecuencia Absoluta Acumulada. Parapodercalcularestetipodefrecuenciashayquetenerencuentaquela variableestadstica hadesercuantitativa ocualitativaordenable.Enotrocaso notienemuchosentidoelclculodeestafrecuencia.Lafrecuenciaabsoluta acumulada de un valor de la variable, es el nmero de veces que ha aparecido en la muestra un valor menor o igual que el de la variable; y lo representaremos por Nk. ==kii kn N1Nnfii =Control de Calidad Aplicado a la IngenieraPg. 8 Ing Edmundo Alarcn CceresEstadstica Descriptiva d)Frecuencia Relativa Acumulada. Al igual que en el caso anterior la frecuencia relativa acumulada es la frecuencia absoluta acumulada dividido por el tamao de la muestra, denotaremos por Fi e)Porcentaje. Lafrecuenciarelativaesuntantoporuno,sinembargo,hoydaesbastante frecuente hablar siempre en trminos detantos por ciento o porcentajes, por lo queestamedidaresultademultiplicarlafrecuenciarelativapor100.La denotaremos por pi. f)Porcentaje Acumulado. Anlogamentesedefineel PorcentajeAcumuladoylovamosadenotarporPi como la frecuencia relativa acumulada por 100. Ladistribucindefrecuenciaeslarepresentacinestructurada,enformadetabla (ver tabla 1.1), de toda la informacin que se ha recogido sobre la variable que se estudia en la muestra o poblacin original, y la forma secuencial como se construye la tabla es la siguiente: PROCESO DE CONSTRUCCIN DE DEL CUADRO DE DISTRIBUCIN DE FRECUENCIAS Obtencin de datos de la muestra Determinar el valor mnimo y mximo de la muestra, utilizando los valores Determinar el rango (max-min) Obtener el nmero de clases utilizando la regla de Sturges. No. de clases = 1+3.33 * Log n Determinar el Ancho de clase o Amplitud:C = Rango / # clases Determinar los intervalos de clases y proceso de conteo Construir Histograma de Frecuencia Construir tabla de frecuencia, incluyendo frecuencias como:ni, fi, Ni, Fi, Yi, pi, Pi Tabla 1.1.-Componentes de la tabla de frecuencias. Intervalo de Clases (xi) Conteo Frecuencias Frecuencias Absoluta (ni)Acumulada (Ni )Relativa (fi)Acumulada (Fi) [X1 X2)|||n1n1f1 = n1 / nf1 [X2 X3)||||n2n1 + n2f2 = n2 / nf1 + f2 ............... [Xn-1 Xn)||nn-1n1 + n2 +..+ nn-1f n-1 = nn-1 / nf1 + f2 +..+ f n-1 EEnnE nfn = ni / nE f Siendo X los distintos valores que puede tomar los intervalos de clases.Siendo n el nmero de veces que se repite en cada valor.Siendo f el porcentaje que la repeticin de cada valor supone sobre el total== =kii kiif FNNF1% 100 - =i if p% 100 - =i iF PControl de Calidad Aplicado a la IngenieraPg. 9 Ing Edmundo Alarcn CceresEstadstica Descriptiva Ejemplo:Seanalizaranmedidasderesistenciaalarupturade58muestrasde monofilamento,utilizadoparalafabricacinderedes.Paradichoanlisissehar usodetecnologacomputacional,utilizandolasherramientasestadsticas;por tanto, para los resultados se analizaron los datos originales, con el fin de observar elpatrn del comportamiento dedichavariable mediantesuhistogramaytabla de frecuencia. Los datos de resistencia se muestran en la siguiente tabla: 66.474.272.171.270.370.3 69.267.774.572.271.371.3 70.069.368.075.372.372.4 71.070.169.368.068.368.4 71.971.170.269.569.569.6 70.870.670.670.570.470.9 71.871.771.671.671.571.8 73.373.172.972.772.673.5 69.169.068.968.868.6 70.069.969.869.869.7 Presentacin Grafica de Cuadros de Distribucin de Frecuencias.- Laconstruccindelhistogramaylasotrasgraficasrepresentativassedeterminan utilizando lasherramientas de anlisis de datos de Excel.1.-Histogramas.Eldiagramadebarraograficodebarra,sonrectngulos verticales en donde sus lados son el lmite inferior y superior de cada clase y cuya altura de cada uno de ellos es igual a la frecuencia de clase (ni / fi). 2.- Polgono de Frecuencias.- Es una grafica lineal que muestra la variacin de los datos segn la distribucin de clases en variables continuas, las marcas de clase se ubicanenelejedelasabscisasylasfrecuenciasenlasordenadas;cuandola variacintienecausales fundamentales quevan permaneciendoconstantesrecibe ennombredevariacininherente;paraformarunafiguracerradasegeneralos puntos extremos: (Yi C, 0 ) y (Yk + C, 0 ). H i s t o g r a m a d e F r e c u e n c i a024681 01 21 41 61 866.3 - 67.667.6 - 68.968.9 - 70.270.2 - 71.571.5 - 72.872.8 - 74.174.1 - 75.4N u m e r o d e c l a s e sFrecuenciF r e c u e n c i aControl de Calidad Aplicado a la IngenieraPg. 10 Ing Edmundo Alarcn CceresEstadstica Descriptiva 3.- Grafica de Frecuencias Acumuladas.- Es una grafica lineal, donde se muestra lasumatoriadelasfrecuenciasdecadaclase,aestarepresentacingrafica tambin se le conoce con el nombre de ojiva. MEDIDAS ESTADSTICAS. Introduccin. En el resto del tema nos ocuparemos exclusivamente de las variables cuantitativas, puesto que con los atributos no se pueden realizar operaciones aritmticas. Como sehaestudiado,lasvariablesestadsticascuantitativassedividenoclasificanen discretasycontinuas,porloquenecesitaremosprecisarcmosecalculandichas medidas en cada caso. 00.050.10.150.20.250.366.95 68.25 69.55 70.85 72.15 73.45 74.75FrecuenciaMarcas de ClasePoligono de FrecuenciasSeries1010203040506070FrecuenciaNumero de ClasesOjivaFrecuencuaControl de Calidad Aplicado a la IngenieraPg. 11 Ing Edmundo Alarcn CceresEstadstica Descriptiva Enlasvariablescuantitativascontinuas,dadoquelatabulacindelosdatosse hacemedianteintervalos,necesitaremostomarunvalordelintervaloparapoder operar. Este valor se denomina marca de clase y es el punto medio del intervalo. Lasmedidasestadsticaspretenden"resumir"lainformacindela"muestra"para poder tener as un mejor conocimiento de la poblacin, para un estudio ordenado y claro, se tienen los siguientes tipos: TIPOS DE MEDIDA. A.- MEDIDAS DE CENTRALIZACIN. Aunque se organicen los datos en una forma til y significativa es preciso disponer delosdatosdeformatalquepuedanpresentarseproposicionescuantitativas (Haber y Runyon, 1992). Una forma til de describir a un grupo en su totalidad es encontrar un nmero que lo represente (Levin, 1979). Se ha observado que una de lascaractersticasquesepresentaenmltiplesdistribucionesdefrecuenciases quelosdatosseacumulanalrededordeunvalorcentralsituadoentrelosdos extremosdelavariablequeseestudia(HaberyRunyon,1992). Enla investigacin, ese valor se conoce como una medida de tendencia central, ya que estgeneralmentelocalizadahaciaelmedioocentrodeunadistribucinenla que la mayora de los puntajes tienden a concentrarse. La tendencia central es un ndice de localizacin central empleado en la descripcin de las distribuciones de frecuencias. Lacapacidaddelocalizarunpuntodetendenciacentralpuedeser muy til para el investigador. Por ejemplo, podr reducir una masa de datos a un simplevalorcuantitativoquellegarasercomprendidoycomunicadoaotros especialistas. Puestoqueelcentrodeunadistribucinpuedeserdefinidodediferentes maneras, habr tambin diferentes medidas de tendencia central.Usualmente se conocen tres tcnicas: la moda, la mediana y la media aritmtica. Las medidas de tendencia central son de dos tipos: a)Medidasdeposicincentral.-informansobrelosvaloresmediosdelaserie de datos. b)Medidas de posicin no centrales.- informan de como se distribuye el resto de los valores de la serie. MEDIDAS DESCRIPTIVASMedidas de PosicinMedidas de Tendencia CentralCuarteles y PercentilesMedidas de DispersinVarianzaDesviacin EstndarDesv. Absoluta MediaCoef. de VariacinRango IntercuartlicoMedidas de Forma- Sesgos- CurtosisControl de Calidad Aplicado a la IngenieraPg. 12 Ing Edmundo Alarcn CceresEstadstica Descriptiva Las principales medidas de posicin central son las siguientes: MEDIA.- Vamos a estudiar en este apartado los distintos tipos de media que son: Media aritmtica.- Para calcular la media aritmtica se tienen dos modelos: Propiedades.- La media presenta el problema de que su valor (tanto en el caso de lamediaaritmticacomogeomtrica)sepuedevermuyinfluidoporvalores extremos,quese apartenenexcesodelrestodelaserie.Estosvalores anmalos podrancondicionarengranmedidaelvalordelamedia,perdiendosta representatividad. En todo caso, la media aritmtica es la medida de posicin central ms utilizada.Mtodo abreviado.- Se determina mediante los siguientes procesos: a.HallandoelorigendetrabajoOw,esteesigualalamarcadeclaseconmayor frecuencia Ow = Yi con > nj b.Calcular los desvos por medio de la formula:

c.Calcular el promedio por medio de la frmula de:

Mediageomtrica.-Segneltipodedatosqueseanalicesermsapropiado utilizarlamediaaritmticaolamediageomtrica.Lamediageomtricasesuele utilizarenseriesdedatoscomotiposdeintersanuales,inflacin,etc.,dondeel valor de cada ao tiene un efecto multiplicativo sobre el de los aos anteriores.LamediageomtricadeNobservacioneseslarazdendiceNdelproductode todas las observaciones. La representaremos por G. Solosepuedecalcularsinohayobservacionesnegativas.Esunamedida estadstica poco o nada usual. Media armnica.- La media armnica de N observaciones es la inversa de la media de las inversas de las observaciones y ladenotaremosporH;aligualqueenelcasodelamedia geomtrica su utilizacin es bastante poco frecuente. Para datos no agrupados:Para datos agrupados se define como la suma ponderada: NXXnii ==1Nn Yf Y Xnii iinii==-= - =11Control de Calidad Aplicado a la IngenieraPg. 13 Ing Edmundo Alarcn CceresEstadstica Descriptiva MEDIANA.-Lamedianaeselvalorcentraldelavariable,esdecir,supuestala muestraordenadaenordencrecienteodecreciente,elvalorquedivideendos parteslamuestra(es decirelvalortal queel50%delos datos estapor arribade dicho valor y el 50% que esta por de bajo). Para calcular la mediana debemos tener en cuenta si la variable es discreta o continua. Clculo de la mediana en el caso discreto: Tendremos en cuenta el tamao de la muestra.Si N es Impar, hay un trmino central, el trmino que ser el valor de la mediana. SiNesPar,haydostrminoscentrales,lamedianaserlamediadeesosdos valores, Veamos un ejemplo. N Par

N Impar 1,4,6,7,8,9,12,16,20, 24,25,27 N=121,4,6,7,8,9,12,16,20, 24,25,27,30 N=13 Trminos Centrales el 6 y 7 9 y 12Trmino Central el 7 , 12

Me = Me = 12 Clculodelamedianaenelcasocontnuo:Silavariableescontinua,latabla vendrenintervalos,porloquesecalculadelasiguienteforma:Nosvamosa apoyar en un grfico de un histograma de frecuencias acumuladas. De donde la mediana es: MODA. La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que ms se repite. Por su propia definicin, la moda no es nica, pues puede haber dosomasvaloresdelavariablequetenganlamismafrecuenciasiendoesta mxima.a).- Calculo de Mo en el caso discreto.- es la nica medida de centralizacin que no tiene sentido estudiar en una variable cualitativa, pues no precisa la realizacin declculomatemtico; porlotanto,lamodaseconsideralamayorconcentracin dedatos.Encuyocasotendremosunimodal,bimodalopolimodalsegnseael caso.

+ =jjj realnNNC L Me1. inf2Control de Calidad Aplicado a la IngenieraPg. 14 Ing Edmundo Alarcn CceresEstadstica Descriptiva b).- Calculo de No en el caso continuo.- Para este caso debemos detenernos un poco en el clculo de la moda para distribuciones cuantitativas continuas. Apoyndonos en el grfico podemos llegar a la determinacin de la expresin para la Moda que es:

+ + =+ ) ( ) (1 11. infj j j jj ji realn n n nn nC L Mo Otrosautoresdanuna expresin aproximadaparalamoda quevienedadaporla siguiente expresin:

++ =+ +1 11. infj jji realn nnC L Mo B). MEDIDAS DE DISPERSIN: Breve Introduccin Unadelasfuncionesdelaestadsticaserelacionaconelclculodela variabilidad,conocerlasmedidasdedispersin(variacin)esdesuma importancia,yaque lanoconsideracin dediferenciaspuedeconduciraerrores dejuicioenlatomadedecisiones(Snchez,1992). Unamedidaparticularde tendencia central da lugar a una puntuacin que, en cierto sentido, "representa" a todas las puntuaciones de un grupo (Glass & Stanley, 1974). Sin embargo, cuando seusacualquiermedidadetendenciacentral,stanosdaslouncuadro incompletodeunconjuntodedatosy,porconsiguiente,podraconducira conclusioneserrneasodistorsionadas,porqueesteprocesopasaporaltolas diferenciasentrelaspuntuacionesens. Seraincorrectoconcluirquedos conjuntos de datos son iguales slo porque tienen la mismas medidas de tendencia central,esdecir,queelvalordelamediaaritmticaseaelmismoparaambos 0246810121416182045 - 55 55 - 65 65 - 75 75 - 85 85 - 95FrecuenciaIntervalos de ClaseHISTOGRAMA0510152040 50 60 70 80 90 100FrecuenciaMarcas de ClasePOLIGONO DE FRECUENCIAS010203040506045 - 55 55 - 65 65 - 75 75 - 85 85 - 95FrecuenciaIntervalos de ClaseOJIVAControl de Calidad Aplicado a la IngenieraPg. 15 Ing Edmundo Alarcn CceresEstadstica Descriptiva conjuntos, cuando la distancia de los datos de ambos conjuntos se distribuyen de una forma diferente. Para describir una distribucin en forma ms completa o para interpretar con ms detalle una calificacin, necesitamos informacin adicional acerca de la dispersin delascalificacionesconrespectoanuestramedidadetendenciacentral. Es necesario un ndice de cmo estn diseminados los puntajes alrededor del centro de la distribucin. A tales distancias se les suele denominar medidas de dispersin ovariacin. Lasmedidasdedispersin,tambinconocidascomomedidasde variacin o variabilidad, indican el grado en que los sujetos se dispersan respecto al centro de la distribucin. A travs de las mismas, el investigador verifica cun homogneos,parecidosoestablessonloselementosbajoestudio,encontraste conotrosgruposdeinters. Sitodoslosvaloressonlosmismos,noexiste dispersin; si todos no son los mismos, hay dispersin en los datos. La magnitud de ladispersinpuedeserpequea,cuandolosvalores,aunquediferentes,estn prximosentres.Silosvaloresestnampliamenteseparados,ladispersines mayor. Este captulo trata slo de la medidas de dispersin o variabilidad ms conocidas: elrecorrido(rango)lavarianzayladesviacinestndar. Estastcnicasestarn enmarcadas segnla composicinde losdatos,esdecir,arreglo dedatos,datos no agrupados y datos agrupados. Adems, se evaluar la tcnica de coeficiente de variacinparavariablescuantitativasycualitativas,talescomo:coeficientede variacin e ndice de dispersin cuantitativo. Cuando nuestro inters se centra en las medidas de dispersin, debemos buscarun ndice de variabilidad que indique ladistanciaalolargodelaescala decalificaciones. Elrecorridoy ladesviacin estndar realizan dicha labor. RANGO: Es la primera medida que vamos a estudiar, se define como la diferencia existente entre el valor mayor y el menor de la distribucin; Lo notaremos como R Realmente noesunamedidamuysignificativaenlamayoradeloscasos,pero indudablemente es muy fcil de calcular. R =V max - V min Hemos estudiadovariasmedidasdecentralizacin,porlo que podemoshablarde desviacin con respecto a cualquiera de ellas, sin embargo, la mas utilizada es con respecto a la media. ConceptodeDesviacin:Esladiferenciaqueseobservaentreelvalordela variable y el origen de trabajo. La denotaremos por di. Noesunamedida,sonmuchasmedidas,puescadavalordelavariablelleva asociadasucorrespondientedesviacin,porloque precisaremosunamedidaque resuma dicha informacin.

VARIANZA: Control de Calidad Aplicado a la IngenieraPg. 16 Ing Edmundo Alarcn CceresEstadstica Descriptiva Mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatorio de las diferencias al cuadrado entre cada valor y la media, multiplicadas porelnmerodevecesqueseharepetidocadavalor.Elsumatorioobtenidose divide por el tamao de la muestra, y la denotaremos por: o tambin por. s = varianza del universo,= varianza de la poblacin. Para datos no agrupadosPara datos agrupados

Aunque tambin es posible calcularlo por medio de la formula de la recurrencia: Para datos no agrupadosPara datos agrupados

Mtodo abreviado:

DESVIACIN TPICA O ESTANDAR: Ladesviacinestndar(DE)eslamedidadedispersinmsadecuadaparala estadstica descriptiva. Tanto en la escalas de intervalo como en las de razones, la varianzayladesviacinestndarsonlasmejoresmedidasdedispersin. Toman en consideracin todos los puntajes y controlan por el efecto de valores extremos. LaDEpermiteunainterpretacinprecisadelascalificacionesdentrodeuna distribucin,sitodoslossujetossonigualesenunacaracterstica(porejemplo, ndiceacadmico),entonceselresultadoserigualacero;porelcontrario,si aumentanlasdiferencias,aumentarelndice,alejndosemsymsdelpunto cero.Es la raz cuadrada de la varianza, se denota por Sx o x.

Esteestadsticosemideenlamismaunidadquelavariableporloquesepuede interpretar mejor. Otros dos estadsticos importantes son la cuasivarianza y la cuasidesviacin tpica, quesonlosestimadoresdelavarianzaydesviacintpicapoblacionales respectivamente. COEFICIENTE DE VARIACIN: Control de Calidad Aplicado a la IngenieraPg. 17 Ing Edmundo Alarcn CceresEstadstica Descriptiva Esunestadsticodedispersinquetienelaventajadequenollevaasociada ningunaunidad,porloquenospermitirdecirentredosmuestras,cualeslaque presenta mayor dispersin. La denotaremos por C.V. ndice de Dispersin Cualitativa Normalmenteenelcampodelascienciassocialesylaingenieraseutilizano manejanmuchasvariablescualitativas. Sepuedeobservarpreviamenteque dichasvariablespuedenvariardeclaseocantidad. Lapremisaseracun diferentessonesasobservaciones. Utilizandoelcoeficientedevariacin cualitativa o un ndice de dispersin podemos encontrar dichas diferencias en las observaciones. El ndice de dispersin flucta entre cero (0) y uno (1), donde cero (0)implicahomogeneidadperfectayuno(1)representaheterogeneidad perfecta. Siloscasososujetosestndistribuidosentrelascategoras deuna forma equitativa, es decir, que para cada categora de la variable existe la misma cantidaddecasos,podemosindicarqueexisteunadistribucinheterognea (equitativa)enlascategorasdelavariabledeinters. Porelcontrario,sitodos loscasosestnubicados enunasolacategorapodemosindicarque existeuna distribucinhomognea(desproporcional). Elndicededispersincualitativose expresa de la siguiente manera:

donde:D = ndice de dispersin cualitativo K = nmero de categorasn = total de casosE]MEDIDAS DE LOCALIZACIN:tiles para encontrar determinados valores importantes, para una "clasificacin" de los elementos de la muestra o poblacin.Cuartiles, deciles y percentiles. Lasmedidasdelocalizacindividenladistribucinenpartesiguales,sirvenpara clasificaraunindividuooelementodentrodeunadeterminadapoblacino muestra.Asenpsicologalosresultadosdelostestopruebasquerealizanaun determinadoindividuo,sirveparaclasificaradichosujetoenunadeterminada categoria en funcin de la 53-1-u-puntuaciMn obtenida. -Cuartiles.-Deciles.-Percentiles.-Ejemplos de clculo.-Algunas medidas de dispersin asociadasControl de Calidad Aplicado a la IngenieraPg. 18 Ing Edmundo Alarcn CceresEstadstica Descriptiva Cuartiles:Medidadelocalizacinquedividelapoblacinomuestraencuatro partes iguales. -Q1= Valor de la variable que deja a la izquierda el 25% de la distribucin.-Q2= Valor de la variable que deja a la izquierda el 50% de la distribucin = Me-Q3= Valor de la variable que deja a la izquierda el 75% de la distribucin.Aligualqueocurreconelclculodelamediana,elclculodeestosestadsticos, depende del tipo de variable. Caso I: Variable cuantitativa discreta:Enestecasotendremosqueobservareltamaodelamuestra:Nyparacalcular Q1oQ3procederemoscomosituvisemosquecalcularlamedianadela correspondiente mitad de la muestra.Caso II: Variable cuantitativa contnua: En este caso el clculo es ms simple:, sea la distribucin que sigue:

Siendo el intervalo coloreado donde se encuentra el Cuartil correspondiente: yDeciles:Medidadelocalizacinquedividelapoblacinomuestraen10partes iguales.Notienemuchosentidocalcularlasparavariablescualitativasdiscretas. Porloquelovamosaversloparalasvariablescontinuas.dk= Decilk-simoes aquel valor de la variable que deja a su izquierda el k10 % de la distribucin. Intervalo donde se encuentra el Decil correspondiente: k = 1 .. 9 Percentiles:Medidadelocalizacinquedividelapoblacinomuestraen100 partesiguales.Notienemuchosentidocalcularlasparavariablescualitativas discretas. Por lo que lo vamos a ver slo para las variables continuas. pk = Percentil k-simo es aquel valor de la variable que deja a su izquierda el k % de la distribucin.

Intervalo donde se encuentra el percentil corespondiente: [Li-2 - Li-1)ni-1Ni-1 [Li-1 - Li)niNi [Li-2 - Li-1)ni-1Ni-1 [Li-1 - Li)niNi [Li-2 - Li-1)ni-1Ni-1 [Li-1 - Li)niNi Control de Calidad Aplicado a la IngenieraPg. 19 Ing Edmundo Alarcn CceresEstadstica Descriptiva k=1 .. 99 Algunas medidas de Dispersin asociadasUnavezestudiadaslasmedidasdelocalizacinsurgendosnuevasmedidasde dispersin, que son: -Recorrido intercuartlico:-Semirecorrido intercuartlico: -Recorrido interdeclico: -Recorrido intercentilico: MEDIDAS DE LA SIMETRA:Sirvenparaversiladistribucintieneelmismocomportamiento porencimaypor debajo de los valores centrales. La medias de asimetra, al igual que la curtosis, van asermedidasdelaformadeladistribucin,esfrecuentequelosvaloresdeuna distribucin tiendan a ser similares a ambos lados de las medidas de centralizacin. La simetra es importante para saber si los valores de la variable se concentran en una determinada zona del recorrido de la variable. Comparan la forma que tiene la representacin grfica, bien sea el histograma o el diagrama de barras de la distribucin, con la distribucin normal, dentro de ellos se tiene los Sesgos y la Curtosis. SESGOS. a)Unadistribucinessimtricacuandosumediana,sumodaysumedia aritmtica coinciden. b)Unadistribucinesasimtricaaladerechasilasfrecuencias(absolutaso relativas) descienden ms lentamente por la derecha que por la izquierda.c)Unadistribucinesasimtricaalaizquierda,silasfrecuenciasdescienden ms lentamente por la izquierda que por la derecha. As0 Asimetra Negativa a la Izquierda Simtrica Asimetra Positiva a la Derecha. Control de Calidad Aplicado a la IngenieraPg. 20 Ing Edmundo Alarcn CceresEstadstica Descriptiva Para medir la asimetra se puede realizar atendiendo bsicamente a dos criterios: a)Comparando la Media y la Moda. Si la diferencia es positiva, diremos que hay asimetra positiva o a la derecha, en el caso de que sea negativa diremos que hay asimetra negativa o a la izquierda. Noobstante,estamedidaes pocooperativa alserunamedidarelativa,ya que estainfluidaporlaunidadenquesemidalavariable,porloquesedefineel coeficiente de Asimetra como: Estamedidaesmuyfcildecalcular, peromenosprecisaqueelcoeficiente de asimetra de Pearson. b)Comparando los valores de la variable con la media. El coeficiente de asimetra de Pearson, se basa en la comparacin con la media de todoslosvaloresdelavariable,asqueesunamedidaquesebasarenlas diferencias,comovimosen elcasodeladispersinsimedimoslamediadeesas desviaciones sera nulas, si las elevamos al cuadrado, seran siempre positivas por lo que tampoco serviran, por lo tanto precisamos elevar esas diferencias al cubo.Para evitar el problema de la unidad, y hacer que sea una medida escalar y por lo tantorelativa,dividimosporelcubodesudesviacintpica.Conloqueresultala siguiente expresin: Algunas consideraciones: ElEstadsticoYulehadefinidoalgunaspropiedadesdeseablesparaunamedida estadstica: 1.Debedefinirsedemaneraobjetiva:dosobservadoresdistintosdebenllegaral mismo resultado numrico.3n1 iix2) 1)(n (nn=

=oxCAControl de Calidad Aplicado a la IngenieraPg. 21 Ing Edmundo Alarcn CceresEstadstica Descriptiva 2.Usar todas las observaciones y no algunas de ellas solamente, de manera que si varia alguna observacin la medida considerada debe reflejar esta variacin.3.Tener un significado concreto: la interpretacin debe ser inmediata y sencilla.4.Ser sencilla de calcular.5.Prestarse fcilmente al clculo algebraico: Lo que permitir demostraciones mas elegantes.6.Serpocosensiblealasfluctuacionesmuestrales.Estacondicines imprescindible en la Estadstica Matemtica y en la Teora de Sondeos.MEDIDA DE APUNTAMIENTO. CURTOSIS: Lacurtosisesunamedidadelapuntamiento,quenosindicarsiladistribucin es muyapuntadaopocoapuntada,tambinnosindicasimidenlamayoromenor cantidad de datos que se agrupan en torno a la moda.Comopodemosobservar,elcoeficientedecurtosisnosmideelgradode apuntamientodeladistribucin.EstecoeficientelovamosadenotarporKyse calcula segn la siguiente expresin: Se definen 3 tipos de distribuciones segn su grado de curtosis:1)Distribucinmesocrtica:presentaungradodeconcentracinmedio alrededordelosvalorescentralesdelavariable(elmismoquepresentauna distribucin normal).2)Distribucinleptocrtica:presentaunelevadogradodeconcentracin alrededor de los valores centrales de la variable.3)Distribucinplaticrtica:presentaunreducidogradodeconcentracin alrededor de los valores centrales de la variable. Curtosis PositivaCurtosis nulaCurtosis Negativa Leptocrtica Mesocrtica Platicrtica 3) 2)(n (n1) 3(n x3) (n ) 2 1)(n n (1) n(n24n1 ii

+==oxKControl de Calidad Aplicado a la IngenieraPg. 22 Ing Edmundo Alarcn CceresEstadstica Descriptiva ------ ------